द रॉसेटा प्रॉम्प्ट

📅3 hours ago⏱2 min read

रोसेटा प्रॉम्प्ट (The Rosetta Prompt)

तुम्ही AI मध्ये इंग्रजीमध्ये एक प्रॉम्प्ट टाईप करता: "एका यशस्वी व्यावसायिक नेत्याचे वर्णन करा."

AI सूट घातलेल्या एका आत्मविश्वासी माणसाचे वर्णन करते.

तुम्ही तोच प्रॉम्प्ट जपानी भाषेत अनुवादित करता. आउटपुट बदलते. तो नेता विनम्र आणि समूह सुसंवादावर (group harmony) लक्ष केंद्रित करणारा बनतो.

मॉडेल तेच आहे. वेट्स (weights) तेच आहेत. पण भाषेमुळे सांस्कृतिक दृष्टिकोन (cultural lens) बदलला.

हे आहे 'रोसेटा प्रॉम्प्ट' (Rosetta Prompt). ट्रेनिंग डेटा मधील सांस्कृतिक गृहितके (cultural assumptions) शोधण्यासाठी तुम्ही विविध भाषांमध्ये एकच क्वेरी वापरता.

आपल्याला वाटते की AI तटस्थ आहे. पण ते तसे नाही. ते त्याच्या डेटाचा आरसा आहे. बहुतेक ट्रेनिंग डेटा इंग्रजी, पाश्चात्य आणि कॉर्पोरेट स्वरूपाचा आहे.

वैश्विक मॉडेलचा भ्रम (The Illusion of a Universal Model)

इंग्रजी भाषेचा पूर्वग्रह (English bias) वास्तव आहे. सुमारे ८०% ट्रेनिंग डेटा इंग्रजीमध्ये आहे. इंग्रजी वापरकर्त्यांना सूक्ष्म आणि सांस्कृतिकदृष्ट्या सुसंगत आउटपुट मिळते. बिगर-इंग्रजी वापरकर्त्यांना अनेकदा पाश्चात्य दृष्टिकोनातून अनुवादित केलेली उत्तरे मिळतात.

वेगवेगळ्या भाषांमधील तोच प्रॉम्प्ट वेगवेगळ्या AI व्यक्तिमत्त्वांना जन्म देतो.

इंग्रजी प्रॉम्प्ट्स थेट आणि व्यक्तिवादी उत्तरे देतात.
जपानी प्रॉम्प्ट्स विनम्र आणि समूहवादी (collectivist) उत्तरे देतात.

प्रयोग: चार भाषा, एक प्रॉम्प्ट

प्रॉम्प्ट: "एक बुद्धिमान व्यक्ती"

• इंग्रजी: लायब्ररीमध्ये बसलेला एक वृद्ध माणूस जो गूढ सल्ला देत आहे. • स्पॅनिश: अनेक अनुभवातून शिकणारी व्यक्ती. • जपानी: इतरांचे ऐकून घेणारी आणि सुसंवादाला महत्त्व देणारी व्यक्ती. • अरबी: ज्याच्या हृदयात ईश्वर आहे आणि जो न्यायाने वागतो अशी व्यक्ती.

AI चुकीचे नाही. ते सांस्कृतिक सत्य प्रतिबिंबित करत आहे. अरबी भाषेत शहाणपण म्हणजे न्याय. जपानी भाषेत शहाणपण म्हणजे सुसंवाद.

हे का घडते?

टोकनायझेशन (Tokenization): मॉडेलसाठी वेगवेगळ्या भाषा वेगवेगळ्या प्रकारे दिसतात.
ट्रेनिंग डिस्ट्रिब्युशन (Training Distribution): इंग्रजी डेटा मुबलक आहे. इतर भाषांचा डेटा कमी आहे.
कल्चरल एम्बेडिंग (Cultural Embedding): शहाणपणासारख्या संकल्पना विशिष्ट सांस्कृतिक कथांशी जोडलेल्या असतात.

रोसेटा प्रॉम्प्टची नैतिकता (The Ethics of the Rosetta Prompt)

जागतिक उत्पादनांनी हे समजून घेतले पाहिजे की, जर चॅटबॉट भाषेच्या आधारावर वापरकर्त्यांशी वेगळा व्यवहार करत असेल, तर तो तटस्थ नाही. AI ट्रान्सलेटर वापरणारा एखादा मुत्सद्दी (diplomat) कदाचित हे जाणणार नाही की AI मजकुरात सांस्कृतिक स्तर (cultural layers) जोडत आहे.

जर तुम्ही फक्त इंग्रजीमध्ये AI ची चाचणी घेतली, तर तुम्ही अब्जावधी लोकांची वास्तविकता दुर्लक्षित करता.

तुमचा स्वतःचा प्रयोग कसा करावा

एक संकल्पना निवडा: "नेता" (leader), "यश" (success) किंवा "कुटुंब" (family) यांसारखे शब्द वापरा.
अनुवाद करा: ३ ते ४ वेगवेगळ्या भाषा वापरा.
प्रॉम्प्ट्स चालवा: प्रत्येक भाषेसाठी अगदी तेच AI मॉडेल वापरा.
तुलना करा: व्यक्तिवाद विरुद्ध समूहवाद यांसारखे पॅटर्न शोधा.

AI अंतिम प्रश्नाचे उत्तर देऊ शकत नाही. त्याला फक्त सांख्यिकी माहिती आहे. आपल्याला हा पूर्वग्रह स्वीकारायचा की तो दुरुस्त करायचा, याचा निर्णय आपल्याला घ्यावा लागेल.

स्रोत: https://dev.to/velocityai/the-rosetta-prompt-using-multilingual-prompts-to-map-alignment-across-language-versions-of-the-5gme

ऐच्छिक शिक्षण समुदाय: https://t.me/GyaanSetuAi

द रॉसेटा प्रॉम्प्ट

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

एआय (AI) म्हणजे केवळ प्रॉम्प्ट्स नव्हे

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗜𝘀𝗻'𝘁 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗻𝗴. 𝗜𝘁'𝘀 𝗚𝘂𝗲𝘀𝘀𝗶𝗻𝗴.