रोसेटा प्रॉम्प्ट (The Rosetta Prompt)
तुम्ही AI मध्ये इंग्रजीमध्ये एक प्रॉम्प्ट टाईप करता: "एका यशस्वी व्यावसायिक नेत्याचे वर्णन करा."
AI सूट घातलेल्या एका आत्मविश्वासी माणसाचे वर्णन करते.
तुम्ही तोच प्रॉम्प्ट जपानी भाषेत अनुवादित करता. आउटपुट बदलते. तो नेता विनम्र आणि समूह सुसंवादावर (group harmony) लक्ष केंद्रित करणारा बनतो.
मॉडेल तेच आहे. वेट्स (weights) तेच आहेत. पण भाषेमुळे सांस्कृतिक दृष्टिकोन (cultural lens) बदलला.
हे आहे 'रोसेटा प्रॉम्प्ट' (Rosetta Prompt). ट्रेनिंग डेटा मधील सांस्कृतिक गृहितके (cultural assumptions) शोधण्यासाठी तुम्ही विविध भाषांमध्ये एकच क्वेरी वापरता.
आपल्याला वाटते की AI तटस्थ आहे. पण ते तसे नाही. ते त्याच्या डेटाचा आरसा आहे. बहुतेक ट्रेनिंग डेटा इंग्रजी, पाश्चात्य आणि कॉर्पोरेट स्वरूपाचा आहे.
वैश्विक मॉडेलचा भ्रम (The Illusion of a Universal Model)
इंग्रजी भाषेचा पूर्वग्रह (English bias) वास्तव आहे. सुमारे ८०% ट्रेनिंग डेटा इंग्रजीमध्ये आहे. इंग्रजी वापरकर्त्यांना सूक्ष्म आणि सांस्कृतिकदृष्ट्या सुसंगत आउटपुट मिळते. बिगर-इंग्रजी वापरकर्त्यांना अनेकदा पाश्चात्य दृष्टिकोनातून अनुवादित केलेली उत्तरे मिळतात.
वेगवेगळ्या भाषांमधील तोच प्रॉम्प्ट वेगवेगळ्या AI व्यक्तिमत्त्वांना जन्म देतो.
- इंग्रजी प्रॉम्प्ट्स थेट आणि व्यक्तिवादी उत्तरे देतात.
- जपानी प्रॉम्प्ट्स विनम्र आणि समूहवादी (collectivist) उत्तरे देतात.
प्रयोग: चार भाषा, एक प्रॉम्प्ट
प्रॉम्प्ट: "एक बुद्धिमान व्यक्ती"
• इंग्रजी: लायब्ररीमध्ये बसलेला एक वृद्ध माणूस जो गूढ सल्ला देत आहे. • स्पॅनिश: अनेक अनुभवातून शिकणारी व्यक्ती. • जपानी: इतरांचे ऐकून घेणारी आणि सुसंवादाला महत्त्व देणारी व्यक्ती. • अरबी: ज्याच्या हृदयात ईश्वर आहे आणि जो न्यायाने वागतो अशी व्यक्ती.
AI चुकीचे नाही. ते सांस्कृतिक सत्य प्रतिबिंबित करत आहे. अरबी भाषेत शहाणपण म्हणजे न्याय. जपानी भाषेत शहाणपण म्हणजे सुसंवाद.
हे का घडते?
- टोकनायझेशन (Tokenization): मॉडेलसाठी वेगवेगळ्या भाषा वेगवेगळ्या प्रकारे दिसतात.
- ट्रेनिंग डिस्ट्रिब्युशन (Training Distribution): इंग्रजी डेटा मुबलक आहे. इतर भाषांचा डेटा कमी आहे.
- कल्चरल एम्बेडिंग (Cultural Embedding): शहाणपणासारख्या संकल्पना विशिष्ट सांस्कृतिक कथांशी जोडलेल्या असतात.
रोसेटा प्रॉम्प्टची नैतिकता (The Ethics of the Rosetta Prompt)
जागतिक उत्पादनांनी हे समजून घेतले पाहिजे की, जर चॅटबॉट भाषेच्या आधारावर वापरकर्त्यांशी वेगळा व्यवहार करत असेल, तर तो तटस्थ नाही. AI ट्रान्सलेटर वापरणारा एखादा मुत्सद्दी (diplomat) कदाचित हे जाणणार नाही की AI मजकुरात सांस्कृतिक स्तर (cultural layers) जोडत आहे.
जर तुम्ही फक्त इंग्रजीमध्ये AI ची चाचणी घेतली, तर तुम्ही अब्जावधी लोकांची वास्तविकता दुर्लक्षित करता.
तुमचा स्वतःचा प्रयोग कसा करावा
- एक संकल्पना निवडा: "नेता" (leader), "यश" (success) किंवा "कुटुंब" (family) यांसारखे शब्द वापरा.
- अनुवाद करा: ३ ते ४ वेगवेगळ्या भाषा वापरा.
- प्रॉम्प्ट्स चालवा: प्रत्येक भाषेसाठी अगदी तेच AI मॉडेल वापरा.
- तुलना करा: व्यक्तिवाद विरुद्ध समूहवाद यांसारखे पॅटर्न शोधा.
AI अंतिम प्रश्नाचे उत्तर देऊ शकत नाही. त्याला फक्त सांख्यिकी माहिती आहे. आपल्याला हा पूर्वग्रह स्वीकारायचा की तो दुरुस्त करायचा, याचा निर्णय आपल्याला घ्यावा लागेल.
ऐच्छिक शिक्षण समुदाय: https://t.me/GyaanSetuAi