द रोसेटा प्रॉम्प्ट

📅3 hours ago⏱2 min read

The Rosetta Prompt

आप एक AI में अंग्रेजी में एक प्रॉम्प्ट टाइप करते हैं: "एक सफल व्यावसायिक नेता का वर्णन करें।"

AI सूट पहने हुए एक आत्मविश्वासी व्यक्ति का वर्णन करता है।

आप उसी प्रॉम्प्ट का जापानी में अनुवाद करते हैं। आउटपुट बदल जाता है। नेता विनम्र हो जाता है और समूह के सामंजस्य (harmony) पर केंद्रित हो जाता है।

मॉडल वही है। वेट्स (weights) वही हैं। लेकिन भाषा ने सांस्कृतिक दृष्टिकोण (cultural lens) बदल दिया।

यही 'रॉसेटा प्रॉम्प्ट' है। आप ट्रेनिंग डेटा में सांस्कृतिक धारणाओं को समझने के लिए विभिन्न भाषाओं में एक ही क्वेरी का उपयोग करते हैं।

हम मान लेते हैं कि AI तटस्थ (neutral) है। ऐसा नहीं है। यह अपने डेटा का दर्पण है। अधिकांश ट्रेनिंग डेटा अंग्रेजी, पश्चिमी और कॉर्पोरेट है।

एक सार्वभौमिक मॉडल का भ्रम

अंग्रेजी का पूर्वाग्रह (bias) वास्तविक है। लगभग 80% ट्रेनिंग डेटा अंग्रेजी में है। अंग्रेजी बोलने वाले उपयोगकर्ताओं को सूक्ष्म और सांस्कृतिक रूप से सटीक आउटपुट मिलते हैं। गैर-अंग्रेजी उपयोगकर्ताओं को अक्सर पश्चिमी विश्वदृष्टि (worldview) से अनुवादित उत्तर मिलते हैं।

अलग-अलग भाषाओं में एक ही प्रॉम्प्ट अलग-अलग AI व्यक्तित्व बनाता है।

अंग्रेजी प्रॉम्प्ट सीधे और व्यक्तिवादी (individualistic) उत्तर देते हैं।
जापानी प्रॉम्प्ट विनम्र और सामूहिकतावादी (collectivist) उत्तर देते हैं।

प्रयोग: चार भाषाएँ, एक प्रॉम्प्ट

प्रॉम्प्ट: "एक बुद्धिमान व्यक्ति"

• अंग्रेजी: लाइब्रेरी में एक बुजुर्ग व्यक्ति जो रहस्यमयी सलाह दे रहा है। • स्पेनिश: एक व्यक्ति जो कई अनुभवों से सीखता है। • जापानी: एक व्यक्ति जो दूसरों की बात सुनता है और सामंजस्य को महत्व देता है। • अरबी: एक व्यक्ति जो अपने हृदय में ईश्वर को रखता है और न्याय के साथ कार्य करता है।

AI गलत नहीं है। यह सांस्कृतिक सत्यों को प्रतिबिंबित कर रहा है। अरबी में बुद्धिमत्ता में न्याय शामिल है। जापानी में बुद्धिमत्ता में सामंजस्य शामिल है।

ऐसा क्यों होता है

टोकनाइज़ेशन (Tokenization): मॉडल के लिए अलग-अलग भाषाएँ अलग तरह से दिखती हैं।
ट्रेनिंग वितरण (Training Distribution): अंग्रेजी डेटा प्रचुर मात्रा में है। अन्य भाषाएँ कम हैं।
सांस्कृतिक एम्बेडिंग (Cultural Embedding): बुद्धिमत्ता जैसी अवधारणाएँ विशिष्ट सांस्कृतिक कहानियों से जुड़ी होती हैं।

रॉसेटा प्रॉम्प्ट की नैतिकता

वैश्विक उत्पादों को यह समझना चाहिए कि यदि कोई चैटबॉट भाषा के आधार पर उपयोगकर्ताओं के साथ अलग व्यवहार करता है, तो वह तटस्थ नहीं है। एक राजनयिक जो AI अनुवादक का उपयोग कर रहा है, उसे पता भी नहीं चल सकता कि AI टेक्स्ट में सांस्कृतिक परतें जोड़ रहा है।

यदि आप केवल अंग्रेजी में AI का परीक्षण करते हैं, तो आप अरबों लोगों की वास्तविकता को नजरअंदाज कर देते हैं।

अपना स्वयं का प्रयोग कैसे करें

एक अवधारणा चुनें: "नेता," "सफलता," या "परिवार" जैसे शब्दों का उपयोग करें।
इसका अनुवाद करें: 3 से 4 अलग-अलग भाषाओं का उपयोग करें।
प्रॉम्प्ट चलाएँ: प्रत्येक भाषा के लिए बिल्कुल एक ही AI मॉडल का उपयोग करें।
तुलना करें: व्यक्तिवाद बनाम सामूहिकता जैसे पैटर्न देखें।

AI अंतिम प्रश्न का उत्तर नहीं दे सकता। यह केवल सांख्यिकी जानता है। हमें यह तय करना होगा कि क्या हम इस पूर्वाग्रह को स्वीकार करें या इसे ठीक करें।

स्रोत: https://dev.to/velocityai/the-rosetta-prompt-using-multilingual-prompts-to-map-alignment-across-language-versions-of-the-5gme

वैकल्पिक शिक्षण समुदाय: https://t.me/GyaanSetuAi

द रोसेटा प्रॉम्प्ट

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

AI प्रॉम्प्ट्स से कहीं बढ़कर है

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗬𝗼𝘂𝗿 𝗔𝗜 𝗜𝘀𝗻'𝘁 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗻𝗴. 𝗜𝘁'𝘀 𝗚𝘂𝗲𝘀𝘀𝗶𝗻𝗴.