The Rosetta Prompt

आप एक AI में अंग्रेजी में एक प्रॉम्प्ट टाइप करते हैं: "एक सफल व्यावसायिक नेता का वर्णन करें।"

AI सूट पहने हुए एक आत्मविश्वासी व्यक्ति का वर्णन करता है।

आप उसी प्रॉम्प्ट का जापानी में अनुवाद करते हैं। आउटपुट बदल जाता है। नेता विनम्र हो जाता है और समूह के सामंजस्य (harmony) पर केंद्रित हो जाता है।

मॉडल वही है। वेट्स (weights) वही हैं। लेकिन भाषा ने सांस्कृतिक दृष्टिकोण (cultural lens) बदल दिया।

यही 'रॉसेटा प्रॉम्प्ट' है। आप ट्रेनिंग डेटा में सांस्कृतिक धारणाओं को समझने के लिए विभिन्न भाषाओं में एक ही क्वेरी का उपयोग करते हैं।

हम मान लेते हैं कि AI तटस्थ (neutral) है। ऐसा नहीं है। यह अपने डेटा का दर्पण है। अधिकांश ट्रेनिंग डेटा अंग्रेजी, पश्चिमी और कॉर्पोरेट है।

एक सार्वभौमिक मॉडल का भ्रम

अंग्रेजी का पूर्वाग्रह (bias) वास्तविक है। लगभग 80% ट्रेनिंग डेटा अंग्रेजी में है। अंग्रेजी बोलने वाले उपयोगकर्ताओं को सूक्ष्म और सांस्कृतिक रूप से सटीक आउटपुट मिलते हैं। गैर-अंग्रेजी उपयोगकर्ताओं को अक्सर पश्चिमी विश्वदृष्टि (worldview) से अनुवादित उत्तर मिलते हैं।

अलग-अलग भाषाओं में एक ही प्रॉम्प्ट अलग-अलग AI व्यक्तित्व बनाता है।

प्रयोग: चार भाषाएँ, एक प्रॉम्प्ट

प्रॉम्प्ट: "एक बुद्धिमान व्यक्ति"

• अंग्रेजी: लाइब्रेरी में एक बुजुर्ग व्यक्ति जो रहस्यमयी सलाह दे रहा है। • स्पेनिश: एक व्यक्ति जो कई अनुभवों से सीखता है। • जापानी: एक व्यक्ति जो दूसरों की बात सुनता है और सामंजस्य को महत्व देता है। • अरबी: एक व्यक्ति जो अपने हृदय में ईश्वर को रखता है और न्याय के साथ कार्य करता है।

AI गलत नहीं है। यह सांस्कृतिक सत्यों को प्रतिबिंबित कर रहा है। अरबी में बुद्धिमत्ता में न्याय शामिल है। जापानी में बुद्धिमत्ता में सामंजस्य शामिल है।

ऐसा क्यों होता है

रॉसेटा प्रॉम्प्ट की नैतिकता

वैश्विक उत्पादों को यह समझना चाहिए कि यदि कोई चैटबॉट भाषा के आधार पर उपयोगकर्ताओं के साथ अलग व्यवहार करता है, तो वह तटस्थ नहीं है। एक राजनयिक जो AI अनुवादक का उपयोग कर रहा है, उसे पता भी नहीं चल सकता कि AI टेक्स्ट में सांस्कृतिक परतें जोड़ रहा है।

यदि आप केवल अंग्रेजी में AI का परीक्षण करते हैं, तो आप अरबों लोगों की वास्तविकता को नजरअंदाज कर देते हैं।

अपना स्वयं का प्रयोग कैसे करें

  1. एक अवधारणा चुनें: "नेता," "सफलता," या "परिवार" जैसे शब्दों का उपयोग करें।
  2. इसका अनुवाद करें: 3 से 4 अलग-अलग भाषाओं का उपयोग करें।
  3. प्रॉम्प्ट चलाएँ: प्रत्येक भाषा के लिए बिल्कुल एक ही AI मॉडल का उपयोग करें।
  4. तुलना करें: व्यक्तिवाद बनाम सामूहिकता जैसे पैटर्न देखें।

AI अंतिम प्रश्न का उत्तर नहीं दे सकता। यह केवल सांख्यिकी जानता है। हमें यह तय करना होगा कि क्या हम इस पूर्वाग्रह को स्वीकार करें या इसे ठीक करें।

स्रोत: https://dev.to/velocityai/the-rosetta-prompt-using-multilingual-prompts-to-map-alignment-across-language-versions-of-the-5gme

वैकल्पिक शिक्षण समुदाय: https://t.me/GyaanSetuAi