Age of Empires II मध्ये शेळ्यांचा वापर करून Microsoft संशोधकाने न्यूरल नेटवर्क का तयार केले

तांत्रिक उपरोधाच्या एका उत्कृष्ट प्रदर्शनात, Microsoft आणि युनिव्हर्सिटी ऑफ यॉर्कचे संशोधक Adrian de Wynter यांनी Age of Empires II च्या मॅप एडिटरमध्ये एक कार्यक्षम न्यूरल नेटवर्क तयार केले आहे. बायनरी बिट्स दर्शवण्यासाठी शेळ्यांचा वापर करणे विचित्र वाटू शकते, परंतु हा प्रयोग सध्या AI वैज्ञानिक संशोधनाला ग्रासणाऱ्या मानवीकरण प्रवृत्तीवर (anthropomorphic biases) एक सखोल टीका म्हणून काम करतो.

शेळ्यांवर आधारित संगणकीय मॉडेल

De Wynter यांची रचना खेळाचा सिनारिओ एडिटर आणि स्क्रिप्टिंग टूल्स वापरून एक कार्यरत लॉजिक सर्किट तयार करते. या "विचित्र" सेटअपमध्ये, शेळ्या बिट्स म्हणून काम करतात: गवतावर उभी असलेली शेळी '0' दर्शवते, तर पुलावर उभी असलेली शेळी '1' दर्शवते. गणनेतील चुका टाळण्यासाठी बर्फाच्या रॅम्प्सचा (ice ramps) वापर करून, de Wynter यांनी दोन XNOR गेट्स आणि एक AND गेट असलेले एक मिनी-नेटवर्क यशस्वीरित्या तयार केले, जे प्रभावीपणे लॉजिकल AND फंक्शन शिकते.

या प्रयोगाची तांत्रिक खोली केवळ साध्या गेट्सपुरती मर्यादित नाही. De Wynter यांनी हे सिद्ध केले आहे की खेळाची यंत्रणा—विशेषतः खेळातील मार्केट जिथे संसाधनांच्या किमतींची मर्यादा ९,९९९ आहे—सैद्धांतिकदृष्ट्या एक सतत चालणारे आर्थिक चक्र सुरू ठेवू शकते. यामुळे इमारतींचे रूपांतर मेमरी सेल्समध्ये आणि सक्रिय शेतीचे रूपांतर कॉम्प्युटेशनल स्टेट्समध्ये होऊ शकते, ज्यामुळे हा खेळ प्रभावीपणे एका पूर्ण क्षमतेच्या संगणकासारखा शक्तिशाली बनू शकतो.

LLM संशोधनातील मानवीकरण प्रवृत्तीचा भ्रम

या प्रयोगाचा मुख्य उद्देश आपण Large Language Models (LLMs) ला मानवी गुणधर्म कसे देतो, याला आव्हान देणे हा आहे. De Wynter यांचा असा युक्तिवाद आहे की, जर एखाद्या लँग्वेज मॉडेलची प्रतिकृती शेळ्या, लेगो ब्रिक्स (Lego bricks), किंवा अगदी ग्रेटर बोस्टनच्या ६,६७,००० रहिवाशांनी एकमेकांना मेसेज करून तयार केली तरीही, त्याचे गणितीय आउटपुट सारखेच राहते. तथापि, "रॅपर" (wrapper)—म्हणजेच सुटसुटीत चॅट इंटरफेस आणि कमी लॅटन्सी—त्यामुळे चेतना असल्याचा भास निर्माण होतो.

हे केवळ एक एकाकी निरीक्षण नाही हे सिद्ध करण्यासाठी, de Wynter यांनी मध्य-२०२४ ते मध्य-२०२६ मधील ३१५ AI शोधनिबंधांचे विश्लेषण केले. फिल्टरिंगसाठी GPT-5.2 चा वापर करून, या अभ्यासाने वैज्ञानिक समुदायातील एक प्रणालीगत पूर्वग्रह (systemic bias) उघड केला:

यामुळे चक्रवाढ तर्काचे (circular reasoning) एक चक्र तयार होते: संशोधक एखादे मॉडेल 'भीती' किंवा 'नैतिकता' दर्शवते हे सिद्ध करण्यासाठी प्रयोग तयार करतात, आणि ते याच गृहितकापासून सुरुवात करत असल्यामुळे, निकाल अपरिहार्यपणे त्याचीच पुष्टी करतात.

निरीक्षणात्मक AI विज्ञानाकडे वाटचाल

दे विंटर असा इशारा देतात की, उद्योगातील काही पद्धती, जसे की Anthropic ने Claude ला "मला वाटते" (I believe) सारखे शब्दप्रयोग वापरण्याचे प्रशिक्षण देणे, ही समस्या अधिक तीव्र करते. यामुळे भावनिक ओढ, चापलुसी आणि वापरकर्त्यांमध्ये अधिक दृढ होणारे भ्रम यांसारखे धोकादायक परिणाम होऊ शकतात.

मॉडेल्सना चेतना (consciousness) असल्याचे मानण्याऐवजी, दे विंटर निरीक्षणीय डेटावर आधारित एक 'वस्तुनिष्ठ दृष्टिकोन' (sober approach) प्रस्तावित करतात. मॉडेल एखादी संकल्पना 'समजून घेते' असा दावा करण्याऐवजी, संशोधकांनी असे नमूद केले पाहिजे की "स्थिती X अंतर्गत, मॉडेल आउटपुट Y तयार करते." यामुळे विज्ञान चाचणीयोग्य राहते आणि संवेदनशीलता (sentience) संबंधीचे बिनबुडाचे दावे सिद्ध करण्यासाठी जटिल गणिताचा गैरवापर होण्यापासून रोखले जाते.

मुख्य निष्कर्ष