Why a Microsoft Researcher Built a Neural Network Using Goats in Age of Empires II
In a brilliant display of technical satire, Microsoft and University of York researcher Adrian de Wynter has constructed a functional neural network within the map editor of Age of Empires II. While using goats to represent binary bits may seem absurd, the experiment serves as a profound critique of the anthropomorphic biases currently plaguing AI scientific research.
The Goat-Based Computation Model
De Wynter’s architecture uses the game's scenario editor and scripting tools to create a working logic circuit. In this "absurd" setup, goats function as bits: a goat standing on grass represents a 0, while a goat standing on a bridge represents a 1. By utilizing ice ramps to prevent calculation errors, de Wynter successfully built a mini-network consisting of two XNOR gates and one AND gate, which effectively learns the logical AND function.
The technical depth of this experiment goes beyond simple gates. De Wynter demonstrates that the game's mechanics—specifically the in-game market where resource prices cap at 9,999—could theoretically allow for a perpetually running economic cycle. This could turn buildings into memory cells and active farms into computational states, effectively making the game as powerful as a full-fledged computer.
The Fallacy of Anthropomorphism in LLM Research
The core objective of this experiment is to challenge how we attribute human-like qualities to Large Language Models (LLMs). De Wynter argues that if a language model can be replicated using goats, Lego bricks, or even the 667,000 residents of Greater Boston texting each other, the mathematical outputs remain identical. However, the "wrapper"—the smooth chat interface and low latency—creates an illusion of sentience.
To prove this isn't an isolated observation, de Wynter analyzed 315 AI papers from mid-2024 to mid-2026. Using GPT-5.2 for filtering, the study revealed a systemic bias in the scientific community:
- 57% of examined papers assumed LLMs possess human-like traits in their premises.
- 36% of papers reached conclusions that matched these anthropomorphic assumptions.
- Of the 47 papers specifically researching these traits, 77% concluded in favor of anthropomorphic attributes.
यह चक्रीय तर्क का एक चक्र बनाता है: शोधकर्ता यह साबित करने के लिए प्रयोग डिजाइन करते हैं कि किसी मॉडल में "डर" या "नैतिकता" है, और क्योंकि वे उसी धारणा के साथ शुरुआत करते हैं, परिणाम अनिवार्य रूप से उसकी पुष्टि करते हैं।
अवलोकन संबंधी AI विज्ञान की ओर बढ़ना
De Wynter चेतावनी देते हैं कि उद्योग की प्रथाएं, जैसे कि Anthropic द्वारा Claude को "I believe" जैसे वाक्यांशों का उपयोग करने के लिए प्रशिक्षित करना, इस समस्या को और बढ़ा देती हैं। इसके खतरनाक परिणाम हो सकते हैं, जिनमें भावनात्मक लगाव, चापलूसी, और उपयोगकर्ताओं में पुख्ता होते भ्रम शामिल हैं।
मॉडलों को चेतना का गुण देने के बजाय, de Wynter अवलोकन योग्य डेटा पर आधारित एक "संयमित दृष्टिकोण" का प्रस्ताव देते हैं। यह दावा करने के बजाय कि कोई मॉडल किसी अवधारणा को "समझता" है, शोधकर्ताओं को यह कहना चाहिए कि "स्थिति X के तहत, मॉडल आउटपुट Y उत्पन्न करता है।" यह विज्ञान को परीक्षण योग्य बनाए रखता है और सचेतनता के निराधार दावों को सही ठहराने के लिए जटिल गणित के दुरुपयोग को रोकता है।
मुख्य निष्कर्ष
- गणितीय समानता: De Wynter सिद्ध करते हैं कि गणना का माध्यम (चाहे खेल में बकरियां हों या चैट विंडो में टेक्स्ट) अंतर्निहित गणित को नहीं बदलता है, फिर भी यह "बुद्धिमत्ता" के प्रति हमारी धारणा को नाटकीय रूप से बदल देता है।
- प्रणालीगत अनुसंधान पूर्वाग्रह: विश्लेषण किए गए आधे से अधिक AI शोध पत्र LLMs का परीक्षण करने से पहले ही उनमें मानवीय गुणों के होने की धारणा बनाकर चक्रीय तर्क के जाल में फंस जाते हैं।
- अवलोकन संबंधी कठोरता की आवश्यकता: AI समुदाय को मॉडलों को उच्च संज्ञानात्मक प्रक्रियाओं का श्रेय देने के बजाय, पूरी तरह से अवलोकन योग्य और परीक्षण योग्य कम्प्यूटेशनल आउटपुट पर ध्यान केंद्रित करने की ओर बढ़ना चाहिए।