Warum ein Microsoft-Forscher in Age of Empires II ein neuronales Netzwerk mithilfe von Ziegen entwickelte

📅3 hours ago⏱3 min read

In this article

Warum ein Microsoft-Forscher ein neuronales Netz mit Ziegen in Age of Empires II baute

In einer brillanten Demonstration technischer Satire hat Adrian de Wynter, Forscher bei Microsoft und der University of York, ein funktionsfähiges neuronales Netz innerhalb des Map-Editors von Age of Empires II konstruiert. Auch wenn die Verwendung von Ziegen zur Darstellung binärer Bits absurd erscheinen mag, dient das Experiment als tiefgreifende Kritik an den anthropomorphen Verzerrungen, die derzeit die KI-Forschung plagen.

Das ziegenbasierte Berechnungsmodell

De Wynters Architektur nutzt den Szenario-Editor und die Scripting-Tools des Spiels, um einen funktionierenden Logikschaltkreis zu erstellen. In diesem „absurden“ Aufbau fungieren Ziegen als Bits: Eine Ziege, die auf Gras steht, repräsentiert eine 0, während eine Ziege auf einer Brücke eine 1 darstellt. Durch den Einsatz von Eisrampen, um Rechenfehler zu vermeiden, baute de Wynter erfolgreich ein Mini-Netzwerk auf, das aus zwei XNOR-Gattern und einem AND-Gatter besteht und effektiv die logische AND-Funktion erlernt.

Die technische Tiefe dieses Experiments geht über einfache Gatter hinaus. De Wynter zeigt auf, dass die Spielmechaniken – insbesondere der In-Game-Markt, in dem die Ressourcenpreise bei 9.999 gedeckelt sind – theoretisch einen fortlaufenden Wirtschaftskreislauf ermöglichen könnten. Dies könnte Gebäude in Speicherzellen und aktive Farmen in Rechenzustände verwandeln und das Spiel effektiv so leistungsfähig wie einen vollwertigen Computer machen.

Der Trugschluss des Anthropomorphismus in der LLM-Forschung

Das Kernziel dieses Experiments besteht darin, die Art und Weise infrage zu stellen, wie wir Large Language Models (LLMs) menschliche Eigenschaften zuschreiben. De Wynter argumentiert, dass die mathematischen Ergebnisse identisch bleiben, egal ob ein Sprachmodell mithilfe von Ziegen, Lego-Steinen oder sogar durch die SMS-Korrespondenz der 667.000 Einwohner von Greater Boston repliziert wird. Der „Wrapper“ – die reibungslose Chat-Schnittstelle und die geringe Latenz – erzeugt jedoch die Illusion von Empfindungsfähigkeit.

Um zu beweisen, dass dies keine isolierte Beobachtung ist, analysierte de Wynter 315 KI-Fachartikel aus der Zeit von Mitte 2024 bis Mitte 2026. Unter Verwendung von GPT-5.2 zur Filterung deckte die Studie eine systematische Verzerrung in der wissenschaftlichen Gemeinschaft auf:

57 % der untersuchten Arbeiten setzten in ihren Prämissen voraus, dass LLMs menschenähnliche Eigenschaften besitzen.
36 % der Arbeiten kamen zu Schlussfolgerungen, die diesen anthropomorphen Annahmen entsprachen.
Von den 47 Arbeiten, die sich spezifisch mit diesen Eigenschaften befassten, kamen 77 % zu einem Ergebnis zugunsten anthropomorpher Attribute.

Dies schafft einen Kreislauf aus Zirkelschlüssen: Forscher entwerfen Experimente, um zu beweisen, dass ein Modell „Angst“ oder „Moral“ besitzt, und da sie mit dieser Annahme beginnen, bestätigen die Ergebnisse diese unweigerlich.

Hinwendung zu einer beobachtenden KI-Wissenschaft

De Wynter warnt davor, dass Branchenpraktiken – wie etwa das Training von Claude durch Anthropic, Phrasen wie „Ich glaube“ zu verwenden – dieses Problem verschärfen. Dies kann zu gefährlichen Folgen führen, einschließlich emotionaler Bindung, Schmeichelei und verstärkten Wahnvorstellungen bei den Nutzern.

Anstatt Modellen Bewusstsein zuzuschreiben, schlägt de Wynter einen „nüchternen Ansatz“ vor, der auf beobachtbaren Daten basiert. Anstatt zu behaupten, ein Modell „verstehe“ ein Konzept, sollten Forscher feststellen: „Unter Bedingung X erzeugt das Modell die Ausgabe Y.“ Dies hält die Wissenschaft testbar und verhindert den Missbrauch komplexer Mathematik, um unbegründete Behauptungen über Empfindungsfähigkeit zu rechtfertigen.

Wichtigste Erkenntnisse

Mathematische Äquivalenz: De Wynter beweist, dass das Medium der Berechnung (ob Ziegen in einem Spiel oder Text in einem Chatfenster) die zugrunde liegende Mathematik nicht verändert, unsere Wahrnehmung von „Intelligenz“ jedoch drastisch beeinflusst.
Systematischer Forschungsfehler (Bias): Mehr als die Hälfte der analysierten KI-Arbeiten tappt in die Falle des Zirkelschlusses, indem sie davon ausgehen, dass LLMs menschliche Eigenschaften besitzen, noch bevor sie diese testen.
Die Notwendigkeit beobachtender Strenge: Die KI-Community muss den Fokus weg von der Zuschreibung höherer kognitiver Prozesse an Modelle hin zu streng beobachtbaren, testbaren Rechenergebnissen verlagern.

Warum ein Microsoft-Forscher in Age of Empires II ein neuronales Netzwerk mithilfe von Ziegen entwickelte

Warum ein Microsoft-Forscher ein neuronales Netz mit Ziegen in Age of Empires II baute

Das ziegenbasierte Berechnungsmodell

Der Trugschluss des Anthropomorphismus in der LLM-Forschung

Hinwendung zu einer beobachtenden KI-Wissenschaft

Wichtigste Erkenntnisse

Continue reading

𝗗𝗶𝗳𝗳𝘂𝘀𝗶𝗼𝗻𝗚𝗲𝗺𝗺𝗮: 𝗚𝗼𝗼𝗴𝗹𝗲'𝘀 𝗢𝗽𝗲𝗻 𝗔𝗜 𝗧𝘄𝗶𝘀𝘁

𝗔𝗴𝗲𝗻𝘁 𝗔𝗿𝗰𝗵𝗶𝘁𝗲𝗰𝘁𝘂𝗿𝗲 𝗜𝘀 𝗔 𝗖𝗼𝗺𝗽𝘂𝘁𝗲 𝗔𝗹𝗹𝗼𝗰𝗮𝘁𝗶𝗼𝗻 𝗣𝗿𝗼𝗯𝗹𝗲𝗺

𝗙𝗿𝗼𝗺 𝗘𝘅𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 𝘁𝗼 𝗜𝗺𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧

KI-Agenten haben ein Zuverlässigkeitsproblem

Meta’s AI Mode: The Risks of Grounding Search in Social Media Data