Warum ein Microsoft-Forscher ein neuronales Netz mit Ziegen in Age of Empires II baute

In einer brillanten Demonstration technischer Satire hat Adrian de Wynter, Forscher bei Microsoft und der University of York, ein funktionsfähiges neuronales Netz innerhalb des Map-Editors von Age of Empires II konstruiert. Auch wenn die Verwendung von Ziegen zur Darstellung binärer Bits absurd erscheinen mag, dient das Experiment als tiefgreifende Kritik an den anthropomorphen Verzerrungen, die derzeit die KI-Forschung plagen.

Das ziegenbasierte Berechnungsmodell

De Wynters Architektur nutzt den Szenario-Editor und die Scripting-Tools des Spiels, um einen funktionierenden Logikschaltkreis zu erstellen. In diesem „absurden“ Aufbau fungieren Ziegen als Bits: Eine Ziege, die auf Gras steht, repräsentiert eine 0, während eine Ziege auf einer Brücke eine 1 darstellt. Durch den Einsatz von Eisrampen, um Rechenfehler zu vermeiden, baute de Wynter erfolgreich ein Mini-Netzwerk auf, das aus zwei XNOR-Gattern und einem AND-Gatter besteht und effektiv die logische AND-Funktion erlernt.

Die technische Tiefe dieses Experiments geht über einfache Gatter hinaus. De Wynter zeigt auf, dass die Spielmechaniken – insbesondere der In-Game-Markt, in dem die Ressourcenpreise bei 9.999 gedeckelt sind – theoretisch einen fortlaufenden Wirtschaftskreislauf ermöglichen könnten. Dies könnte Gebäude in Speicherzellen und aktive Farmen in Rechenzustände verwandeln und das Spiel effektiv so leistungsfähig wie einen vollwertigen Computer machen.

Der Trugschluss des Anthropomorphismus in der LLM-Forschung

Das Kernziel dieses Experiments besteht darin, die Art und Weise infrage zu stellen, wie wir Large Language Models (LLMs) menschliche Eigenschaften zuschreiben. De Wynter argumentiert, dass die mathematischen Ergebnisse identisch bleiben, egal ob ein Sprachmodell mithilfe von Ziegen, Lego-Steinen oder sogar durch die SMS-Korrespondenz der 667.000 Einwohner von Greater Boston repliziert wird. Der „Wrapper“ – die reibungslose Chat-Schnittstelle und die geringe Latenz – erzeugt jedoch die Illusion von Empfindungsfähigkeit.

Um zu beweisen, dass dies keine isolierte Beobachtung ist, analysierte de Wynter 315 KI-Fachartikel aus der Zeit von Mitte 2024 bis Mitte 2026. Unter Verwendung von GPT-5.2 zur Filterung deckte die Studie eine systematische Verzerrung in der wissenschaftlichen Gemeinschaft auf:

Dies schafft einen Kreislauf aus Zirkelschlüssen: Forscher entwerfen Experimente, um zu beweisen, dass ein Modell „Angst“ oder „Moral“ besitzt, und da sie mit dieser Annahme beginnen, bestätigen die Ergebnisse diese unweigerlich.

Hinwendung zu einer beobachtenden KI-Wissenschaft

De Wynter warnt davor, dass Branchenpraktiken – wie etwa das Training von Claude durch Anthropic, Phrasen wie „Ich glaube“ zu verwenden – dieses Problem verschärfen. Dies kann zu gefährlichen Folgen führen, einschließlich emotionaler Bindung, Schmeichelei und verstärkten Wahnvorstellungen bei den Nutzern.

Anstatt Modellen Bewusstsein zuzuschreiben, schlägt de Wynter einen „nüchternen Ansatz“ vor, der auf beobachtbaren Daten basiert. Anstatt zu behaupten, ein Modell „verstehe“ ein Konzept, sollten Forscher feststellen: „Unter Bedingung X erzeugt das Modell die Ausgabe Y.“ Dies hält die Wissenschaft testbar und verhindert den Missbrauch komplexer Mathematik, um unbegründete Behauptungen über Empfindungsfähigkeit zu rechtfertigen.

Wichtigste Erkenntnisse