Por qué un investigador de Microsoft construyó una red neuronal usando cabras en Age of Empires II

En una brillante muestra de sátira técnica, el investigador de Microsoft y la Universidad de York, Adrian de Wynter, ha construido una red neuronal funcional dentro del editor de mapas de Age of Empires II. Aunque el uso de cabras para representar bits binarios pueda parecer absurdo, el experimento sirve como una profunda crítica de los sesgos antropomórficos que actualmente plagan la investigación científica de la IA.

El modelo de computación basado en cabras

La arquitectura de de Wynter utiliza el editor de escenarios y las herramientas de scripting del juego para crear un circuito lógico funcional. En esta configuración "absurda", las cabras funcionan como bits: una cabra parada sobre la hierba representa un 0, mientras que una cabra parada sobre un puente representa un 1. Al utilizar rampas de hielo para evitar errores de cálculo, de Wynter construyó con éxito una minirred compuesta por dos puertas XNOR y una puerta AND, la cual aprende eficazmente la función lógica AND.

La profundidad técnica de este experimento va más allá de simples puertas lógicas. De Wynter demuestra que las mecánicas del juego —específicamente el mercado interno donde los precios de los recursos tienen un tope de 9,999— podrían teóricamente permitir un ciclo económico en funcionamiento perpetuo. Esto podría convertir los edificios en celdas de memoria y las granjas activas en estados computacionales, haciendo que el juego sea, en efecto, tan potente como una computadora completa.

La falacia del antropomorfismo en la investigación de los LLM

El objetivo central de este experimento es cuestionar cómo atribuimos cualidades humanas a los modelos de lenguaje de gran tamaño (LLM). De Wynter sostiene que si un modelo de lenguaje puede replicarse utilizando cabras, ladrillos de Lego o incluso a los 667,000 residentes del Gran Boston enviándose mensajes de texto entre sí, los resultados matemáticos siguen siendo idénticos. Sin embargo, el "wrapper" —la interfaz de chat fluida y la baja latencia— crea una ilusión de sintiencia.

Para demostrar que esto no es una observación aislada, de Wynter analizó 315 artículos de IA desde mediados de 2024 hasta mediados de 2026. Utilizando GPT-5.2 para el filtrado, el estudio reveló un sesgo sistémico en la comunidad científica:

Esto crea un ciclo de razonamiento circular: los investigadores diseñan experimentos para demostrar que un modelo tiene "miedo" o "moralidad" y, como parten de esa suposición, los resultados inevitablemente la confirman.

Hacia una ciencia de la IA observacional

De Wynter advierte que las prácticas de la industria, como el entrenamiento de Anthropic para que Claude utilice frases como "creo que", exacerban este problema. Esto puede tener consecuencias peligrosas, incluyendo el apego emocional, la sicofancia y el refuerzo de delirios en los usuarios.

En lugar de atribuir conciencia a los modelos, de Wynter propone un "enfoque sobrio" basado en datos observables. En vez de afirmar que un modelo "entiende" un concepto, los investigadores deberían declarar que "bajo la condición X, el modelo produce el resultado Y". Esto mantiene la ciencia comprobable y evita el uso indebido de matemáticas complejas para justificar afirmaciones infundadas de sintiencia.

Conclusiones clave