为什么一位微软研究员在《帝国时代 II》中使用山羊构建了神经网络
微软与约克大学研究员 Adrian de Wynter 以一场精彩的技术讽刺,在《帝国时代 II》的地图编辑器中构建了一个功能完备的神经网络。虽然使用山羊来代表二进制位看似荒诞,但这项实验对当前困扰 AI 科学研究的拟人化偏见进行了深刻的批判。
基于山羊的计算模型
De Wynter 的架构利用游戏的场景编辑器和脚本工具创建了一个可运行的逻辑电路。在这种“荒诞”的设置中,山羊充当了比特:站在草地上的山羊代表 0,而站在桥上的山羊代表 1。通过利用冰坡来防止计算错误,de Wynter 成功构建了一个由两个同或门(XNOR gates)和一个与门(AND gate)组成的微型网络,该网络能够有效地学习逻辑“与”函数。
这项实验的技术深度远不止于简单的逻辑门。De Wynter 展示了游戏的机制——特别是资源价格上限为 9,999 的游戏内市场——在理论上可以允许一个永续运行的经济循环。这可以将建筑转化为存储单元,将活跃的农场转化为计算状态,从而有效地使这款游戏拥有与一台功能完备的计算机相当的威力。
LLM 研究中拟人化的谬误
这项实验的核心目标是挑战我们如何将类人特性归于大语言模型(LLMs)。De Wynter 认为,如果一个语言模型可以通过山羊、乐高积木,甚至是大波士顿地区 66.7 万居民互相发短信来复制,那么其数学输出仍然是相同的。然而,“外壳”——即流畅的聊天界面和低延迟——创造了一种具有感知力的错觉。
为了证明这并非孤立的观察结果,de Wynter 分析了从 2024 年中期到 2026 年中期的 315 篇 AI 论文。通过使用 GPT-5.2 进行筛选,该研究揭示了科学界存在的一种系统性偏见:
- 57% 的受检论文在其前提假设中认为 LLMs 拥有类人特征。
- 36% 的论文得出了与这些拟人化假设相符的结论。
- 在专门研究这些特征的 47 篇论文中,77% 的结论倾向于支持拟人化属性。
这造成了一个循环论证的怪圈:研究人员设计实验来证明模型具有“恐惧”或“道德”,而正因为他们预设了这一假设,结果便不可避免地证实了它。
迈向观察性 AI 科学
De Wynter 警告说,行业中的做法(例如 Anthropic 训练 Claude 使用“我相信”之类的短语)加剧了这一问题。这可能导致危险的后果,包括用户产生情感依恋、谄媚行为以及强化的错觉。
De Wynter 建议采取一种植根于可观察数据的“冷静方法”,而不是将意识归于模型。研究人员不应声称模型“理解”某个概念,而应表述为“在条件 X 下,模型产生输出 Y”。这能保持科学的可测试性,并防止滥用复杂数学来为毫无根据的感知力主张辩护。
核心要点
- 数学等价性: De Wynter 证明,计算媒介(无论是游戏中的山羊还是聊天窗口中的文本)并不会改变底层的数学逻辑,但它却会剧烈改变我们对“智能”的感知。
- 系统性研究偏差: 在分析的 AI 论文中,超过一半的研究都陷入了循环论证的陷阱,即在测试之前就预设 LLM 具备人类特征。
- 对观察严谨性的需求: AI 社区必须实现转变:不再将高级认知过程归于模型,而是专注于严格可观察、可测试的计算输出。