Microsoft 연구원이 Age of Empires II에서 염소를 이용해 신경망을 구축한 이유
기술적 풍자의 탁월한 사례로, Microsoft와 요크 대학교의 연구원 Adrian de Wynter는 Age of Empires II의 맵 에디터 내에 기능적인 신경망을 구축했습니다. 이진 비트를 표현하기 위해 염소를 사용하는 것이 황당해 보일 수 있지만, 이 실험은 현재 AI 과학 연구를 괴롭히고 있는 의인화된 편향(anthropomorphic biases)에 대한 심오한 비판을 담고 있습니다.
염소 기반 연산 모델
De Wynter의 아키텍처는 게임의 시나리오 에디터와 스크립팅 도구를 사용하여 작동 가능한 논리 회로를 만듭니다. 이 "황당한" 설정에서 염소는 비트 역할을 합니다. 풀밭 위에 서 있는 염소는 0을 나타내고, 다리 위에 서 있는 염소는 1을 나타냅니다. 계산 오류를 방지하기 위해 얼음 경사로를 활용함으로써, de Wynter는 두 개의 XNOR 게이트와 한 개의 AND 게이트로 구성된 미니 네트워크를 성공적으로 구축했으며, 이는 논리적 AND 함수를 효과적으로 학습합니다.
이 실험의 기술적 깊이는 단순한 게이트 그 이상을 넘어섭니다. De Wynter는 게임의 메커니즘, 특히 자원 가격이 9,999로 제한되는 게임 내 시장을 통해 이론적으로 영구적으로 작동하는 경제 사이클을 구현할 수 있음을 보여줍니다. 이를 통해 건물을 메모리 셀로, 활성화된 농장을 연산 상태로 전환하여 게임을 사실상 완전한 컴퓨터만큼 강력하게 만들 수 있습니다.
LLM 연구에서의 의인화 오류
이 실험의 핵심 목적은 우리가 거대 언어 모델(LLM)에 어떻게 인간과 유사한 특성을 부여하는지에 대해 의문을 제기하는 것입니다. De Wynter는 만약 언어 모델이 염소, 레고 블록, 또는 서로 문자를 주고받는 보스턴 대도시권의 667,000명의 주민을 통해서도 복제될 수 있다면, 수학적 출력값은 동일하게 유지된다고 주장합니다. 하지만 매끄러운 채팅 인터페이스와 낮은 지연 시간이라는 "래퍼(wrapper)"가 지각 능력이 있다는 환상을 만들어냅니다.
이것이 단편적인 관찰이 아님을 증명하기 위해, de Wynter는 2024년 중반부터 2026년 중반까지의 AI 논문 315편을 분석했습니다. GPT-5.2를 필터링에 사용하여 수행된 이 연구는 과학계의 체계적인 편향을 드러냈습니다:
- **검토된 논문의 57%**가 전제 조건에서 LLM이 인간과 유사한 특성을 가지고 있다고 가정했습니다.
- **논문의 36%**가 이러한 의인화된 가정과 일치하는 결론에 도달했습니다.
- 이러한 특성을 구체적으로 연구한 47편의 논문 중, 77%가 의인화된 속성을 지지하는 결론을 내렸습니다.
이는 순환 논리의 고리를 만듭니다. 연구자들은 모델이 '공포'나 '도덕성'을 가지고 있음을 증명하기 위해 실험을 설계하며, 그러한 가정에서 시작하기 때문에 결과는 필연적으로 이를 확인해 줄 뿐입니다.
관찰 중심의 AI 과학을 향하여
De Wynter는 Anthropic이 Claude에게 "I believe"와 같은 문구를 사용하도록 훈련시키는 것과 같은 업계 관행이 이 문제를 악화시킨다고 경고합니다. 이는 정서적 애착, 아첨, 사용자의 망상 강화 등 위험한 결과로 이어질 수 있습니다.
모델에 의식을 부여하는 대신, De Wynter는 관찰 가능한 데이터에 기반한 '냉철한 접근법(sober approach)'을 제안합니다. 모델이 개념을 '이해한다'고 주장하는 대신, 연구자들은 "조건 X 하에서 모델은 출력 Y를 생성한다"라고 기술해야 합니다. 이는 과학적 검증 가능성을 유지하며, 근거 없는 지각 능력(sentience) 주장을 정당화하기 위해 복잡한 수학을 오용하는 것을 방지합니다.
핵심 요약
- 수학적 동등성: De Wynter는 계산 매체(게임 속 염소든 채팅창의 텍스트든)가 기저의 수학을 바꾸지는 않지만, '지능'에 대한 우리의 인식을 극적으로 변화시킨다는 것을 증명합니다.
- 체계적 연구 편향: 분석된 AI 논문의 절반 이상이 LLM이 인간적 특성을 가지고 있다고 가정하고 테스트를 진행함으로써 순환 논리의 함정에 빠져 있습니다.
- 관찰의 엄밀성 필요: AI 커뮤니티는 모델에 고등 인지 과정을 부여하는 것에서 벗어나, 엄격하게 관찰 가능하고 검증 가능한 계산 출력물에 집중하는 방향으로 전환해야 합니다.