ทำไมนักวิจัยจาก Microsoft ถึงสร้างโครงข่ายประสาทเทียมโดยใช้แพะในเกม Age of Empires II
ในการแสดงออกถึงการเสียดสีทางเทคนิคที่ชาญฉลาด Adrian de Wynter นักวิจัยจาก Microsoft และ University of York ได้สร้างโครงข่ายประสาทเทียม (neural network) ที่ใช้งานได้จริงขึ้นมาภายในตัวแก้ไขแผนที่ของ Age of Empires II แม้ว่าการใช้แพะเพื่อแทนค่าบิตแบบไบนารี (binary bits) อาจดูเป็นเรื่องไร้สาระ แต่การทดลองนี้ทำหน้าที่เป็นการวิพากษ์วิจารณ์อย่างลึกซึ้งต่ออคติแบบมนุษยนิยม (anthropomorphic biases) ที่กำลังสร้างปัญหาให้กับการวิจัยทางวิทยาศาสตร์ด้าน AI ในปัจจุบัน
โมเดลการคำนวณโดยใช้แพะเป็นฐาน
สถาปัตยกรรมของ De Wynter ใช้ตัวแก้ไขสถานการณ์ (scenario editor) และเครื่องมือเขียนสคริปต์ของเกมเพื่อสร้างวงจรตรรกะที่ทำงานได้จริง ในการตั้งค่าที่ "ไร้สาระ" นี้ แพะจะทำหน้าที่เป็นบิต: แพะที่ยืนอยู่บนหญ้าจะแทนค่า 0 ในขณะที่แพะที่ยืนอยู่บนสะพานจะแทนค่า 1 ด้วยการใช้ทางลาดน้ำแข็งเพื่อป้องกันข้อผิดพลาดในการคำนวณ De Wynter ประสบความสำเร็จในการสร้างโครงข่ายขนาดเล็กที่ประกอบด้วย XNOR gate สองตัว และ AND gate หนึ่งตัว ซึ่งสามารถเรียนรู้ฟังก์ชันตรรกะแบบ AND ได้อย่างมีประสิทธิภาพ
ความลึกซึ้งทางเทคนิคของการทดลองนี้ไปไกลกว่าแค่เรื่องของเกต (gates) พื้นฐาน De Wynter แสดงให้เห็นว่ากลไกของเกม โดยเฉพาะตลาดภายในเกมที่ราคาทรัพยากรถูกจำกัดไว้ที่ 9,999 อาจช่วยให้เกิดวงจรเศรษฐกิจที่ดำเนินไปได้อย่างต่อเนื่องในทางทฤษฎี สิ่งนี้สามารถเปลี่ยนสิ่งก่อสร้างให้กลายเป็นเซลล์หน่วยความจำ (memory cells) และเปลี่ยนฟาร์มที่กำลังทำงานอยู่ให้กลายเป็นสถานะการคำนวณ (computational states) ซึ่งจะทำให้เกมนี้มีประสิทธิภาพเทียบเท่ากับคอมพิวเตอร์เครื่องหนึ่งได้อย่างแท้จริง
ความเข้าใจผิดเรื่องการมอง AI เป็นมนุษย์ในการวิจัย LLM
วัตถุประสงค์หลักของการทดลองนี้คือการท้าทายวิธีที่เรามักจะมอบคุณลักษณะเหมือนมนุษย์ให้กับโมเดลภาษาขนาดใหญ่ (Large Language Models หรือ LLMs) De Wynter โต้แย้งว่า หากโมเดลภาษาหนึ่งสามารถจำลองขึ้นมาได้โดยใช้แพะ, ตัวต่อ Lego หรือแม้แต่ชาวเมือง Greater Boston จำนวน 667,000 คนที่ส่งข้อความหากัน ผลลัพธ์ทางคณิตศาสตร์ที่ได้ก็ยังคงเหมือนเดิม อย่างไรก็ตาม "เปลือกนอก" (wrapper) ซึ่งก็คืออินเทอร์เฟซการแชทที่ลื่นไหลและความหน่วงที่ต่ำ กลับสร้างภาพลวงตาว่ามันมีความรู้สึกนึกคิด (sentience)
เพื่อพิสูจน์ว่านี่ไม่ใช่ข้อสังเกตที่เกิดขึ้นเพียงครั้งเดียว De Wynter ได้วิเคราะห์บทความวิจัยด้าน AI จำนวน 315 ฉบับ ตั้งแต่ช่วงกลางปี 2024 ถึงกลางปี 2026 โดยใช้ GPT-5.2 ในการคัดกรอง ผลการศึกษาเผยให้เห็นถึงอคติเชิงระบบในชุมชนวิทยาศาสตร์:
- 57% ของบทความที่ตรวจสอบ ตั้งสมมติฐานเบื้องต้นว่า LLM มีคุณลักษณะเหมือนมนุษย์
- 36% ของบทความ ได้ข้อสรุปที่สอดคล้องกับสมมติฐานเรื่องการมองเป็นมนุษย์เหล่านี้
- จากบทความ 47 ฉบับที่วิจัยเรื่องคุณลักษณะเหล่านี้โดยเฉพาะ 77% สรุปไปในทิศทางที่สนับสนุนคุณลักษณะแบบมนุษย์
สิ่งนี้ทำให้เกิดวงจรของการให้เหตุผลแบบวนเวียน: นักวิจัยออกแบบการทดลองเพื่อพิสูจน์ว่าโมเดลมีความ "กลัว" หรือ "ศีลธรรม" และเนื่องจากพวกเขาเริ่มต้นด้วยสมมติฐานนั้น ผลลัพธ์จึงยืนยันสมมติฐานนั้นอย่างหลีกเลี่ยงไม่ได้
มุ่งสู่การเป็นวิทยาศาสตร์ AI เชิงสังเกตการณ์
De Wynter เตือนว่าแนวทางปฏิบัติในอุตสาหกรรม เช่น การที่ Anthropic ฝึกฝน Claude ให้ใช้ประโยคอย่าง "I believe" ยิ่งทำให้ปัญหานี้รุนแรงขึ้น ซึ่งอาจนำไปสู่ผลลัพธ์ที่อันตราย รวมถึงการยึดติดทางอารมณ์ การประจบสอพลอ (sycophancy) และการตอกย้ำความหลงผิดในตัวผู้ใช้งาน
แทนที่จะกำหนดว่าโมเดลมีความตระหนักรู้ (consciousness) De Wynter เสนอ "แนวทางที่สุขุม" (sober approach) ซึ่งมีรากฐานมาจากข้อมูลที่สังเกตเห็นได้ แทนที่จะกล่าวอ้างว่าโมเดล "เข้าใจ" แนวคิดหนึ่งๆ นักวิจัยควรระบุว่า "ภายใต้เงื่อนไข X โมเดลจะให้ผลลัพธ์ Y" วิธีนี้จะช่วยให้วิทยาศาสตร์สามารถทดสอบได้ และป้องกันการใช้คณิตศาสตร์ที่ซับซ้อนอย่างผิดวัตถุประสงค์เพื่อสร้างความชอบธรรมให้กับข้อกล่าวอ้างเรื่องความรู้สึกนึกคิด (sentience) ที่ไม่มีหลักฐานรองรับ
ประเด็นสำคัญ
- ความเท่าเทียมกันทางคณิตศาสตร์ (Mathematical Equivalence): De Wynter พิสูจน์ให้เห็นว่าสื่อกลางในการคำนวณ (ไม่ว่าจะเป็นแพะในเกมหรือข้อความในหน้าต่างแชท) ไม่ได้เปลี่ยนคณิตศาสตร์ที่เป็นพื้นฐาน แต่กลับเปลี่ยนการรับรู้ของเราต่อ "ความฉลาด" อย่างสิ้นเชิง
- อคติในการวิจัยเชิงระบบ (Systemic Research Bias): มากกว่าครึ่งหนึ่งของงานวิจัย AI ที่ได้รับการวิเคราะห์ ตกหลุมพรางของการให้เหตุผลแบบวนเวียน โดยการตั้งสมมติฐานว่า LLM มีลักษณะเหมือนมนุษย์ก่อนที่จะทำการทดสอบเสียด้วยซ้ำ
- ความจำเป็นในความเข้มงวดเชิงสังเกตการณ์ (The Need for Observational Rigor): ชุมชน AI ต้องเปลี่ยนจากการกำหนดกระบวนการทางปัญญาขั้นสูงให้กับโมเดล ไปเป็นการมุ่งเน้นที่ผลลัพธ์จากการคำนวณที่สามารถสังเกตและทดสอบได้อย่างเคร่งครัด