چرا یک پژوهشگر مایکروسافت در بازی Age of Empires II با استفاده از بزها یک شبکه عصبی ساخت
در نمایشی درخشان از طنز فنی، آدریان دی وینتر، پژوهشگر مایکروسافت و دانشگاه یورک، یک شبکه عصبی کاربردی را در ویرایشگر نقشهی بازی Age of Empires II ساخته است. اگرچه استفاده از بزها برای نمایش بیتهای باینری ممکن است مضحک به نظر برسد، اما این آزمایش به عنوان نقدی عمیق بر سوگیریهای انسانانگاری که در حال حاضر تحقیقات علمی هوش مصنوعی را گرفتار کرده است، عمل میکند.
مدل محاسباتی مبتنی بر بز
معماری دی وینتر از ویرایشگر سناریو و ابزارهای اسکریپتنویسی بازی برای ایجاد یک مدار منطقی کاربردی استفاده میکند. در این ساختار «مضحک»، بزها به عنوان بیت عمل میکنند: بزی که روی چمن ایستاده نشاندهنده ۰ است، در حالی که بزی که روی یک پل ایستاده نشاندهنده ۱ است. دی وینتر با استفاده از رمپهای یخی برای جلوگیری از خطاهای محاسباتی، با موفقیت یک شبکه کوچک متشکل از دو گیت XNOR و یک گیت AND ساخت که به طور مؤثری تابع منطقی AND را یاد میگیرد.
عمق فنی این آزمایش فراتر از گیتهای ساده است. دی وینتر نشان میدهد که مکانیسمهای بازی — بهویژه بازار درونبازی که در آن قیمت منابع در ۹,۹۹۹ محدود میشود — تئوریکاً میتواند اجازه ایجاد یک چرخه اقتصادی همیشگی را بدهد. این امر میتواند ساختمانها را به سلولهای حافظه و مزارع فعال را به وضعیتهای محاسباتی تبدیل کند و در عمل، بازی را به قدرتی مشابه یک کامپیوتر تمامعیار برساند.
مغلطه انسانانگاری در تحقیقات LLM
هدف اصلی این آزمایش، به چالش کشیدن نحوه نسبت دادن ویژگیهای انسانی به مدلهای زبانی بزرگ (LLMs) است. دی وینتر استدلال میکند که اگر یک مدل زبانی را بتوان با استفاده از بزها، قطعات لگو، یا حتی ۶۶۷,۰۰۰ ساکن منطقه بوستون بزرگ که به یکدیگر پیام میدهند بازسازی کرد، خروجیهای ریاضی همچنان یکسان باقی میمانند. با این حال، «پوشش» (wrapper) — یعنی رابط چت روان و تأخیر کم — توهم هوشیاری را ایجاد میکند.
برای اثبات اینکه این یک مشاهده تکموردی نیست، دی وینتر ۳۱۵ مقاله هوش مصنوعی را از اواسط سال ۲۰۲۴ تا اواسط سال ۲۰۲۶ تحلیل کرد. این مطالعه با استفاده از GPT-5.2 برای فیلتر کردن، یک سوگیری سیستماتیک را در جامعه علمی آشکار کرد:
- ۵۷٪ از مقالات بررسیشده در فرضیات خود فرض کردند که LLMها دارای ویژگیهای انسانی هستند.
- ۳۶٪ از مقالات به نتایجی رسیدند که با این فرضهای انسانانگاری مطابقت داشت.
- از ۴۷ مقالهای که بهطور خاص روی این ویژگیها تحقیق کرده بودند، ۷۷٪ به نفع ویژگیهای انسانانگاری نتیجهگیری کردند.
این یک چرخه از استدلال دوری ایجاد میکند: پژوهشگران آزمایشهایی را طراحی میکنند تا ثابت کنند یک مدل دارای «ترس» یا «اخلاق» است، و چون با چنین فرضی شروع میکنند، نتایج ناگزیر آن را تأیید میکنند.
حرکت به سوی علم مشاهدهپذیر هوش مصنوعی
دی وینتر هشدار میدهد که شیوههای رایج در صنعت، مانند آموزش Claude توسط Anthropic برای استفاده از عباراتی نظیر «من باور دارم»، این مسئله را تشدید میکند. این امر میتواند منجر به پیامدهای خطرناکی از جمله وابستگی عاطفی، چاپلوسی و تقویت توهم در کاربران شود.
دی وینتر به جای نسبت دادن هوشیاری به مدلها، یک «رویکرد واقعبینانه» مبتنی بر دادههای مشاهدهپذیر را پیشنهاد میکند. پژوهشگران به جای ادعای اینکه یک مدل مفهومی را «درک میکند»، باید بیان کنند که «تحت شرایط X، مدل خروجی Y را تولید میکند». این کار علم را آزمونپذیر نگه میدارد و از سوءاستفاده از ریاضیات پیچیده برای توجیه ادعاهای بیاساس درباره داشتن احساس جلوگیری میکند.
نکات کلیدی
- همارزی ریاضی: دی وینتر ثابت میکند که رسانه محاسباتی (خواه بزها در یک بازی باشند یا متن در یک پنجره چت) ریاضیات زیربنایی را تغییر نمیدهد، اما درک ما از «هوش» را به شدت تغییر میدهد.
- سوگیری سیستماتیک پژوهشی: بیش از نیمی از مقالات تحلیلشده در حوزه هوش مصنوعی، با فرض اینکه LLMها دارای ویژگیهای انسانی هستند (پیش از انجام آزمایش)، در دام استدلال دوری میافتند.
- نیاز به دقت مشاهدهپذیر: جامعه هوش مصنوعی باید از نسبت دادن فرآیندهای شناختی عالی به مدلها، به سمت تمرکز بر خروجیهای محاسباتیِ دقیقاً مشاهدهپذیر و آزمونپذیر تغییر جهت دهد.