شکستن ذهن جمعی هوش مصنوعی: چگونه Flint با تفکر گروهی در مدلهای زبانی بزرگ (LLM) مبارزه میکند
در حالی که مدلهای زبانی بزرگ مانند ChatGPT و Claude در کدنویسی و تحقیق عملکرد فوقالعادهای دارند، بهطور فزایندهای در تلهی «تفکر گروهی» (groupthink) قابل پیشبینی گرفتار میشوند. همانطور که مدلهای رایج به سمت پاسخهای تکراری و با احتمال بالا میل میکنند، یک استارتاپ جدید در تلاش است تا واگرایی (divergence) بسیار مورد نیاز را به اکوسیستم هوش مصنوعی مولد تزریق کند.
مشکل: اثر «ذهن جمعی مصنوعی»
یک محدودیت قابل توجه در توسعه فعلی LLM، تمایل مدلها به سمت محتملترین پاسخ از نظر آماری است که منجر به پدیدهای میشود که پژوهشگران آن را «ذهن جمعی مصنوعی» (Artificial Hivemind) مینامند. مقالهای برنده جایزه NeurIPS با عنوان “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)” (ذهن جمعی مصنوعی: همگنی بیانتها در مدلهای زبانی و فراتر از آن)، این تکرار ریشهدار را آشکار کرد.
تیم تحقیقاتی ۲۵ مدل مختلف LLM، از جمله مدلهای اصلی ایالات متحده و نسخههای متنباز چینی را مورد آزمایش قرار دادند. وقتی از آنها خواسته شد استعارهای برای «زمان» ارائه دهند، اکثریت قریب به اتفاقِ ۱۲۵۰ پاسخ، به سمت کلیشههایی مانند «زمان مانند یک رودخانه است» یا «زمان یک بافنده است» متمایل شدند. این عدم تنوع صرفاً یک ویژگی عجیب نیست؛ بلکه محصول جانبی آموزش مدلها بر روی مجموعهدادههای مشابه با هدف اصلیِ به حداکثر رساندن قابلیت اطمینان و انسجام است. OpenAI اذعان کرده است که تلاش برای نوآوری گاهی میتواند منجر به پاسخهای ضعیفتر و کماعتمادتر شود، به همین دلیل است که اکثر مدلها بهطور پیشفرض به سمت خروجیهای امن و «با احتمال بالا» میروند.
ورود Flint: اولویت دادن به تنوع بر پیشبینیپذیری
استارتاپ استرالیایی Springboards با مدل جدید خود، Flint، این وضعیت موجود را به چالش میکشد. برخلاف مدلهای رایج که به هر قیمتی با توهمات (hallucinations) مبارزه میکنند، Pip Bingemann، مدیرعامل Springboards، استدلال میکند که درجاتی از واگرایی غیرقابل پیشبینی برای وظایف خلاقانه ضروری است.
در آزمایشهای عملی، تفاوت در توزیع خروجیها بسیار چشمگیر است:
- تصادفی بودن: وقتی از آنها خواسته شد یک عدد تصادفی ارائه دهند، ChatGPT و Claude اغلب به عدد «7» متمایل شدند، در حالی که Flint اعداد غیر استاندارد و با دقت بالا مانند «3.7916» ارائه داد.
- برندسازی خلاقانه: وقتی از آنها خواسته شد شعار تبلیغاتی برای New Balance بنویسند، Claude و ChatGPT هر دو عبارت "Run your way" را تولید کردند، در حالی که Flint جایگزین متمایزی ارائه داد: "Built to last, run to win".
- انتخاب اسم: در حالی که مدلهای رایج به سمت برندهای «امن» مانند Toyota یا Honda متمایل میشوند، Flint طیف گستردهتری را نشان میدهد و گزینههای کمتر قابل پیشبینی مانند Ford F-150 را انتخاب میکند.
ابزاری خلاق برای متخصصان
Springboards فقط در حال ساخت یک مدل مستقل نیست؛ آنها در حال توسعه ابزاری تخصصی برای متخصصان تبلیغات و بازاریابی هستند. این پلتفرم به کاربران اجازه میدهد خروجیهای چندین مدل — از جمله ChatGPT و Claude — را تجمیع کرده و آنها را برای ترکیب و خلق ایدههای جدید با هم ادغام کنند. Flint به عنوان یک «منجنیق خلاقیت» در این اکوسیستم عمل میکند که بهطور خاص برای خارج کردن کاربران از چارچوبهای ذهنی موجودشان طراحی شده است.
Zoe Scaman، مدیر ارشد استراتژی در 77X، خاطرنشان کرد که در حالی که مدلهای رایج اغلب راهکارهای تکراری و خستهکننده را پیشنهاد میدهند (مانند «آموزش سواد مالی به روشی سرگرمکننده»)، Flint تغییرات رادیکالی در دیدگاه ایجاد میکند، مانند پیشنهاد بازسازی کامل برند (rebranding) برای خودِ مفهوم انباشت ثروت.
نکات کلیدی
- همگنی LLM: مدلهای بزرگ به دلیل روشهای آموزشی مشابه، به سمت پاسخهای مشابه و قابل پیشبینی متمایل میشوند و اثر «ذهن جمعی مصنوعی» را ایجاد میکنند.
- رویکرد Flint: مدل Flint از شرکت Springboards، تنوع و واگرایی پاسخها را در اولویت قرار میدهد و آن را برای طوفان فکری و استراتژی خلاقانه، مناسبتر از مدلهای استاندارد میکند.
- تقابل قابلیت اطمینان: صنعت با یک تنش اساسی بین قابلیت اطمینان مدل (ماندن در محدوده احتمالات بالا) و نوآوری خلاقانه (پذیرش خروجیهای متنوع با احتمال پایینتر) روبروست.
