شکستن ذهن جمعی هوش مصنوعی: چگونه Flint با تفکر گروهی در مدل‌های زبانی بزرگ (LLM) مبارزه می‌کند

در حالی که مدل‌های زبانی بزرگ مانند ChatGPT و Claude در کدنویسی و تحقیق عملکرد فوق‌العاده‌ای دارند، به‌طور فزاینده‌ای در تله‌ی «تفکر گروهی» (groupthink) قابل پیش‌بینی گرفتار می‌شوند. همان‌طور که مدل‌های رایج به سمت پاسخ‌های تکراری و با احتمال بالا میل می‌کنند، یک استارتاپ جدید در تلاش است تا واگرایی (divergence) بسیار مورد نیاز را به اکوسیستم هوش مصنوعی مولد تزریق کند.

مشکل: اثر «ذهن جمعی مصنوعی»

یک محدودیت قابل توجه در توسعه فعلی LLM، تمایل مدل‌ها به سمت محتمل‌ترین پاسخ از نظر آماری است که منجر به پدیده‌ای می‌شود که پژوهشگران آن را «ذهن جمعی مصنوعی» (Artificial Hivemind) می‌نامند. مقاله‌ای برنده جایزه NeurIPS با عنوان “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)” (ذهن جمعی مصنوعی: همگنی بی‌انتها در مدل‌های زبانی و فراتر از آن)، این تکرار ریشه‌دار را آشکار کرد.

تیم تحقیقاتی ۲۵ مدل مختلف LLM، از جمله مدل‌های اصلی ایالات متحده و نسخه‌های متن‌باز چینی را مورد آزمایش قرار دادند. وقتی از آن‌ها خواسته شد استعاره‌ای برای «زمان» ارائه دهند، اکثریت قریب به اتفاقِ ۱۲۵۰ پاسخ، به سمت کلیشه‌هایی مانند «زمان مانند یک رودخانه است» یا «زمان یک بافنده است» متمایل شدند. این عدم تنوع صرفاً یک ویژگی عجیب نیست؛ بلکه محصول جانبی آموزش مدل‌ها بر روی مجموعه‌داده‌های مشابه با هدف اصلیِ به حداکثر رساندن قابلیت اطمینان و انسجام است. OpenAI اذعان کرده است که تلاش برای نوآوری گاهی می‌تواند منجر به پاسخ‌های ضعیف‌تر و کم‌اعتمادتر شود، به همین دلیل است که اکثر مدل‌ها به‌طور پیش‌فرض به سمت خروجی‌های امن و «با احتمال بالا» می‌روند.

ورود Flint: اولویت دادن به تنوع بر پیش‌بینی‌پذیری

استارتاپ استرالیایی Springboards با مدل جدید خود، Flint، این وضعیت موجود را به چالش می‌کشد. برخلاف مدل‌های رایج که به هر قیمتی با توهمات (hallucinations) مبارزه می‌کنند، Pip Bingemann، مدیرعامل Springboards، استدلال می‌کند که درجاتی از واگرایی غیرقابل پیش‌بینی برای وظایف خلاقانه ضروری است.

در آزمایش‌های عملی، تفاوت در توزیع خروجی‌ها بسیار چشمگیر است:

  • تصادفی بودن: وقتی از آن‌ها خواسته شد یک عدد تصادفی ارائه دهند، ChatGPT و Claude اغلب به عدد «7» متمایل شدند، در حالی که Flint اعداد غیر استاندارد و با دقت بالا مانند «3.7916» ارائه داد.
  • برندسازی خلاقانه: وقتی از آن‌ها خواسته شد شعار تبلیغاتی برای New Balance بنویسند، Claude و ChatGPT هر دو عبارت "Run your way" را تولید کردند، در حالی که Flint جایگزین متمایزی ارائه داد: "Built to last, run to win".
  • انتخاب اسم: در حالی که مدل‌های رایج به سمت برندهای «امن» مانند Toyota یا Honda متمایل می‌شوند، Flint طیف گسترده‌تری را نشان می‌دهد و گزینه‌های کمتر قابل پیش‌بینی مانند Ford F-150 را انتخاب می‌کند.

ابزاری خلاق برای متخصصان

Springboards فقط در حال ساخت یک مدل مستقل نیست؛ آن‌ها در حال توسعه ابزاری تخصصی برای متخصصان تبلیغات و بازاریابی هستند. این پلتفرم به کاربران اجازه می‌دهد خروجی‌های چندین مدل — از جمله ChatGPT و Claude — را تجمیع کرده و آن‌ها را برای ترکیب و خلق ایده‌های جدید با هم ادغام کنند. Flint به عنوان یک «منجنیق خلاقیت» در این اکوسیستم عمل می‌کند که به‌طور خاص برای خارج کردن کاربران از چارچوب‌های ذهنی موجودشان طراحی شده است.

Zoe Scaman، مدیر ارشد استراتژی در 77X، خاطرنشان کرد که در حالی که مدل‌های رایج اغلب راهکارهای تکراری و خسته‌کننده را پیشنهاد می‌دهند (مانند «آموزش سواد مالی به روشی سرگرم‌کننده»)، Flint تغییرات رادیکالی در دیدگاه ایجاد می‌کند، مانند پیشنهاد بازسازی کامل برند (rebranding) برای خودِ مفهوم انباشت ثروت.

نکات کلیدی

  • همگنی LLM: مدل‌های بزرگ به دلیل روش‌های آموزشی مشابه، به سمت پاسخ‌های مشابه و قابل پیش‌بینی متمایل می‌شوند و اثر «ذهن جمعی مصنوعی» را ایجاد می‌کنند.
  • رویکرد Flint: مدل Flint از شرکت Springboards، تنوع و واگرایی پاسخ‌ها را در اولویت قرار می‌دهد و آن را برای طوفان فکری و استراتژی خلاقانه، مناسب‌تر از مدل‌های استاندارد می‌کند.
  • تقابل قابلیت اطمینان: صنعت با یک تنش اساسی بین قابلیت اطمینان مدل (ماندن در محدوده احتمالات بالا) و نوآوری خلاقانه (پذیرش خروجی‌های متنوع با احتمال پایین‌تر) روبروست.