چرا مدل‌های زبانی بزرگ (LLMs) در تقلید از تنوع فکری انسان در استدلال‌ها دچار مشکل می‌شوند؟

با ادغام روزافزون مدل‌های زبانی بزرگ (LLMs) در فرآیند تولید محتوا، یک پرسش حیاتی مطرح می‌شود: آیا واقعاً می‌توانیم متن تولیدشده توسط ماشین را از نوشته‌های انسانی تشخیص دهیم؟ مکس اسپرو (Max Spero)، مدیرعامل استارتاپ تشخیص متن هوش مصنوعی Pangram، معتقد است که پاسخ نه در دستور زبان، بلکه در فقدان ذاتی تنوع شناختی در مدل‌های هوش مصنوعی نهفته است.

«مشکل یکنواختی» در استدلال هوش مصنوعی

یکی از بزرگ‌ترین نقص‌های مدل‌های زبانی بزرگ فعلی، تمایل آن‌ها به خوشه‌بندی آماری است. در حالی که یک هوش مصنوعی ممکن است از نظر دستور زبان بی‌نقص و منطق رسمی از یک انسان معمولی پیشی بگیرد، اما فاقد «وسعت استدلالی» است که معرف هوش انسانی است. به گفته اسپرو، اگر از یک LLM بخواهید ۱۰۰ استدلال متفاوت درباره یک موضوع واحد ارائه دهد، خروجی‌ها ناگزیر در یک محدوده باریک و قابل پیش‌بینی خوشه‌بندی خواهند شد.

در مقابل، چشم‌انداز تفکر انسانی وسیع و آشفته است. انسان‌ها برای ساختن دیدگاه‌های خود از تجربیات زندگی منحصربه‌فرد، ظرافت‌های فرهنگی و منطق غیرمتعارف بهره می‌گیرند. LLMها که برای پیش‌بینی محتمل‌ترین توکن بعدی آموزش دیده‌اند، به سمت «مرکز» یک توزیع جذب می‌شوند؛ این امر منجر به الگوی تکراری از استدلال می‌شود که ماهیت مصنوعی آن‌ها را برای طبقه‌بندهای (classifiers) پیشرفته قابل شناسایی می‌کند.

Pangram چگونه الگوهای ماشینی را شناسایی می‌کند

Pangram از یک طبقه‌بند یادگیری عمیق استفاده می‌کند که برای شناسایی این امضاهای ساختاری ظریف طراحی شده است. جالب اینجاست که اسپرو فناوری خودِ Pangram را یک «جعبه سیاه» توصیف می‌کند و خاطرنشان می‌سازد که این مدل الگوهایی را شناسایی می‌کند که حتی سازندگانش نیز نمی‌توانند آن‌ها را به‌طور کامل تفسیر کنند. اگرچه این ابزار می‌تواند عبارات مشکوک خاصی را به عنوان نشانه آشکار کند، اما قدرت واقعی آن در شناسایی قالب‌های ساختاری زیربنایی است که LLMها هنگام سازماندهی یک سند از خود به جای می‌گذارند.

این قالب‌ها، اثرانگشت‌های دیجیتالیِ احتمال هستند. از آنجایی که LLMها برای انسجام و ساختار استاندارد بهینه‌سازی شده‌اند، مسیرهای سازماندهی را دنبال می‌کنند که از نظر آماری برای یک نویسنده انسانی غیرمحتمل است؛ نویسنده‌ای که ممکن است بین ایده‌ها پرش کند یا از گذارهای غیرخطی استفاده نماید.

آینده تشخیص هوش مصنوعی و سلامت محتوا

این تحول نشان‌دهنده یک رقابت تسلیحاتی رو به رشد در فضای هوش مصنوعی است. با تکامل مدل‌های مولد و پیچیده‌تر شدن آن‌ها، تطبیق ساده الگوها ممکن است دیگر کافی نباشد. برای اینکه واقعاً بتوان طبقه‌بندهای پیشرفته‌ای مانند Pangram را «فریب» داد، توسعه‌دهندگان باید از تولید متن مبتنی بر احتمال فراتر رفته و به سمت مدل‌هایی حرکت کنند که قادر به تنوع استدلالی واقعی باشند.

برای بنیان‌گذاران و توسعه‌دهندگانی که در حوزه هوش مصنوعی مولد فعالیت می‌کنند، این یک هشدار فنی است: مسیر رسیدن به هوش مصنوعی در «سطح انسانی»، چیزی فراتر از دستور زبان بهتر می‌طلبد؛ این مسیر نیازمند توانایی گسستن از میانگینِ قابل پیش‌بینی و پذیرش تنوع پرآشوبِ تفکر انسانی است.

نکات کلیدی

  • خوشه‌بندی آماری: LLMها تمایل دارند استدلال‌هایی تولید کنند که در یک محدوده باریک خوشه‌بندی می‌شوند، در حالی که استدلال انسانی با تنوع بالا و غیرقابل پیش‌بینی بودن شناخته می‌شود.
  • اثرانگشت‌های ساختاری: تشخیص‌دهنده‌های متن هوش مصنوعی مانند Pangram، محتوای تولیدشده توسط ماشین را از طریق شناسایی الگوهای ساختاری عمیق و قالب‌های سازماندهی که توسط مدل‌های احتمالی به جای گذاشته شده‌اند، شناسایی می‌کنند.
  • شکاف منطقی: اگرچه LLMها ممکن است در منطق رسمی و دستور زبان عالی عمل کنند، اما فقدان تنوع شناختی باعث می‌شود که از طریق یکنواختی ذاتی خود، در معرض شناسایی قرار گیرند.