بحران قابلیت اطمینان تشخیص هوش مصنوعی: برخی ابزارها موفق هستند، برخی دیگر کاملاً شکست می‌خورند

مطالعه‌ای اخیر توسط Authors Guild تفاوت فاحشی را در قابلیت اطمینان ابزارهای تشخیص متن هوش مصنوعی آشکار کرده است؛ این مطالعه نشان می‌دهد که در حالی که برخی ابزارها بسیار دقیق هستند، برخی دیگر اساساً دارای نقص هستند. این بی‌ثباتی تهدیدی جدی برای نویسندگان حرفه‌ای محسوب می‌شود که امرار معاش آن‌ها به اثبات انسانی بودن آثارشان بستگی دارد.

شکاف عملکرد: از کمال تا شکست مطلق

Authors Guild آزمون سخت‌گیرانه‌ای را با استفاده از ده مقاله منتشر شده بین سال‌های ۲۰۲۰ تا ۲۰۲۲ انجام داد؛ یعنی سال‌ها پیش از آنکه هوش مصنوعی مولد به یک پدیده رایج تبدیل شود. این مطالعه با استفاده از متن‌های انسانی «پیش از عصر هوش مصنوعی»، یک معیار پایه و شفاف برای اندازه‌گیری نرخ مثبت کاذب (false positive) فراهم کرد.

نتایج بسیار متضاد بود. Pangram و Grammarly به عنوان قابل‌اعتمادترین ابزارها ظاهر شدند و تمام متن‌های نوشته شده توسط انسان را به درستی انسانی تشخیص دادند (امتیاز هوش مصنوعی ۰.۰٪). Originality.ai نیز عملکرد قدرتمندی داشت و دقت بالای خود را در تمام موارد حفظ کرد.

در مقابل، Sidekicker.ai با شکستی فاحش مواجه شد. تک‌تک مقالات انسانی در این آزمایش با برچسب «عمدتاً تولید شده توسط هوش مصنوعی» مشخص شدند و دو مقاله خاص امتیاز ۱۰۰٪ هوش مصنوعی دریافت کردند. ZeroGPT نیز غیرقابل‌اعتماد بود و مکرراً درصد بالای هوش مصنوعی را برای متن‌هایی گزارش می‌کرد که بدون شک توسط انسان نوشته شده بودند؛ مانند مقاله «Erdrich Pulitzer Prize» که این ابزار احتمال هوش مصنوعی بودن آن را ۷۶.۳٪ اعلام کرد.

پارادوکس نویسندگی حرفه‌ای

این مطالعه یک پارادوکس فنی نگران‌کننده را برجسته می‌کند: هرچه یک نویسنده انسانی ماهرتر باشد، احتمال اینکه توسط ابزارهای تشخیص معیوب علامت‌گذاری شود بیشتر است. نویسندگی حرفه‌ای بر وضوح، ایجاز و دقت تکیه دارد؛ یعنی دقیقاً همان الگوهای آماری که مدل‌های زبانی بزرگ (LLMs) برای تقلید از آن‌ها آموزش دیده‌اند.

از آنجایی که مدل‌های هوش مصنوعی بر اساس نثر باکیفیت انسانی آموزش دیده‌اند، «اثر انگشت» یک جمله که استادانه نوشته شده است، می‌تواند تقریباً مشابه یک جمله تولید شده توسط هوش مصنوعی به نظر برسد. این امر محیطی پرخطر ایجاد می‌کند که در آن، نویسنده‌ای که دهه‌ها صرف صیقل دادن مهارت خود کرده است، ممکن است به دلیل یک تشخیص مثبت کاذب از سوی ابزاری مانند Sidekicker، قراردادهای خود را از دست بدهد یا به اعتبارش آسیب ببیند.

مشکل «جعبه سیاه» و آینده تشخیص

حتی ابزارهای موفق نیز با انتقاداتی در مورد شفافیت روبرو هستند. Max Spero، مدیرعامل Pangram، خاطرنشان کرد که تشخیص‌دهنده او اساساً مانند یک «جعبه سیاه» عمل می‌کند، به این معنی که نمی‌تواند توضیح دقیقی ارائه دهد که چرا یک متن خاص علامت‌گذاری شده است. اگرچه او استدلال می‌کند که انسان‌ها با تنوع و ساختار استدلالی بیشتری نسبت به یکنواختیِ یک LLM می‌نویسند، اما نبودِ قابلیت تفسیر همچنان مانعی برای پاسخگویی است.

علاوه بر این، موفقیت Pangram و Grammarly در این آزمایش عمدتاً ثابت می‌کند که آن‌ها در اجتناب از مثبت کاذب (عدم علامت‌گذاری انسان‌ها) خوب عمل می‌کنند. این لزوماً تضمین نمی‌کند که آن‌ها در گرفتن هوش مصنوعی (شناسایی متن ماشینی) نیز به همان اندازه مؤثر باشند.

در حالی که این صنعت برای تمایز میان «استفاده از هوش مصنوعی برای نوشتن» و «استفاده از هوش مصنوعی برای فکر کردن» در تلاش است، Authors Guild هشدار می‌دهد که ابزارهای تشخیص هرگز نباید تنها مبنای تصمیم‌گیری‌های حرفه‌ای باشند.

نکات کلیدی

  • تفاوت فاحش در دقت: در حالی که Pangram و Grammarly در این آزمایش به نرخ مثبت کاذب ۰٪ دست یافتند، Sidekicker.ai تمام متن‌های انسانی (۱۰۰٪) را به عنوان تولید شده توسط هوش مصنوعی علامت‌گذاری کرد.
  • جریمه حرفه‌ای: نوشته‌های انسانی باکیفیت و دقیق، شباهت‌های آماری با خروجی هوش مصنوعی دارند و همین امر نویسندگان خبره را در برابر خطاهای تشخیص آسیب‌پذیر می‌کند.
  • لزوم نظارت انسانی: Authors Guild به ناشران توصیه می‌کند که از ابزارهای تشخیص تنها به عنوان ابزارهای مکمل استفاده کنند و به نویسندگان فرصتی برای دفاع از آثارشان بدهند.