هل يمكن للذكاء الاصطناعي مقاومة الدعاية الروسية؟ معيار جديد يكشف عن الفائزين
مع تزايد تعقيد حملات التضليل، يبرز سؤال جوهري: هل تستطيع النماذج اللغوية الكبيرة (LLMs) التمييز بين الحقيقة والتلاعب الذي ترعاه الدول؟ قدمت دراسة حديثة أجراها معهد اللغة الإستونية إجابة صارمة، حيث اختبرت قدرة 60 نموذجاً مختلفاً من نماذج الذكاء الاصطناعي على الصمود أمام الدعاية الروسية الموجهة.
المنهجية: اختبار القدرة على الصمود دون الوصول إلى الويب
لضمان أن النتائج تقيس قدرات الاستنتاج المتأصلة في النماذج بدلاً من قدرتها على تصفح الويب المباشر، أجرى الباحثون الاختبارات دون الوصول إلى محركات البحث أو الأدوات الخارجية. استخدم المعيار 75 سؤالاً عبر ثلاث لغات، استهدفت تحديداً 14 رواية دعائية مختلفة. عُرضت هذه الروايات بدرجات متفاوتة من الصعوبة، بدءاً من الصياغة المحايدة وصولاً إلى المطالبات المنحازة والمضللة للغاية.
كانت عملية التقييم منظمة للغاية؛ حيث تم تقييم كل استجابة على مقياس من 1 إلى 5، حيث تشير الدرجة 1 إلى استسلام النموذج وتكراره لنقاط الحديث الروسية. وللحفاظ على دقة عالية، عمل نموذج Claude Opus 4.5 تمت معايرته كحكم، مع التحقق من النتائج بشكل أكبر من قبل خبراء التضليل في منظمة Propastop.
Anthropic تتصدر القائمة في الدفاع ضد التضليل
تسلط النتائج الضوء على فجوة كبيرة في الأداء بين مختلف مزودي الذكاء الاصطناعي. برزت عائلة Claude من Anthropic كقائد في هذا القطاع في مقاومة التضليل. وتحديداً، حقق Claude Fable 5 (المقيد حالياً خارج الولايات المتحدة) أعلى درجة وبفارق كبير بلغت 95.2. وتبعه عن كثب Claude Opus 4.7، مما يعزز مكانة Anthropic كمعيار ذهبي حالي للسلامة والنزاهة الواقعية.
وشملت النماذج البارزة الأخرى Nemotron 3 من Nvidia و Qwen 3.6 Plus من Alibaba، حيث أظهر كلاهما قدرة قوية على تحديد ورفض الروايات التضليلية.
ضعف Mistral والمخاطر التي تواجه الذكاء الاصطناعي الأوروبي
بينما أظهرت النماذج الأمريكية والصينية قوة، كانت النتائج بمثابة انتكاسة لشركة Mistral، القوة الفرنسية في مجال الذكاء الاصطناعي. فقد وقعت نماذج Mistral، بما في ذلك نموذج Medium 3.5 الأخير، في الثلث الأخير من المعيار. وتكرر هذه النتائج ما سجلته دراسة سابقة أجرتها Newsguard، والتي سجلت معدل معلومات مضللة بنسبة 36.67 بالمائة لشركة Mistral.
تكتسب هذه الثغرة أهمية خاصة بالنظر إلى المكانة الاستراتيجية لشركة Mistral. وباعتبارها البديل الأوروبي الرئيسي لمزودي الذكاء الاصطناعي الأمريكيين والصينيين، تخوض الشركة حالياً مفاوضات لجولة تمويل بقيمة 3 مليارات يورو، بتقييم يصل إلى 20 مليار يورو. وبالنسبة لشركة تضع نفسها كمزود موثوق للذكاء الاصطناعي السيادي، فإن عدم القدرة على صد الدعاية بشكل مستمر يمثل تحدياً تقنياً وسمعياً كبيراً.
لماذا يهم هذا مشهد الذكاء الاصطناعي
تتجاوز رهانات هذا الاختبار مجرد درجات الدقة البسيطة. تعمل شبكات التضليل الروسية، مثل "Pravda"، بنشاط على إغراق مجموعات بيانات تدريب الذكاء الاصطناعي بملايين المقالات المفبركة لـ "تسميم" منطق النماذج المستقبلية. ومع قيام OpenAI بالفعل بتحديد وإغلاق حملات روسية استخدمت ChatGPT للتأثير على الانتخابات الفيدرالية الألمانية، أصبحت المعركة من أجل نزاهة نماذج اللغات الكبيرة (LLMs) قضية في الخطوط الأمامية للأمن المعلوماتي العالمي.
أهم الاستنتاجات
- هيمنة Anthropic: أظهرت نماذج Claude، وخاصة Claude Fable 5، مقاومة فائقة للدعاية مقارنة بجميع النماذج الأخرى التي تم اختبارها.
- Mistral تحت الضغط: على الرغم من تقييمها المرتفع وأهميتها الأوروبية، واجهت نماذج Mistral صعوبة كبيرة في التعامل مع المعلومات المضللة، متأخرة عن المنافسين الأمريكيين والصينيين.
- تهديد التدريب: يسلط هذا الاختبار الضوء على الحاجة الملحة لدفاعات قوية، في ظل محاولات الجهات المدعومة من الدول للتلاعب بمخرجات نماذج اللغات الكبيرة (LLMs) من خلال حملات تضليل ضخمة.