Sakana AI تطلق Fugu لتنسيق ذكاء النماذج اللغوية الكبيرة المتعددة (Multi-LLM)

كشفت شركة Sakana AI، التي تتخذ من طوكيو مقراً لها، عن Fugu، وهو منسق متطور للنماذج اللغوية الكبيرة المتعددة (multi-LLM orchestrator) مصمم لتنسيق مجموعة من النماذج المتخصصة لحل المهام المعقدة. ومن خلال العمل كطبقة ذكية واحدة، يهدف Fugu إلى منافسة أداء الشركات الرائدة في الصناعة مثل Anthropic، مع توفير تحوط استراتيجي ضد الارتباط الحصري بمزود خدمة واحد (vendor lock-in).

واجهة موحدة لمجموعة وكلاء قابلة للتبديل

ليس Fugu مجرد نموذج لغوي كبير مستقل آخر؛ بل هو نموذج لغوي مدرب خصيصاً لإدارة "مجموعة وكلاء" (agent pool). بالنسبة للمستخدم النهائي، يعمل النظام ككيان واحد من خلال واجهة برمجة تطبيقات (API) متوافقة مع OpenAI. ومع ذلك، يقوم Fugu داخلياً بدورة معقدة من الاختيار، والتفويض، والتنفيذ، والتحقق، والتركيب. وبناءً على تعقيد الأمر (prompt)، قد يقوم Fugu بحل المشكلة بمفرده أو يستقطب ديناميكياً "فريقاً" من النماذج المتخصصة — بما في ذلك نسخ من نفسه — للتعامل مع عبء العمل.

تقدم Sakana AI نسختين متميزتين لتلبية الاحتياجات المهنية المختلفة:

  • Fugu Base: مُحسّنة لزمن استجابة منخفض والمهام اليومية مثل تفاعلات روبوتات الدردشة ومراجعات الأكواد البرمجية القياسية.
  • Fugu Ultra: مُصممة لتحقيق أقصى جودة في الاستنتاج، وتستهدف سير العمل عالي الأهمية مثل إعادة إنتاج الأوراق العلمية، وتحليل الأمن السيبراني، والبحث عن براءات الاختراع.

التفوق على النماذج الرائدة في الاختبارات المعيارية

إن مقاييس الأداء الخاصة بـ Fugu Ultra مذهلة، مما يضعه في منافسة مباشرة مع نماذج Anthropic المرتقبة بشدة Fable 5 و Mythos Preview. ومن الجدير بالذكر أن Fugu Ultra يحقق هذه النتائج باستخدام مجموعة لا تتضمن نماذج Anthropic، مما يشير إلى إمكانات أعلى بكثير في حال تم دمج تلك الوكلاء.

في اختبارات صارمة، أظهر Fugu Ultra قدرات فائقة عبر العديد من الاختبارات المعيارية التقنية الرئيسية:

  • SWE Bench Pro: حقق Fugu Ultra نتيجة 73.7، متفوقاً بشكل ملحوظ على GPT 5.5 (58.6) و Gemini 3.1 Pro (54.2).
  • LiveCodeBench: وصل Fugu Ultra إلى 93.2، متجاوزاً Opus 4.8 (87.8) و GPT 5.5 (85.3).
  • Humanity's Last Exam: حقق النموذج 50.0، متفوقاً بفارق ضئيل على Opus 4.8 (49.8).
  • GPQA-D: طابق Fugu Ultra المعيار العالي البالغ 95.5.

أفاد مختبرو النسخة التجريبية الأوائل بتحقيق مكاسب هائلة في الكفاءة في المجالات المتخصصة. وأشار أحد المطورين إلى أنه خلال مراجعات الأكواد، حدد Fugu Ultra أكثر من 20 خطأً برمجياً، بينما اكتشف GPT-5.5 حوالي ثلاثة أخطاء فقط.

التخفيف من مخاطر الارتباط الحصري بمزودي خدمات الذكاء الاصطناعي

بعيداً عن الأداء البحت، تضع Sakana AI منتج Fugu كأداة حاسمة للسيادة الرقمية. ففي عصر يمكن أن تؤدي فيه ضوابط التصدير والتحولات التنظيمية إلى تقييد الوصول إلى نماذج معينة فجأة (مثل القيود الأخيرة لشركة Anthropic)، فإن الاعتماد على مزود واحد يمثل ثغرة جوهرية لقطاعات التمويل والحوكمة والبنية التحتية الحيوية.

ولأن Fugu يستخدم مجموعة وكلاء قابلة للتبديل، يمكن للمؤسسات إعادة توجيه سير عملها إلى مزودين مختلفين إذا توقفت إحدى واجهات برمجة التطبيقات (API) عن العمل. ورغم أنه ليس حلاً كاملاً لـ "السيادة في مجال الذكاء الاصطناعي" — حيث يمكن للقيود الواسعة على مستوى الصناعة أن تحد من المجموعة — إلا أنه يوفر طبقة حيوية من المرونة للمؤسسات التي تتطلع إلى تنويع تبعيتها للذكاء الاصطناعي.

النقاط الرئيسية

  • التنسيق الديناميكي: يعمل Fugu كواجهة برمجة تطبيقات (API) واحدة تدير داخلياً فريقاً من النماذج المتخصصة لحل المشكلات المعقدة والمتعددة الخطوات.
  • الهيمنة في الاختبارات المعيارية: ينافس Fugu Ultra بشكل مباشر نماذج Fable 5 و Mythos من Anthropic، ويظهر تفوقاً ملحوظاً في اختبارات البرمجة (SWE Bench Pro) واختبارات الاستنتاج.
  • المرونة الاستراتيجية: تتيح مجموعة النماذج القابلة للتبديل للمستخدمين التخفيف من مخاطر الارتباط بمزود واحد والاضطرابات التنظيمية من خلال تنويع مزودي خدمات الذكاء الاصطناعي.