Anthropic تطلق Claude Sonnet 5 لتعزيز وكلاء الذكاء الاصطناعي منخفضي التكلفة

أطلقت Anthropic رسميًا Claude Sonnet 5، وهو نموذج متوسط الحجم تم تصميمه خصيصًا لسد الفجوة بين التفكير عالي المستوى والتنفيذ الذاتي منخفض التكلفة. ومن خلال إعطاء الأولوية للقدرات "الوكيلية" (agentic)—أي القدرة على استخدام الأدوات، والتخطيط، والتكرار—تضع Anthropic نموذج Sonnet 5 كمحرك أساسي للمطورين الذين يبنون سير عمل مؤتمتًا.

التحول نحو الذكاء الوكيلي

في سباق التسلح الحالي في مجال الذكاء الاصطناعي، يتجاوز القطاع مرحلة روبوتات الدردشة البسيطة نحو الوكلاء المستقلين. ويأتي إصدار Anthropic في أعقاب تحركات مماثلة من OpenAI مع GPT-5.6 Sol ومن Google مع Gemini 3.5 Flash، مما يشير إلى أن الأداء الوكيلي أصبح هو المعيار الجديد.

تم تصميم Claude Sonnet 5 ليعمل كمشغل مستقل، قادر على استخدام المتصفحات وواجهات السطر البرمجي (terminals) لتنفيذ مهام متعددة الخطوات. وبخلاف الإصدارات السابقة التي قد تتوقف أثناء التسلسلات المعقدة، يُظهر Sonnet 5 قدرة فريدة على "التحقق من مخرجاته الخاصة" وإكمال سير العمل من البداية إلى النهاية. على سبيل المثال، لاحظ مهندسو Zapier أن النموذج أتم بنجاح مهمة مكونة من جزأين—تحديث فئات حسابات Salesforce وإرسال إعلانات إطلاق المؤسسات—وهي عملية كانت تتسبب سابقًا في فشل النماذج السابقة في منتصف الطريق.

معايير الأداء: مضاهاة العمالقة

على الرغم من أن Sonnet 5 نموذج متوسط الحجم، إلا أن مقاييس أدائه تقترب من مقاييس النموذج الرائد لشركة Anthropic، وهو Opus 4.8. وفي معايير البرمجة الوكيلية، سجل Sonnet 5 نسبة 63.2%، وهي أعلى بكثير من سلفه Sonnet 4.6 (58.1%)، ويتخلف قليلاً فقط عن Opus 4.8 (69.2%).

ومن المثير للاهتمام أنه في معايير أعمال معرفية محددة، تفوق Sonnet 5 فعليًا على Opus 4.8. وهذا يجعله خيارًا عالي الكفاءة للمطورين الذين يحتاجون إلى تفكير عميق دون التكلفة الباهظة للنماذج من الفئة الأولى. وتشير Anthropic إلى أنه بينما يظل Opus 4.8 هو المعيار للدقة القصوى والتقدير الدقيق، فإن Sonnet 5 يوفر التوازن المثالي بين الجودة والتكلفة للأتمتة اليومية.

تسعير تنافسي ومعايير سلامة

لتعزيز الاعتماد عليه، قدمت Anthropic هيكل تسعير تنافسي. وحتى 31 أغسطس، تم تحديد سعر Sonnet 5 بـ 2 دولار لكل مليون رمز إدخال (input tokens) و10 دولارات لكل مليون رمز إخراج (output tokens). وبعد هذه الفترة، ستتعدل الأسعار لتصبح 3 دولارات لكل مليون رمز إدخال و15 دولارًا لكل مليون رمز إخراج. وهذا التموضع يجعل Sonnet 5 أكثر توفيرًا من GPT-5.5 من OpenAI وGemini 3.1 Pro من Google، رغم أنه يظل أغلى من Gemini 3.5 Flash.

وتعد السلامة أمرًا بالغ الأهمية بنفس القدر في عمليات النشر الوكيلية، حيث تكون قدرة النموذج على رفض الأوامر الضارة أمرًا أساسيًا. يُظهر Sonnet 5 انخفاضًا في معدل "السلوكيات غير المرغوب فيها"، مثل الخداع أو التعاون في إساءة الاستخدام، مقارنة بـ Sonnet 4.6. كما أظهر مرونة محسنة ضد هجمات حقن الأوامر (prompt-injection attacks) ومعدلًا أقل من السلوك المتملق (sycophantic behavior)، مما يجعله شريكًا أكثر موثوقية للمطورين الذين ينشرون أدوات لملايين المستخدمين.

النقاط الرئيسية

  • التركيز الوكيلي: تم تحسين Sonnet 5 للمهام المستقلة، بما في ذلك استخدام الأدوات (المتصفحات/واجهات السطر البرمجي) والتصحيح الذاتي، مما يجعله مثاليًا للأتمتة المعقدة.
  • كفاءة التكلفة: يوفر النموذج بديلًا عالي الأداء ومنخفض التكلفة للنماذج الرائدة مثل Opus 4.8 وGPT-5.5 وGemini 3.1 Pro.
  • سلامة محسنة: تجعل التحسينات الكبيرة في رفض الطلبات الضارة ومقاومة حقن الأوامر منه أكثر أمانًا لسير العمل الوكيلي.