الرئيس التنفيذي لشركة Snowflake: نموذج GLM-5.2 ينافس Claude Opus 4.7 بجزء بسيط من التكلفة
أحدث اختبار أداء عملي أجرته Snowflake موجات من الصدمة في صناعة الذكاء الاصطناعي، حيث كشف أن نموذج GLM-5.2 الصيني يمكنه منافسة النماذج الغربية رفيعة المستوى في مهام البرمجة المتخصصة. وبينما يحافظ Claude Opus 4.7 على تفوق تقني، فإن التفاوت الهائل في الأسعار يشير إلى تحول وشيك في اقتصاديات النماذج اللغوية الكبيرة (LLMs).
اختبار الأداء: تكافؤ في البرمجة ضمن بيئات معقدة
قاد Sridhar Ramaswamy، الرئيس التنفيذي لشركة Snowflake، اختباراً صارماً تضمن 103 مهام مختلفة صُممت لتقييم توليد الكود عبر بيئتي DuckDB وSnowflake. كانت النتائج متقاربة بشكل مفاجئ: فعند إعطاء ثلاث محاولات لكل مهمة، نجح GLM-5.2 في حل 66% من المهام، متأخراً بفارق ضئيل فقط عن Claude Opus 4.7 الذي حقق نسبة نجاح بلغت 67%.
ومع ذلك، تكشف تفاصيل الأداء عن فجوة في الموثوقية. فقد أظهر Opus 4.7 اتساقاً فائقاً بدقة بلغت 53.7% من المحاولة الأولى، مقارنة بـ 47.6% لنموذج GLM-5.2. كما أظهر النموذج الصيني ميلاً إلى "الإفراط في التفكير" أو الدخول في حلقات من العمليات غير الضرورية. في إحدى الحالات البارزة، نفذ GLM-5.2 ما مجموعه 411 استدعاءً للأدوات (tool calls) على مدار 24 دقيقة — شملت التحقق من عدد الصفوف، والتوزيعات، والقيم الفارغة (null values) — ومع ذلك فشل في جميع المحاولات الثلاث. وفي المقابل، حل Opus 4.7 المهمة نفسها في 9 دقائق فقط وبـ 49 استدعاءً فقط.
اقتصاديات الذكاء الاصطناعي: ضغوط الأسعار الصينية
بينما يعد Opus 4.7 النموذج الأكثر كفاءة واتساقاً، فإن القصة الحقيقية تكمن في اقتصاديات الوحدة. إن فرق التكلفة بين النماذج الغربية الرائدة وGLM-5.2 مذهل، وقد يغير بشكل جذري حسابات عائد الاستثمار (ROI) لعمليات نشر الذكاء الاصطناعي في المؤسسات.
وفقاً لأسعار Zhipu الرسمية، تبلغ تكلفة GLM-5.2 نحو 1.40 دولار لكل مليون رمز إدخال (input tokens) و4.40 دولار لكل مليون رمز إخراج (output tokens). ولتوضيح الصورة:
- Claude Opus 4.7: 5.00 دولار (إدخال) / 25.00 دولار (إخراج)
- GPT-5.5: 5.00 دولار (إدخال) / 30.00 دولار (إخراج)
وعلى الرغم من أن GLM-5.2 "أكثر استهلاكاً للرموز" (token-hungry) — حيث يبلغ متوسط عدد مرات التشغيل 99 مرة لكل مهمة مقارنة بـ 80 مرة لنموذج Opus، ويستهلك 860 مليون رمز مقابل 439 مليون رمز لنموذج Opus — إلا أنه يظل بأسعار معقولة بشكل كبير. ويشكل نموذج التسعير هذا تحدياً مباشراً لاستراتيجيات الهوامش الربحية العالية التي تتبعها حالياً شركتا OpenAI وAnthropic.
لماذا يهم هذا مشهد الذكاء الاصطناعي
إن ظهور نماذج منخفضة التكلفة وعالية القدرة مثل GLM-5.2 يعمل بمثابة اختبار جهد لـ "فقاعة الذكاء الاصطناعي". فالتصنيفات الضخمة لمختبرات الذكاء الاصطناعي الغربية مبنية على افتراض النمو السريع للإيرادات ذات الهوامش الربحية العالية. وإذا تحول المطورون والمؤسسات نحو بدائل أرخص بكثير للمهام عالية التكرار مثل البرمجة وهندسة البيانات، فقد تواجه تدفقات الإيرادات المتوقعة للنماذج الرائدة انكماشاً كبيراً.
ومع استعداد Snowflake لإتاحة GLM-5.2 لعملائها، يتجه القطاع نحو واقع لم يعد فيه "الذكاء" سلعة فاخرة، بل خدمة أساسية متاحة للجميع (commoditized utility).
أهم النقاط المستخلصة
- التكافؤ التنافسي: حقق GLM-5.2 نسبة نجاح بلغت 66% في اختبارات البرمجة المعقدة لـ Snowflake/DuckDB، مقترباً جداً من نسبة 67% التي حققها Claude Opus 4.7.
- فجوة الكفاءة: رغم قدرة GLM-5.2 العالية، إلا أنه أقل كفاءة، حيث يتطلب المزيد من استدعاءات الأدوات واستهلاكاً أعلى للرموز للوصول إلى الحلول.
- الاضطراب الاقتصادي: يوفر GLM-5.2 تسعيراً لرموز الإخراج يبلغ حوالي 1/5 إلى 1/7 من تكلفة Claude Opus 4.7 أو GPT-5.5، مما يخلق ضغوطاً سعرية شديدة على مزودي الذكاء الاصطناعي الغربيين.
