OpenAI تخفض تكاليف استنتاج ChatGPT لأكثر من 50% للمستخدمين الضيوف

حققت OpenAI طفرة هائلة في الكفاءة التشغيلية من خلال خفض تكاليف الاستنتاج لمستخدمي ChatGPT الضيوف بأكثر من النصف. ويمثل هذا الانخفاض الكبير في تكلفة تشغيل نماذج الذكاء الاصطناعي الحالية خطوة حاسمة في جعل نشر الذكاء الاصطناعي على نطاق واسع أكثر استدامة.

تحسين تجربة الضيوف

وفقًا لتقارير من The Information، نجح مهندسو OpenAI في تنفيذ تحسينات جديدة تستهدف تحديدًا الزوار الذين يستخدمون ChatGPT بدون حساب. وبينما يتفاعل المستخدمون الضيوف حاليًا مع مجموعة محدودة من الميزات مقارنة بمشتركي Plus أو Team، فإن التأثير على متطلبات الأجهزة كان عميقًا.

أدت الكفاءة التقنية المكتسبة من خلال هذه التحسينات إلى تقليل عدد وحدات معالجة الرسومات (GPUs) من Nvidia المطلوبة لخدمة هؤلاء المستخدمين تحديدًا إلى بضع مئات فقط. وبينما تظل المنهجية الدقيقة المستخدمة لتحقيق هذه المكاسب ملكية خاصة، فإن حجم الانخفاض يشير إلى قفزة كبيرة في كيفية إدارة OpenAI لأعباء عمل الاستنتاج كثيفة الحوسبة.

السباق نحو كفاءة الاستنتاج

يأتي هذا التطور في لحظة محورية للصناعة، حيث تظل تكلفة الحوسبة العالية هي العائق الرئيسي أمام توسيع خدمات الذكاء الاصطناعي. OpenAI ليست اللاعب الوحيد الذي يركز على "حد الكفاءة" هذا. مؤخرًا، أصدرت DeepSeek طريقة جديدة مفتوحة المصدر قادرة على تسريع طلبات الاستنتاج بنسبة تتراوح بين 60% إلى 85%.

ومع اشتداد المنافسة، ينتقل التركيز من مجرد بناء نماذج أكبر إلى بناء طرق أذكى وأكثر فعالية من حيث التكلفة لتشغيلها. بالنسبة لمختبرات الذكاء الاصطناعي، فإن كل نقطة مئوية يتم توفيرها في تكاليف الاستنتاج تترجم مباشرة إلى "مساحة للتنفس" — وهي موارد إضافية يمكن إعادة توجيهها نحو تدريب نماذج الجيل القادم، أو تحسين زمن الاستجابة، أو زيادة هوامش الربح.

التأثير على مشهد الذكاء الاصطناعي الأوسع

وبينما تنطبق هذه التحسينات حاليًا على مجموعة فرعية محدودة من المنتج، إلا أنها تشير إلى تحول أوسع في استراتيجية الذكاء الاصطناعي. ومع كفاح عمليات بناء مراكز البيانات لمواكبة الطلب المتزايد بشكل هائل على الحوسبة، أصبحت التحسينات على مستوى البرمجيات حيوية تمامًا مثل توسيع الأجهزة.

إذا تمكنت OpenAI من نقل تقنيات توفير الاستنتاج هذه بنجاح من واجهة الضيوف إلى منتج ChatGPT الكامل، فقد يغير ذلك اقتصاديات الذكاء الاصطناعي الاستهلاكي بشكل جذري. بالنسبة للمطورين والمؤسسين، يسلط هذا الضوء على اتجاه متزايد: لن تكون شركات الذكاء الاصطناعي الأكثر نجاحًا هي تلك التي تمتلك أكبر عدد من المعلمات (parameters) فحسب، بل تلك التي تمتلك أكثر مسارات الاستنتاج كفاءة.

النقاط الرئيسية

  • خفض كبير في التكاليف: أفادت التقارير أن OpenAI خفضت تكاليف الاستنتاج لمستخدمي ChatGPT الذين لا يملكون حسابات بنسبة تزيد عن 50% من خلال تحسينات هندسية جديدة.
  • كفاءة الأجهزة: أدت عملية التحسين إلى تقليل البصمة المطلوبة من وحدات معالجة الرسومات Nvidia لخدمة المستخدمين الضيوف بشكل كبير لتصل إلى بضع مئات من الوحدات فقط.
  • اتجاه الصناعة: مع بقاء إمدادات الأجهزة قيدًا، تتحول الصناعة نحو اختراقات سرعة الاستنتاج، متبعةً تحركات كفاءة مماثلة من المنافسين مثل DeepSeek.