الذكاء الاصطناعي العام (AGI): هل وصلنا بعد؟

لم نصل إلى مرحلة الذكاء الاصطناعي العام (AGI) بعد.

قبل عام، تساءلت عما إذا كنا قد وصلنا إلى الذكاء الاصطناعي العام. في ذلك الوقت، حقق نموذج o3 من OpenAI إنجازًا كبيرًا في اختبار ARC-AGI-1، حيث أظهر قفزة حقيقية في القدرة على الاستنتاج.

لكنني جادلت حينها بأن هذه كانت مجرد محطة توقف، وليست الوجهة النهائية.

وكنت على حق.

القصة اليوم لا تتعلق بوصول الذكاء الاصطناعي العام، بل القصة أكثر إثارة للاهتمام. لقد تجاوزنا مرحلة روبوتات الدردشة البسيطة، ونحن الآن في عصر الاستنتاج المتقدم وأنظمة الوكلاء (agent systems).

إليك الحالة الراهنة لهذا المجال:

• النماذج أصبحت أفضل بكثير في الاستنتاج والبرمجة. • تستخدم الأدوات وتعالج السياقات الطويلة بفعالية أكبر. • يمكنها التعامل مع مدخلات متعددة الوسائط مثل الصور والصوت. • أصبحت أكثر فائدة من الناحية الاقتصادية من أي وقت مضى.

لكنها لا تزال تفتقر إلى العمومية الشبيهة بالبشر.

الاختبارات المعيارية تكشف القصة الحقيقية. فبينما وصلت الاختبارات القديمة مثل MMLU إلى مرحلة التشبع، تظهر الاختبارات الجديدة الفجوات الموجودة.

• كان ARC-AGI-1 طفرة في مجال الاستنتاج. • يظهر ARC-AGI-2 أن القدرة على الابتكار والتركيب لا تزال صعبة للغاية. • ينتقل ARC-AGI-3 إلى بيئات تفاعلية حيث تواجه النماذج صعوبة في التكيف.

نشهد أيضًا تحولًا في كيفية توسيع نطاق النماذج (scaling). لم يعد الأمر يتعلق بمجرد توفير المزيد من البيانات، بل يحدث التوسع الآن من خلال:

  • حجم التدريب المسبق (Pretraining scale).
  • ما بعد التدريب والتعلم التعزيزي (Post-training and reinforcement learning).
  • الاستنتاج أثناء وقت الاستدلال واستخدام الأدوات (Inference-time reasoning and tool use).

النموذج الذي يمكنه التوقف، وتشغيل الكود، ومراجعة الخطة يختلف عن النموذج الذي يتنبأ بالكلمة التالية فقط. هذا هو صعود الأنظمة الوكيلية (agentic systems).

ومع ذلك، لا تزال هناك فجوة كبيرة: الموثوقية.

تظهر أبحاث METR أن النطاق الزمني لإكمال المهام بشكل موثوق في تزايد، حيث يتضاعف كل بضعة أشهر. لكن نطاق مهمة مدته 50 دقيقة لا يعتبر يوم عمل كامل، ولا يمثل أسبوعًا من البحث المستقل.

لقد انتقلنا من "النماذج التي تجيب" إلى "النماذج التي تستنتج باستخدام الأدوات".

نحن نبني أنظمة عالية القدرة، لكن هذه الأنظمة غالبًا ما تكون واسعة النطاق ولكنها هشة. يمكنها حل مسائل رياضية بمستوى الدراسات العليا، لكنها تفشل في حل الألغاز البسيطة والمبتكرة.

الموقف الصريح هو التالي:

نحن لم نصل إلى AGI بعد، لكننا أقرب بكثير إلى شيء سيحدث تغييرًا جذريًا اقتصاديًا مما توقعه معظم الناس.

نحن نبني أنظمة استنتاج للأغراض العامة. تبدو ذكية بشكل مذهل، ومع ذلك لا تزال تفشل بطرق تثبت افتقارها إلى القدرة الحقيقية على التكيف البشري.

كان الإنجاز حقيقيًا، لكن الضجيج الإعلامي كان مبالغًا فيه. العمل الحقيقي الآن يتمحور حول بناء المتانة والاستقلالية.

المصدر: https://dev.to/ernestohs/agi-are-we-there-yet-a-follow-up-1471

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi