الوكيل فعل بالضبط ما طلبته، وكانت هذه هي المشكلة

غيرت وكلاء البرمجة بالذكاء الاصطناعي كل شيء في عام 2024.

إنهم يقرأون قاعدة الكود الخاصة بك. يتبعون أنماط التسمية لديك. ويفهمون مجال عملك.

اعتقدت أن هذا يعني أن المهمة التي تستغرق أسبوعين ستستغرق يومين فقط. لكنني كنت مخطئاً.

أعطيت الوكيل مهمة كبيرة: بناء آلية أحداث عالمية (global event mechanism) لتطبيق React Native. وضعتُ خطة، ووافقتُ عليها.

اتبع الوكيل الخطة بدقة متناهية. وهنا كانت المشكلة.

أغفلت الخطة تفاصيل حاسمة؛ فلم تأخذ في الحسبان المكونات التي يتم تحميلها بشكل مشروط، ولم تحدد مدى التأثير على النظام بأكمله.

حل الوكيل المشكلات الظاهرة، لكنه ترك وراءه مشكلات غير مرئية.

إليكم ما حدث:

• تعطلت واجهة المستخدم (UI) في المناطق التي تجاهلتها الخطة. • أضاف الوكيل معالجات أحداث (event handlers) مكررة. • ابتكر الوكيل أنماطاً جديدة باستخدام Context و Redux لم أطلبها.

لم يفشل الوكيل بسبب كود سيئ، بل فشل بسبب نقص القيود.

عندما لا تضع قاعدة، يقوم الذكاء الاصطناعي بالتخمين، وغالباً ما يكون تخمينه خاطئاً.

حاولت إصلاح الأمر عبر الدردشة. أضفتُ كوداً فوق كود آخر، فأصبح تسلسل الدردشة طويلاً جداً. بدأتُ دردشات جديدة، فتكررت الدورة ذاتها.

بحلول اليوم الثالث، كان الكود قد اكتمل بنسبة 75% ولكنه كان هشاً. لم يكن هناك سجل لما نجح أو ما فشل.

أدركت أن المشكلة لم تكن في الأداة، بل في الدور.

يمكن للذكاء الاصطناعي كتابة الكود، لكنه لا يستطيع تحديد ماهية العمل الفعلي.

المراجعة البشرية تكتشف الأخطاء بعد وقوعها، ولكن يجب أن يحدد الحكم البشري طبيعة العمل قبل بدئه.

أنت لا تحتاج إلى أداة أفضل، بل تحتاج إلى عقد (contract).

قمت ببناء سير عمل مكون من سبع مراحل. يجب على الإنسان الموافقة على كل عملية تسليم قبل بدء المرحلة التالية، وهذا يضمن بقاء العمل ضمن الحدود المحددة.

المصدر: https://dev.to/jeelvankhede/the-agent-did-exactly-what-i-asked-and-that-was-the-problem-1hek

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi