هندسة الوكيل هي مشكلة تخصيص موارد حوسبية
توصلت ثلاث مجموعات مستقلة مؤخرًا إلى نفس الاستنتاج فيما يتعلق بتصميم وكلاء الذكاء الاصطناعي.
نشرت Anthropic تدوينة حول "استراتيجية المستشار" (advisor strategy). حيث يستخدمون نموذجًا رخيصًا لتشغيل الحلقة الرئيسية، ولا يلجؤون إلى نموذج مكلف إلا عندما يتعثر النموذج الرخيص. حقق هذا الإعداد في BrowseComp دقة بلغت 41.2% بتكلفة تمثل 15% فقط من تكلفة استخدام نموذج من الفئة الأولى لكل شيء.
شارك Tobi Lutke من Shopify إعدادًا مشابهًا على منصة X. فهو يقوم بتشغيل نموذج محلي للبحث ويستخدم نموذجًا رائدًا (frontier model) كمستشار. وقد قام المطورون ببناء نسخ مفتوحة المصدر من هذا الإعداد في غضون ساعات.
نشرت HazyResearch ورقة بحثية حول إطار عمل "المُضغط-المتنبئ" (compressor-predictor framework). حيث يقوم نموذج صغير بتلخيص السياق لنموذج كبير ليقوم بالاستنتاج بناءً عليه. وقد استعاد نظامهم 99% من الدقة بتكلفة بلغت 26% فقط.
هذا التقارب ليس محض صدفة، بل يتبع قانون تصميم محدد: إطار منحنى التكلفة (cost-curve frame).
لقد ناقشت هذا الإطار عبر ثلاث طبقات في هذه السلسلة:
- الطبقة 1 (الاسترجاع): لماذا تتفوق حلقات الأدوات (tool-loops) على RAG في معظم مهام البرمجة.
- الطبقة 2 (التخزين): لماذا يتفوق SQLite على قواعد البيانات المتجهة (vector databases) في الرسوم البيانية للرموز (symbol graphs).
- الطبقة 3 (التنسيق): لماذا تنجح استراتيجية المستشار في اختيار النموذج.
المنطق هو نفسه؛ فمعظم مهام الوكيل تتكون من العديد من العمليات منخفضة القيمة وقليل من القرارات عالية القيمة.
إذا استخدمت نموذجًا مكلفًا لكل رمز (token)، فستبدد الأموال في أعمال روتينية مثل قراءة السياق أو تنسيق النصوص. تفصل استراتيجية المستشار بين هذه المسارات؛ حيث تستخدم منفذًا (executor) رخيصًا للقيام بمعظم العمل، ومستشارًا مكلفًا فقط عند نقاط اتخاذ القرار الحاسمة.
إذا كنت تقوم ببناء وكلاء، فاحذر من هذه التحديات الهندسية الثلاثة:
- خروج البيانات (Data Egress): إرسال السياق إلى مستشار بعيد قد يؤدي إلى تسريب بيانات حساسة. استخدم طبقة تنقيح (redaction layer).
- سياسة التصعيد (Escalation Policy): اتخاذ القرار بشأن متى يتم استدعاء المستشار أمر صعب؛ فالتوقيت المبكر جدًا يهدر المال، والتوقيت المتأخر جدًا يهدر الوقت.
- تصميم عملية التسليم (Handoff Design): يجب أن يقدم المستشار خطة قصيرة، وليس حلاً كاملاً.
هذا النمط حقيقي لأنه فعال. توقف عن دفع أسعار النماذج الرائدة مقابل رموز (tokens) لا تحتاج إليها.
مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi