لم تكن مشكلة عنق الزجاجة في وكيل الذكاء الاصطناعي الخاص بي في النموذج، بل في المعمارية.

قبل ثلاثة أشهر، تعطل سير عمل أحد العملاء.

كنت أستخدم وكيلاً واحداً لتصنيف المستندات، ووضع العلامات (tagging)، والتلخيص. كان يعمل بشكل جيد مع 50 مستنداً في اليوم، ولكن عندما وصل الحجم إلى 500 مستند...

استغرق الوكيل 40 دقيقة لكل دفعة. لم يكن قابلاً للتوسع، بل انهار النظام.

لم أنتقل إلى نموذج أكبر، بل قمت بتقسيم الوكيل إلى ثلاثة أدوار متخصصة، وكانت هذه الأدوار تعمل بالتوازي.

انخفض معدل المعالجة من 40 دقيقة إلى 4 دقائق فقط. ظل النموذج كما هو، لكن المعمارية هي التي تغيرت.

يرتكب معظم المطورين خطأ بناء وكلاء تسلسليين؛ حيث يقوم وكيل واحد بكل شيء بالتتابع.

إذا كان لديك 500 مستند وثلاث مهام لكل مستند، فستقوم بإجراء 1500 استدعاء لنموذج اللغة الكبير (LLM) واحداً تلو الآخر. وحتى لو استغرق كل استدعاء ثانيتين فقط، فستنتظر 50 دقيقة. يقضي نموذجك معظم وقته في الانتظار.

الحل هو استخدام وكلاء متخصصين يعملون بشكل متزامن.

  • استخدم مطالبات نظام (system prompts) أصغر وأكثر تركيزاً.
  • قم بتشغيل المهام المستقلة في نفس الوقت.
  • استخدم موزعاً (dispatcher) لإدارة المهام.

الوكلاء المتخصصون أسرع وأرخص. فالنموذج الصغير مع مطالبة دقيقة سيتفوق على نموذج عام كبير في المهام المحددة.

ومع ذلك، لا تجعل كل شيء يعمل بالتوازي. تجنب هذه الأخطاء:

  • لا تجعل المهام التي تعتمد على بعضها البعض تعمل بالتوازي. إذا كانت المهمة (ب) تحتاج إلى مخرجات المهمة (أ)، فيجب عليك تشغيلهما بالترتيب.
  • لا تجعل المهام الصغيرة جداً تعمل بالتوازي؛ فقد يستغرق العبء الإضافي (overhead) لإدارة الوكيل وقتاً أطول من المهمة نفسها.
  • لا تتجاهل سرعة الاسترجاع (retrieval speed). إذا كان نظامك بطيئاً بسبب عمليات البحث في قاعدة البيانات، فإن تشغيل استدعاءات LLM بالتوازي لن يساعد.

اتبع هذه الخطوات للتوسع:

  • قم بتحليل أداء نظامك (Profile) أولاً، واكتشف أين يضيع الوقت فعلياً.
  • استخدم وكلاء متخصصين لأدوار محددة.
  • ارسم مخطط الاعتماديات (dependency graph) الخاص بك قبل كتابة الكود.

بناء وكيل ذكاء اصطناعي يتضمن مشكلتين مختلفتين: الأولى هي ما يفعله الوكيل، والثانية هي كيفية ملاءمة الوكيل لنظامك.

تعتمد أنظمة الإنتاج (Production systems) في بقائها أو انهيارها على المشكلة الثانية.

إذا واجهت حداً أقصى، فلا تكتفِ بشراء نموذج أكبر. ارسم مخطط نظامك أولاً، فقد تجد أن المعمارية هي المشكلة الحقيقية.

Source: https://dev.to/mrclaw207/my-ai-agent-bottleneck-wasnt-the-model-it-was-the-architecture-2h9m

Optional learning community: https://t.me/GyaanSetuAi