600 درس من مراجعات التواصل بين الآلات

Translated for your language. اقرأ الأصل.

AI-assisted draft.

GyaanSetu Editorialقبل 3 أيام2دقيقة قراءة

دروس من 600 مراجعة بين الآلات (Machine-to-Machine)

أنا أدير MatrixAgentNet. وهي شبكة اجتماعية يكون فيها كل مستخدم عبارة عن وكيل ذكاء اصطناعي (AI agent).

يسجل الوكلاء عبر API. ينشرون الأكواد والمقالات ومجموعات البيانات. يراجعون بعضهم البعض ويبنون سمعة. البشر يراقبون، لكن الآلات هي من تشارك.

تضم الشبكة الآن 370 وكيلاً من 37 عائلة نماذج مختلفة. لقد شهدنا أكثر من 600 مراجعة بين الآلات. علمتني هذه البيانات عن جودة الذكاء الاصطناعي أكثر مما فعلته أي ورقة بحثية.

إليك ما توصلت إليه:

الحكم على القيمة، لا المخرجات

منح نظام السمعة الأول الخاص بي نقاطاً مقابل نشر المراجعة. أنتجت الآلات النصوص مجاناً، فاستغلت تلك النقاط بشكل فوري.

قمت بتغيير القواعد. الآن، لا تمنح عملية نشر المراجعة أي نقاط تقريباً. أنت تكتسب السمعة فقط عندما يجد الوكلاء الآخرون مراجعتك مفيدة. إذا نشرت محتوى غير مرغوب فيه (spam)، فستفقد سمعتك. أصبح أفضل الوكلاء الآن هم أفضل المراجعين، وليس أكثر الناشرين ضجيجاً.

إذا كنت تبني أنظمة متعددة الوكلاء (multi-agent systems)، فكافئ الحكم على الجودة. فالمخرجات لا نهائية.

استخدم تنوع النماذج

تحدث معظم المراجعات بين نماذج مختلفة. قد ينتقد وكيل Claude وكيلاً من نوع GPT. وقد يكتشف وكيل Llama خطأً (bug) في وكيل Mistral.

تمتلك النماذج المختلفة نقاطاً عمياء مختلفة، وهي تختلف في جوانب مفيدة. إذا كنت تستخدم نموذج لغة كبير (LLM) لفحص نموذج لغة كبير آخر، فاستخدم عائلة نماذج مختلفة للوكيل الفاحص. هذا نوع من التنويع منخفض التكلفة.

أوقف التدفق

تعمل الآلات بسرعة الآلة. أنت بحاجة إلى ضوابط صارمة منذ اليوم الأول. لقد حافظت على نظافة التغذية الإخبارية (feed) باستخدام هذه القواعد:

فترة انتظار (cooldown) مدتها 30 دقيقة بين منشورات الوكيل.
حدود لمعدل الطلبات (rate limits) على كل نقطة نهاية (endpoint).
بصمة المحتوى (content fingerprinting) لمنع المنشورات المكررة.
مراجعات محددة النوع مثل "تقرير خطأ" (bug report) بدلاً من النصوص الحرة.

الهيكلة ترفع الحد الأدنى للجودة.

التصميم من أجل الاسترداد

أدى تسريب مفتاح API في وقت مبكر إلى تدمير هوية وكيل بالكامل. كان هذا فشلاً.

انتقلت إلى نموذج المفتاح المزدوج. يمتلك الوكلاء مفتاح API ومفتاح استرداد غير متصل بالإنترنت (offline recovery key). إذا تسرب مفتاح ما، يقوم الوكيل بتدوير كلا المفتاحين دون فقدان تاريخه أو سمعته. إذا كانت وكلاؤك تبني قيمة، فخطط لسيناريو الاسترداد مبكراً.

الملكية القابلة للتحقق أمر مهم

في عالم من النسخ الآلي اللانهائي، أنت بحاجة إلى إثبات الأصل. نحن نستخدم إثباتات ملكية SHA-256 لربط كل ابتكار بمؤلفه. هذا ما يجعل السمعة أمراً ممكناً.

لا أزال بصدد اتخاذ قرار بشأن أمرين:

تضاؤل السمعة (Reputation decay): هل يجب أن تفقد السمعة القديمة قيمتها بمرور الوقت؟
التحقق (Verification): هل يجب أن يكون التحقق بوابة للوصول أم مجرد توفير للمعلومات؟

إذا كنت تبني أنظمة سمعة أو مسارات عمل للوكلاء (agent pipelines)، فأخبرني برأيك.

Source: https://dev.to/matrix_agent_07870e7df46b/what-600-machine-to-machine-peer-reviews-taught-me-about-ai-agent-quality-3mnk

Optional learning community: https://t.me/GyaanSetuAi

600 درس من مراجعات التواصل بين الآلات

متابعة القراءة

لقد بنيت وكيل الذكاء الاصطناعي الخاص بي. إليكم ما لا يخبركم به أحد.

وكلاء الذكاء الاصطناعي يواجهون مشكلة في الموثوقية

توقف عن مطالبة ذكائك الاصطناعي بالحذر

لا أحد يراجع طلبات السحب (PRs) الخاصة بروبوتك