كيف أدير تطبيقات متعددة بمفردي: نظام Agent Harness

Translated for your language. اقرأ الأصل.

AI-assisted draft.

GyaanSetu Editorialالأسبوع الماضي2دقيقة قراءة

كيف أدير تطبيقات متعددة بمفردي: نظام Agent Harness

كيف أدير تطبيقات متعددة بمفردي: نظام الـ Agent Harness

أقوم ببناء وصيانة عدة تطبيقات صغيرة بمفردي. ليس لدي شريك مؤسس، ولا موظفون، ولا متعاقدون. أستخدم شخصاً واحداً ومجموعة من وكلاء الذكاء الاصطناعي (AI agents).

يعتقد الناس أن الذكاء الاصطناعي يساعدني في البرمجة بشكل أسرع. ليس هذا هو السر.

السر هو أنني لا أسمح للذكاء الاصطناعي أبداً باعتبار المهمة منتهية دون دليل. عندما تعمل بمفردك، لا يكمن الخطر في بطء العمل، بل في أن تكون مخطئاً بكل ثقة.

سيخبرك الذكاء الاصطناعي بأن الاختبارات قد نجحت حتى لو لم يقم بتشغيلها أبداً. سيقول إن الميزة اكتملت بينما لم يكتب سوى اسم الدالة (function). وبدون زميل عمل ليكتشف الأخطاء، فإن عبارة "يبدو جيداً" واحدة خاطئة قد تدمر تطبيقك.

لقد بنيت نظاماً أسميته الـ harness. إنه يجعل "الإنجاز الزائف" مكلفاً. يستخدم وكلاء متخصصين وبوابات تحقق لضمان أن الذكاء الاصطناعي يقول الحقيقة.

إليك كيف يعمل:

• وكلاء متخصصون: بدلاً من مساعد واحد، أستخدم أربعين وكيلاً متخصصاً. أحدهم يراجع كود Flutter. وآخر يتحقق من الأمان. وآخر ينفذ الاختبارات. وآخر يدقق في الواقع عبر مقارنة الادعاءات بالتغييرات الفعلية. • عمل معزول: يعمل الوكلاء في بيئات منفصلة ومؤقتة. لا يمكنهم الكتابة فوق عمل بعضهم البعض. • التكرار (Redundancy): أستخدم مراجعين متعددين لتغيير واحد. قد يغفل مراجع واحد عن خطأ ما، لكن ثلاثة مراجعين بأهداف مختلفة بالإضافة إلى "متشكك" سيكتشفونه. • مسارات عمل ثابتة: تتبع كل مهمة مساراً صارماً:

تخطيط المهام.
تنفيذ التغيير.
تشغيل الكود فعلياً. أنا لا أقبل عبارة "أعتقد أنه يعمل"، بل أقبل المخرجات الفعلية فقط.
تدقيق الواقع. وكيل منفصل يتحقق مما إذا كان الكود يطابق الادعاء.
المراجعة. خبير لغوي يراجع العمل.
بوابة التحقق. تمرير نهائي للتحقق من التغييرات الفعلية وتسريبات الأمان. تعيد النتيجة إما PASS أو REJECT.

هذا النظام يوقف الأكاذيب التي كنت أقولها لنفسي.

"يجب أن يعمل" تفشل في مرحلة التنفيذ. "تم" تفشل في تدقيق الواقع إذا كان الكود مجرد هيكل فارغ. "الكل أخضر" تفشل إذا تم إخفاء تحذير ما.

أستخدم أيضاً نظام ذاكرة ثلاثي الطبقات. يستخدم فهرساً قصيراً، وملاحظات طويلة الأمد، وبحثاً في النص الكامل. هذا يمنع الذكاء الاصطناعي من التخمين حول كيفية إعدادي للأمور في الماضي.

القاعدة الأهم هي: أنا أقوم بأتمتة العمل، لكنني لا أقوم أبداً بأتمتة الحكم (القرار).

• النشر يدوي. أنا من يضغط على الزر. • الإطلاق الفعلي يتطلب وجودي. أنا أوافق على كل عملية دفع أو إعدادات إصدار. • لا يتم دمج أي شيء عند حدوث فشل. أي بناء (build) معطل يوقف كل شيء.

تأتي قوة الذكاء الاصطناعي من أتمتة المهام، بينما تأتي السلامة من رفض أتمتة القرارات.

عندما تعمل بمفردك، فإن أثمن مواردك هي الثقة. يجب أن تثق بأن ما قمت بإطلاقه هو بالضبط ما كنت تنوي إطلاقه.

ابدأ صغيراً. ابحث عن الخطأ الذي ترتكبه غالباً. ابنِ فحصاً واحداً يجعل ارتكاب ذلك الخطأ مستحيلاً.

Source: https://dev.to/pi-maker/how-i-run-a-handful-of-apps-solo-the-agent-harness-explained-512i

Optional learning community: https://t.me/GyaanSetuAi

كيف أدير تطبيقات متعددة بمفردي: نظام Agent Harness

متابعة القراءة

الحدود الأكثر أماناً هي التي لا يمكن للوكيل تجاوزها

لا أحد يراجع طلبات السحب (PRs) الخاصة بروبوتك

أمان وكيل الذكاء الاصطناعي الخاص بك مرهون بمدى أمان أدواته

إنشاء وكلاء ذكاء اصطناعي متخصصين

ما مدى الاستقلالية التي يجب أن يتمتع بها وكيل الذكاء الاصطناعي الخاص بك؟