هل تحتاج إلى الذكاء الاصطناعي الأكثر تطوراً لعملك اليومي؟
تصل نماذج ذكاء اصطناعي جديدة كل أسبوع. يتناقش الناس حول المعايير المرجعية ودرجات البرمجة، ونحن جميعاً نشعر بالحماس.
لكنني بدأت في طرح سؤال مختلف: هل تحتاج حقاً إلى النموذج الأكثر تطوراً لمهامك اليومية؟
لقد اختبرت هذا مؤخراً، حيث قارنت بين نموذجين لمهمة إعادة هيكلة الكود (code refactoring).
- كلفت Sonnet ما قيمته 76.1 رصيداً.
- كلفت Haiku ما قيمته 13.3 رصيداً.
كانت Haiku أرخص بمقدار 5.7 مرة. كنت أتوقع أن يفوز النموذج الأغلى ثمناً، لكنه لم يفعل.
أنتجت Haiku نتيجة أفضل؛ فقد قامت بتقسيم الكود إلى ثلاثة ملفات نظيفة، واتبعت معايير البرمجة الخاصة بنا بشكل أفضل من Sonnet. كانت أرخص وأكثر فعالية.
الأكبر والأغلى لا يعني بالضرورة الأفضل.
قدرة النموذج هي جزء واحد فقط من العملية. أنا أستخدم إطار عمل لتطوير الذكاء الاصطناعي (AI development harness) للحصول على نتائج أفضل. يتضمن هذا الإطار ما يلي:
• تعليمات خاصة بالمستودع (Repository) • معايير البرمجة • التوجيه المعماري • سير عمل التطوير • سياق المشروع • توقعات المراجعة
عندما تضع هذه الضوابط، تؤدي النماذج الصغيرة أداءً أفضل. فالنموذج لا يخمن كيف يبدو الكود الجيد، بل البيئة هي التي تخبره بذلك.
معظم المهام الهندسية ليست مشكلات بحثية. فمهام مثل إعادة الهيكلة، أو كتابة الاختبارات، أو إنشاء التوثيق لا تتطلب نموذجاً ضخماً.
توقف عن السؤال عن أي نموذج يمتلك أعلى معيار مرجعي. اسأل هذه الأسئلة بدلاً من ذلك:
- هل اكتملت المهمة؟
- هل النتيجة سهلة الصيانة؟
- هل تتبع معايير المشروع؟
- هل كانت التكلفة تستحق؟
- هل يمكن للفريق توسيع نطاق هذا بشكل رخيص؟
استخدم النموذج الأقل تكلفة الذي يحل مشكلتك.
يركز قطاع الذكاء الاصطناعي على الذكاء، بينما يجب أن تركز أنت على جودة إطار العمل (harness). فالنموذج الذي يكلف أقل بمقدار 5.7 مرة يمكن أن يقدم نتائج أفضل إذا منحته السياق الصحيح.
Optional learning community: https://t.me/GyaanSetuAi