ثلاثة نماذج، ثلاثة آراء، صفر دولار
كنت أدفع 1.50 دولار في كل مرة أطلب فيها رأياً ثانياً من الذكاء الاصطناعي.
كنت أشغل ثلاثة نماذج عدة مرات يومياً. كانت كل عملية تكلف حوالي خمسين سنتاً. في فاتورتي الشهرية، بدا الأمر ضئيلاً، لكن في المجمل، كانت هذه أغلى عاداتي، ولم تكن تنتج أي كود برمجي.
الآن، تلك الآراء الثلاثة نفسها لا تكلفني أي دولار.
أستخدم النماذج نفسها والمطالبات (prompts) نفسها. الفرق يكمن في كيفية توجيهها؛ حيث أرسل طلباتي عبر اشتراكات أدفع ثمنها بالفعل، وهذا لا يضيف شيئاً إلى فاتورتي.
تشغيل ثلاثة نماذج أفضل من تشغيل نموذج واحد. وإليك السبب:
النموذج الواحد ليس أداة تحقق، بل هو صدى.
إذا طلبت من نموذج واحد التحقق من عملك، فغالباً ما سيوافقك الرأي. سيجد طريقة لجعل منطقك يبدو صحيحاً. أنت لا تحصل على مراجعة، بل تحصل على نسخة واثقة من أخطائك الخاصة.
للنماذج نقاط عمياء محددة. وغالباً ما تتجمع هذه الأخطاء حول مورد واحد. إذا استخدمت نموذجين من نفس العائلة، فقد يغفل كلاهما عن الخطأ نفسه.
أستخدم ثلاثة أصوات من سلالتين مختلفتين على الأقل:
• نموذج من فئة GPT • نموذج Claude متوسط المستوى • نموذج Claude رفيع المستوى
أطلب من كل منها حكماً والتعليل وراءه. أنا لا أنظر فقط إلى الإجابة النهائية، بل أقرأ المنطق.
إذا قال نموذجان "نعم" ولكن باستخدام منطق مختلف، فإنني أبحث بعمق أكبر. وإذا اختلفا، فقد وجدت النقطة التي أخطأت فيها بالضبط. أنا لا أتركهم يصوتون، ولا أحسب متوسط إجاباتهم، بل أقرأ مواضع اختلافهم.
لماذا ثلاثة نماذج؟
خمسة نماذج بطيئة جداً. فآخر طلبيْن عادة ما يكرران ما قالته النماذج الثلاثة الأولى. ثلاثة نماذج كافية لكسر التعادل.
توقفت عن التفكير في عدد الـ tokens التي سأستهلكها، وبدأت أفكر في أي اشتراك سأستخدم.
نظام فوترة الـ API جيد للمهام الفردية. ولكن بالنسبة للمراجعات المتكررة، فإن الاشتراك ذو السعر الثابت أفضل؛ فهو يسمح لي بإجراء المراجعات طوال اليوم دون القلق بشأن التكلفة.
المجلس يراجع عملك، لكنه لا يبتكر أفكاراً جديدة. للمشكلات الجديدة تماماً، استخدم نموذجاً واحداً. وللأسئلة اليومية مثل "هل فاتني شيء واضح؟"، استخدم ثلاثة.
ثلاثة نماذج تراجع عملك بدقة أفضل من نموذج واحد يوافقك الرأي.
المصدر: https://dev.to/fillip_kosorukov/three-models-three-opinions-zero-dollars-41im
مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi