𝗣𝗿𝗼𝗺𝗽𝘁𝘀 𝗔𝗿𝗲𝗻'𝘁 𝗘𝗻𝗼𝘂𝗴𝗵: 𝗘𝗻𝗳𝗼𝗿𝗰𝗶𝗻𝗴 𝗛𝗮𝗿𝗱 𝗖𝗼𝗻𝘀𝘁𝗿𝗮𝗶𝗻𝘁𝘀 𝗼𝗻 𝗟𝗟𝗠 𝗢𝘂𝘁𝗽𝘂𝘁

📅3 hours ago⏱2 min read

المطالبات ليست كافية: فرض قيود صارمة على مخرجات النماذج اللغوية الكبيرة (LLM)

تبدو العروض التوضيحية للنماذج اللغوية الكبيرة (LLM) رائعة حتى تواجه متطلبات صارمة.

تعمل النماذج بناءً على الاحتمالات، بينما تحتاج أنظمة الإنتاج إلى ضمانات.

تعلمت هذا أثناء بناء خط معالجة أخبار يعتمد على الذكاء الاصطناعي لإذاعة Radio del Volga في الأرجنتين. يقوم النظام بإعادة كتابة الأخبار وإنشاء منشورات لوسائل التواصل الاجتماعي. كان يعمل بشكل جيد حتى ظهرت مشكلة واحدة: استمر Gemini في الكتابة بالإسبانية الخاطئة.

في الأرجنتين، يستخدم الناس كلمات محددة؛ حيث يقولون "podés" بدلاً من "puedes" و"sos" بدلاً من "eres". إذا استخدم النموذج الإسبانية المحايدة، فسيشعر القراء المحليون بأن النص غير صحيح.

حاولت تحسين المطالبات أولاً، حيث قلت للنموذج:

استخدم الإسبانية الريوبلاتينسية (Rioplatense Spanish).
لا تستخدم الإسبانية المحايدة أبداً.
استخدم قائمة كلمات محددة محظورة.
اقرأ إجابتك مرة أخرى قبل الإرسال.

ساعد هذا، لكنه لم يحل كل شيء. فقد دفعت المصادر الإخبارية الرسمية النموذج للعودة إلى الإسبانية المحايدة. ومهما كتبت في المطالبة، ظلت الأخطاء قائمة.

توقفت عن التعامل مع هذا الأمر كمشكلة مطالبات، وبدأت في التعامل معه كمشكلة تحقق من الصحة (validation).

بعض الأشياء احتمالية، مثل النبرة أو الأسلوب، بينما أشياء أخرى حتمية (deterministic). إذا احتوى النص على "puedes"، فهو خاطئ. لست بحاجة إلى ذكاء اصطناعي لاكتشاف ذلك؛ بل تحتاج إلى كود برمجي بسيط.

أضفت خطوة معالجة لاحقة (post-processing) تعمل بعد انتهاء الذكاء الاصطناعي، حيث تبحث عن كلمات محددة وتستبدلها:

تصبح puedes إلى podés
تصبح tienes إلى tenés
تصبح eres إلى sos

هذه القائمة صغيرة وآمنة. أنا لا أحاول إصلاح اللغة الإسبانية بأكملها، بل أصلح فقط القواعد التي يمكن للكود التحقق منها بيقين.

الدرس لا يتعلق باللغة الإسبانية، بل يتعلق بحدود هندسة المطالبات (prompt engineering).

تحسن المطالبات الأداء، لكنها لا توفر ضمانات. إذا كانت القاعدة ثابتة وقابلة للاختبار، فاستخدم الكود لفرضها.

استخدم النماذج اللغوية الكبيرة (LLMs) لإنشاء نصوص سلسة، واستخدم الكود الحتمي لفرض مصطلحات العلامة التجارية، والصياغة التنظيمية، وقواعد التنسيق.

تقسم الأنظمة الموثوقة المسؤوليات: • النموذج يولد المحتوى. • الكود يفرض القواعد الصارمة. • البشر يتخذون القرار التحريري النهائي.

Source: https://dev.to/zendev2112/prompts-arent-enough-enforcing-hard-constraints-on-llm-output-2hpo

Optional learning community: https://t.me/GyaanSetuAi

𝗣𝗿𝗼𝗺𝗽𝘁𝘀 𝗔𝗿𝗲𝗻'𝘁 𝗘𝗻𝗼𝘂𝗴𝗵: 𝗘𝗻𝗳𝗼𝗿𝗰𝗶𝗻𝗴 𝗛𝗮𝗿𝗱 𝗖𝗼𝗻𝘀𝘁𝗿𝗮𝗶𝗻𝘁𝘀 𝗼𝗻 𝗟𝗟𝗠 𝗢𝘂𝘁𝗽𝘂𝘁

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗦𝗰𝗼𝗿𝗶𝗻𝗴 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀: 𝗗𝗲𝘁𝗲𝗿𝗺𝗶𝗻𝗶𝘀𝘁𝗶𝗰 𝗠𝗲𝘁𝗿𝗶𝗰𝘀 + 𝗮𝗻 𝗟𝗟𝗠 𝗝𝘂𝗱𝗴𝗲