هندسة الأوامر (Prompt Engineering) للبيانات الاصطناعية

يعد استخدام النماذج اللغوية الكبيرة (LLMs) لإنشاء بيانات اصطناعية استراتيجية شائعة لفرق ضمان الجودة (QA). يمكنك إنشاء مئات السجلات المعقدة في ثوانٍ معدودة.

لكن الأوامر العامة تقع في فخ؛ فإذا طلبت من نموذج لغوي كبير "إنشاء 50 مستخدماً للاختبار"، فسيمنحك بيانات متوقعة ومتكررة. وهذا يخلق شعوراً زائفاً بالتغطية، حيث تحصل على العديد من السجلات التي تختبر فقط "المسار المثالي" (happy path) بينما تغفل عن حالات الحواف (edge cases) الحرجة ومنطق العمل (business logic).

ولإصلاح ذلك، يجب أن تنتقل من كونك مجرد "طالب" إلى "منسق". عليك تطبيق مبادئ الاختبار مباشرة على هندسة الأوامر الخاصة بك.

استخدم هذه الأنماط الثلاثة لتحسين جودة بياناتك:

  1. تقسيم التكافؤ وتحليل القيم الحدية (Equivalence Partitioning and Boundary Value Analysis) بدلاً من طلب البيانات مباشرة، اجبر النموذج اللغوي على تحديد فئات الاختبار أولاً. استخدم أسلوب "سلسلة الأفكار" (Chain-of-Thought prompting).

يضمن ذلك اختبار نقاط الانتقال الدقيقة، مثل 99.99 دولار مقابل 100.00 دولار، دون إضاعة المساحة في سجلات مكررة.

  1. اختبار انتقال الحالة (State Transition Testing) بالنسبة للأنظمة مثل تدفقات الدفع أو إدارة الطلبات، يجب أن تعكس البيانات مراحل مختلفة من دورة الحياة.

يمنع هذا تكرار السجلات ويجبرك على إنشاء حالات اختبار سلبية (negative test cases).

  1. التحكم في التباين والأوامر السلبية (Variance Control and Negative Prompting) غالباً ما تنتج النماذج اللغوية الكبيرة بيانات متجانسة، مثل استخدام نفس المناطق أو الفئات العمرية. استخدم "الأوامر السلبية" (Negative Prompting) لوقف ذلك.

يؤدي هذا إلى القضاء على التحيز وضمان قدرة الأنظمة الخلفية (backend) لديك على التعامل مع بيانات متنوعة وواقعية.

لا تقدم سرعة الذكاء الاصطناعي قيمة إلا إذا كانت بياناتك مدروسة. دورك كمتخصص في ضمان الجودة (QA) هو برمجة القيود التي تحكم هذه النماذج التوليدية.

المصدر: https://dev.to/lopesdoamaral/engenharia-de-prompts-para-massa-de-dados-escalando-testes-com-cobertura-e-sem-duplicidade-oba

مجتمع تعليمي اختياري: https://t.me/GyaanSetuAi