செயற்கை தரவுக்கான (Synthetic Data) ப்ராம்ப்ட் இன்ஜினியரிங்

தரமான தரவை (Synthetic Data) உருவாக்க LLM-களைப் பயன்படுத்துவது QA குழுக்களிடையே ஒரு பிரபலமான உத்தியாகும். நீங்கள் சில நொடிகளில் நூற்றுக்கணக்கான சிக்கலான பதிவுகளை உருவாக்க முடியும்.

ஆனால் பொதுவான ப்ராம்ப்ட்கள் (generic prompts) ஒரு சிக்கலுக்கு வழிவகுக்கும். "50 சோதனை பயனர்களை உருவாக்கவும்" என்று நீங்கள் ஒரு LLM-இடம் கேட்டால், அது கணிக்கக்கூடிய மற்றும் மீண்டும் மீண்டும் வரும் தரவையே வழங்கும். இது ஒரு தவறான புரிதலை உருவாக்கும். நீங்கள் "happy path" எனப்படும் சாதாரணச் சூழல்களை மட்டுமே சோதிக்கும் பல பதிவுகளைப் பெறுவீர்கள், ஆனால் முக்கியமான விளிம்பு நிலைச் சூழல்கள் (edge cases) மற்றும் வணிகத் தர்க்கங்களை (business logic) தவறவிடுவீர்கள்.

இதைச் சரிசெய்ய, நீங்கள் ஒரு கோரிக்கையாளர் நிலையில் இருந்து ஒரு ஒருங்கிணைப்பாளராக (orchestrator) மாற வேண்டும். உங்கள் ப்ராம்ப்ட் இன்ஜினியரிங்கில் நேரடியாகச் சோதனைத் தத்துவங்களைப் பயன்படுத்த வேண்டும்.

உங்கள் தரவின் தரத்தை மேம்படுத்த இந்த மூன்று முறைகளைப் பயன்படுத்தவும்:

  1. சமநிலைப்பிரிவினை (Equivalence Partitioning) மற்றும் எல்லை மதிப்பு பகுப்பாய்வு (Boundary Value Analysis) தரவைக் கேட்பதற்குப் பதிலாக, முதலில் சோதனை வகுப்புகளை (test classes) வரைபடமாக்க LLM-ஐத் தூண்ட வேண்டும். Chain-of-Thought prompting முறையைப் பயன்படுத்தவும்.

இது தேவையற்ற பதிவுகளைத் தவிர்த்து, $99.99 vs $100.00 போன்ற துல்லியமான மாற்றப் புள்ளிகளை (transition points) நீங்கள் சோதிப்பதை உறுதி செய்கிறது.

  1. நிலை மாற்றச் சோதனை (State Transition Testing) பணம் செலுத்தும் முறைகள் அல்லது ஆர்டர் மேலாண்மை போன்ற அமைப்புகளுக்கு, தரவு ஒரு வாழ்க்கைச் சுழற்சியின் (lifecycle) பல்வேறு நிலைகளைப் பிரதிபலிக்க வேண்டும்.

இது நகல் பதிவுகளைத் தடுக்கிறது மற்றும் எதிர்மறை சோதனைச் சூழல்களை (negative test cases) உருவாக்கத் தூண்டுகிறது.

  1. மாறுபாட்டுக் கட்டுப்பாடு (Variance Control) மற்றும் எதிர்மறை ப்ராம்ப்டிங் (Negative Prompting) LLM-கள் பெரும்பாலும் ஒரே மாதிரியான தரவுகளை (homogeneous data) உருவாக்குகின்றன, உதாரணமாக ஒரே பிராந்தியங்கள் அல்லது வயதுக் குழுக்களைப் பயன்படுத்துவது போன்றது. இதைத் தடுக்க Negative Prompting முறையைப் பயன்படுத்தவும்.

இது ஒருதலைப்பட்சமான தன்மையை (bias) நீக்கி, உங்கள் பேக்எண்ட் (backend) பல்வேறு மற்றும் யதார்த்தமான தரவுகளைக் கையாளுவதை உறுதி செய்கிறது.

உங்கள் தரவு திட்டமிட்டதாக இருந்தால் மட்டுமே AI வேகம் மதிப்பினை வழங்கும். இந்த generative models-களை நிர்வகிக்கும் கட்டுப்பாடுகளைக் குறியீடாக்குவதே ஒரு QA நிபுணராக உங்கள் பங்காகும்.

ஆதாரம்: https://dev.to/lopesdoamaral/engenharia-de-prompts-para-massa-de-dados-escalando-testes-com-cobertura-e-sem-duplicidade-oba

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi