தானியங்கி பணிப்பாய்வுகளில் LLM மின்னஞ்சல்களைத் தனிமைப்படுத்துதல்
ஒரு LLM ஏஜென்ட் மின்னஞ்சல்களை அனுப்பத் தொடங்கும்போது அல்லது டிக்கெட்டுகளை (tickets) அங்கீகரிக்கத் தொடங்கும்போது, சிக்கல் மாறுகிறது. உங்கள் ப்ராம்ப்ட் (prompt) வேலை செய்கிறதா இல்லையா என்பது மட்டும் இனி முக்கியமல்ல. இப்போது, உங்கள் அமைப்பு மூன்று அடுக்குகளைச் சார்ந்துள்ளது: முடிவு (decision), செயல்படுத்துதல் (execution), மற்றும் சரிபார்த்தல் (verification).
இந்த அடுக்குகளை நீங்கள் ஒன்றாகக் கலந்தால், ஏஜென்ட் உண்மையில் என்ன செய்தது என்பதைப் புரிந்துகொள்ள உங்கள் குழுவினர் சிரமப்படுவார்கள்.
மின்னஞ்சல் படிநிலை பெரும்பாலும் ஒரு பணிப்பாய்வின் (workflow) முடிவைப் போலத் தோன்றும். ஆனால் உண்மையில், தோல்விகள் முதலில் வெளிப்படும் இடம் இதுதான். ஒரு ஏஜென்ட் ஒரு கோரிக்கையைச் சரியாக வகைப்படுத்தலாம், ஆனால் அதைத் தவறான நபருக்கு அனுப்பலாம் அல்லது காலாவதியான இணைப்பைப் (link) பயன்படுத்தலாம். நீங்கள் சோதனைகளையும் (tests) தடயங்களையும் (traces) தனிமைப்படுத்த வேண்டும்.
ஒரு நிலையான வடிவமைப்பு (stable design) புத்திசாலித்தனத்தை (intelligence) ஒரே நேரத்தில் சோதிக்க முயற்சிப்பதில்லை. அதற்குப் பதிலாக, உங்கள் அமைப்பைச் சிறிய ஒப்பந்தங்களாகப் பிரிக்கவும்:
- உள்ளீட்டு ஒப்பந்தம் (Input Contract): ஏஜென்ட் பயன்படுத்தும் தரவு மற்றும் அது கோரக்கூடிய செயல்கள் என்ன என்பதை வரையறுக்கவும்.
- செயல்பாட்டு ஒப்பந்தம் (Execution Contract): ஒரு செயல் எவ்வாறு ஒரு குறிப்பிட்ட மின்னஞ்சலாக மாறுகிறது என்பதை வரையறுக்கவும்.
- கண்காணிப்பு ஒப்பந்தம் (Observability Contract): லாக்ஸ்கள் (logs), பெறப்பட்ட செய்திகள் மற்றும் இறுதி அமைப்பின் நிலையை (system state) இணைக்கவும்.
மின்னஞ்சல் தர்க்கத்தை (logic) சுதந்திரமான ப்ராம்ப்ட்டிலிருந்து (free prompt) விலக்கி வைக்கவும். LLM "send_followup_email" போன்ற ஒரு செயலை பரிந்துரைக்கலாம். இருப்பினும், ஹெடர்கள் (headers), பெறுநர்கள் (recipients) அல்லது மீண்டும் முயற்சிக்கும் கொள்கைகளை (retry policies) மாடல் தீர்மானிக்கக் கூடாது. இந்த மாற்றங்களுக்குத் தீர்மானிக்கப்பட்ட குறியீட்டை (deterministic code) பயன்படுத்தவும்.
இந்த அணுகுமுறை செயல்பாட்டு அபாயத்தைக் (operational risk) குறைக்கிறது. LLM பரிந்துரைக்கிறது, அமைப்பு சரிபார்க்கிறது, மற்றும் செயல்படுத்துபவர் (executor) அனுப்புகிறார்.
தெளிவான பார்வைத்திறனைப் பராமரிக்க, இந்த நான்கு சமிக்ஞைகளைக் (signals) கண்காணிக்கவும்:
- ஏஜென்ட் எடுத்த முடிவு மற்றும் பயன்படுத்தப்பட்ட சூழல் (context).
- மின்னஞ்சல் செயல்படுத்துபவருக்கு அனுப்பப்பட்ட இறுதி கட்டளை.
- தனிமைப்படுத்தப்பட்ட இன்பாக்ஸில் (isolated inbox) பெறப்பட்ட செய்தி.
- ஒரு இணைப்பைக் கிளிக் செய்த பிறகு அல்லது ஒரு செயலை உறுதிப்படுத்திய பிறகு ஏற்படும் இறுதி விளைவு.
ஆரம்ப நிகழ்விலிருந்து இறுதி கிளிக் வரை ஒரு பொதுவான trace_id-ஐப் பயன்படுத்தவும். இது பிழைகளை விரைவாகக் கண்டறிய உதவும். தோல்வி மாடலிலா, கருவி கொள்கையிலா (tool policy) அல்லது பணியாளரிடமா (worker) நடந்தது என்பதை நீங்கள் அறியலாம்.
சிறந்த தானியங்கி முறைக்காக இந்தச் சரிபார்ப்புப் பட்டியலைப் (checklist) பின்பற்றவும்:
- ஒவ்வொரு செயல்பாட்டிற்கும் அதன் சொந்த
trace_idஉள்ளது. - LLM ஒரு செல்லுபடியாகும் ஸ்கீமாவிற்குள் (valid schema) மட்டுமே செயல்களைக் கோருகிறது.
- மின்னஞ்சல் செயல்படுத்துபவர் பெறுநர் மற்றும் டெம்ப்ளேட்டை (template) மீண்டும் சரிபார்க்கிறார்.
- ஒவ்வொரு சோதனைச் சூழலும் (test scenario) அதன் சொந்த தனிமைப்படுத்தப்பட்ட இன்பாக்ஸைப் பயன்படுத்துகிறது.
- இறுதி கிளிக் எதிர்பார்க்கப்பட்ட நிலை மாற்றத்தை (state change) உறுதிப்படுத்துகிறது.
- லாக்ஸ்கள் (logs) யூகிக்காமல் ஒரு வழக்கை உங்களால் பின்தொடர அனுமதிக்கின்றன.
இந்தப் படிநிலைகளைப் பிரிப்பது சற்று கூடுதல் வேலையைத் தரும். ஆனால் இது உங்களுக்கு ஒரு மதிப்புமிக்க விஷயத்தைக் கொடுக்கிறது: ஏன் ஒரு மின்னஞ்சல் அனுப்பப்பட்டது அல்லது ஏன் அது தோல்வியடைந்தது என்பதை விளக்கும் திறன்.
Optional learning community: https://t.me/GyaanSetuAi
