𝗣𝗿𝗼𝗺𝗽𝘁𝘀 𝗔𝗿𝗲𝗻'𝘁 𝗘𝗻𝗼𝘂𝗴𝗵: 𝗘𝗻𝗳𝗼𝗿𝗰𝗶𝗻𝗴 𝗛𝗮𝗿𝗱 𝗖𝗼𝗻𝘀𝘁𝗿𝗮𝗶𝗻𝘁𝘀 𝗼𝗻 𝗟𝗟𝗠 𝗢𝘂𝘁𝗽𝘂𝘁
கடுமையான தேவைகளைச் சந்திக்கும் வரை LLM டெமோக்கள் சிறப்பாகத் தோன்றும்.
மாடல்கள் நிகழ்தகவின் (probability) அடிப்படையில் செயல்படுகின்றன. ஆனால் உற்பத்தி அமைப்புகளுக்கு (production systems) உத்தரவாதங்கள் தேவை.
அர்ஜென்டினாவில் உள்ள Radio del Volga-விற்கான ஒரு AI செய்தித் தொகுப்பை (news pipeline) உருவாக்கும்போது இதை நான் கற்றுக்கொண்டேன். இந்த அமைப்பு செய்திகளைத் திருத்தி எழுதுவதோடு சமூக ஊடகப் பதிவுகளையும் உருவாக்குகிறது. ஒரு பிரச்சனை வரும் வரை இது நன்றாகவே செயல்பட்டது. Gemini தொடர்ந்து தவறான ஸ்பானிஷ் மொழியில் எழுதி வந்தது.
அர்ஜென்டினாவில், மக்கள் குறிப்பிட்ட சொற்களைப் பயன்படுத்துகிறார்கள். அவர்கள் "puedes" என்பதற்குப் பதிலாக "podés" என்றும், "eres" என்பதற்குப் பதிலாக "sos" என்றும் கூறுகிறார்கள். மாடல் நடுநிலையான ஸ்பானிஷ் மொழியைப் பயன்படுத்தினால், அந்த உரை உள்ளூர் வாசகர்களுக்குத் தவறாகத் தோன்றும்.
முதலில் நான் சிறந்த ப்ராம்ப்டிங் (prompting) முறைகளை முயற்சி செய்தேன். நான் மாடலிடம் கூறினேன்:
- Rioplatense ஸ்பானிஷ் மொழியைப் பயன்படுத்து.
- ஒருபோதும் நடுநிலையான ஸ்பானிஷ் மொழியைப் பயன்படுத்தாதே.
- குறிப்பிட்ட தடைசெய்யப்பட்ட சொற்களின் பட்டியலைப் பயன்படுத்து.
- அனுப்புவதற்கு முன் உனது பதிலைத் மீண்டும் ஒருமுறை வாசி.
இது உதவியது, ஆனால் அனைத்தையும் சரிசெய்யவில்லை. முறையான செய்தி ஆதாரங்கள் மாடலை மீண்டும் நடுநிலையான ஸ்பானிஷ் மொழிக்குத் தள்ளின. நான் ப்ராம்ப்ட்டில் எவ்வளவு எழுதினாலும், பிழைகள் நீடிக்கவே செய்தன.
இதை ஒரு ப்ராம்ப்டிங் பிரச்சனையாகக் கருதுவதை நான் நிறுத்தினேன். இதை ஒரு சரிபார்ப்பு (validation) பிரச்சனையாகக் கருதத் தொடங்கினேன்.
தொனி (tone) அல்லது பாணி (style) போன்ற சில விஷயங்கள் நிகழ்தகவு சார்ந்தவை. மற்றவை தீர்மானிக்கப்பட்டவை (deterministic). ஒரு உரையில் "puedes" என்று இருந்தால், அது தவறு. அதைத் தெரிந்துகொள்ள உங்களுக்கு AI தேவையில்லை. உங்களுக்குத் தேவை ஒரு எளிய குறியீடு (code) மட்டுமே.
நான் ஒரு post-processing படிநிலையைச் சேர்த்தேன். இது AI வேலையை முடித்த பிறகு இயங்கும். இது குறிப்பிட்ட சொற்களைத் தேடி அவற்றை மாற்றியமைக்கும்:
- puedes என்பது podés ஆக மாறும்
- tienes என்பது tenés ஆக மாறும்
- eres என்பது sos ஆக மாறும்
இந்த பட்டியல் சிறியது மற்றும் பாதுகாப்பானது. நான் முழு ஸ்பானிஷ் மொழியையும் சரிசெய்ய முயற்சிக்கவில்லை. குறியீட்டினால் (code) நிச்சயமாகச் சரிபார்க்கக்கூடிய விதிகளை மட்டுமே நான் சரிசெய்கிறேன்.
இந்த பாடம் ஸ்பானிஷ் மொழியைப் பற்றியது அல்ல. இது ப்ராம்ப்ட் இன்ஜினியரிங்கின் (prompt engineering) வரம்புகளைப் பற்றியது.
ப்ராம்ப்டிங் செயல்திறனை மேம்படுத்துகிறது, ஆனால் அது உத்தரவாதங்களை வழங்காது. ஒரு விதி நிலையானது மற்றும் சோதிக்கக்கூடியது என்றால், அதை அமல்படுத்த குறியீட்டைப் (code) பயன்படுத்துங்கள்.
சரளமான உரையை உருவாக்க LLM-களைப் பயன்படுத்துங்கள். பிராண்ட் சொற்கள் (brand terms), ஒழுங்குமுறை வார்த்தைகள் (regulatory wording) மற்றும் வடிவமைப்புக் விதிகளை (formatting rules) அமல்படுத்த தீர்மானிக்கப்பட்ட குறியீட்டைப் (deterministic code) பயன்படுத்துங்கள்.
நம்பகமான அமைப்புகள் பொறுப்புகளைப் பிரிக்கின்றன: • மாடல் உள்ளடக்கத்தை உருவாக்குகிறது. • குறியீடு கடுமையான விதிகளை அமல்படுத்துகிறது. • மனிதர்கள் இறுதித் திருத்த முடிவை எடுக்கிறார்கள்.
Source: https://dev.to/zendev2112/prompts-arent-enough-enforcing-hard-constraints-on-llm-output-2hpo
Optional learning community: https://t.me/GyaanSetuAi