𝗣𝗿𝗼𝗺𝗽𝘁𝘀 𝗔𝗿𝗲𝗻'𝘁 𝗘𝗻𝗼𝘂𝗴𝗵: 𝗘𝗻𝗳𝗼𝗿𝗰𝗶𝗻𝗴 𝗛𝗮𝗿𝗱 𝗖𝗼𝗻𝘀𝘁𝗿𝗮𝗶𝗻𝘁𝘀 𝗼𝗻 𝗟𝗟𝗠 𝗢𝘂𝘁𝗽𝘂𝘁

கடுமையான தேவைகளைச் சந்திக்கும் வரை LLM டெமோக்கள் சிறப்பாகத் தோன்றும்.

மாடல்கள் நிகழ்தகவின் (probability) அடிப்படையில் செயல்படுகின்றன. ஆனால் உற்பத்தி அமைப்புகளுக்கு (production systems) உத்தரவாதங்கள் தேவை.

அர்ஜென்டினாவில் உள்ள Radio del Volga-விற்கான ஒரு AI செய்தித் தொகுப்பை (news pipeline) உருவாக்கும்போது இதை நான் கற்றுக்கொண்டேன். இந்த அமைப்பு செய்திகளைத் திருத்தி எழுதுவதோடு சமூக ஊடகப் பதிவுகளையும் உருவாக்குகிறது. ஒரு பிரச்சனை வரும் வரை இது நன்றாகவே செயல்பட்டது. Gemini தொடர்ந்து தவறான ஸ்பானிஷ் மொழியில் எழுதி வந்தது.

அர்ஜென்டினாவில், மக்கள் குறிப்பிட்ட சொற்களைப் பயன்படுத்துகிறார்கள். அவர்கள் "puedes" என்பதற்குப் பதிலாக "podés" என்றும், "eres" என்பதற்குப் பதிலாக "sos" என்றும் கூறுகிறார்கள். மாடல் நடுநிலையான ஸ்பானிஷ் மொழியைப் பயன்படுத்தினால், அந்த உரை உள்ளூர் வாசகர்களுக்குத் தவறாகத் தோன்றும்.

முதலில் நான் சிறந்த ப்ராம்ப்டிங் (prompting) முறைகளை முயற்சி செய்தேன். நான் மாடலிடம் கூறினேன்:

இது உதவியது, ஆனால் அனைத்தையும் சரிசெய்யவில்லை. முறையான செய்தி ஆதாரங்கள் மாடலை மீண்டும் நடுநிலையான ஸ்பானிஷ் மொழிக்குத் தள்ளின. நான் ப்ராம்ப்ட்டில் எவ்வளவு எழுதினாலும், பிழைகள் நீடிக்கவே செய்தன.

இதை ஒரு ப்ராம்ப்டிங் பிரச்சனையாகக் கருதுவதை நான் நிறுத்தினேன். இதை ஒரு சரிபார்ப்பு (validation) பிரச்சனையாகக் கருதத் தொடங்கினேன்.

தொனி (tone) அல்லது பாணி (style) போன்ற சில விஷயங்கள் நிகழ்தகவு சார்ந்தவை. மற்றவை தீர்மானிக்கப்பட்டவை (deterministic). ஒரு உரையில் "puedes" என்று இருந்தால், அது தவறு. அதைத் தெரிந்துகொள்ள உங்களுக்கு AI தேவையில்லை. உங்களுக்குத் தேவை ஒரு எளிய குறியீடு (code) மட்டுமே.

நான் ஒரு post-processing படிநிலையைச் சேர்த்தேன். இது AI வேலையை முடித்த பிறகு இயங்கும். இது குறிப்பிட்ட சொற்களைத் தேடி அவற்றை மாற்றியமைக்கும்:

இந்த பட்டியல் சிறியது மற்றும் பாதுகாப்பானது. நான் முழு ஸ்பானிஷ் மொழியையும் சரிசெய்ய முயற்சிக்கவில்லை. குறியீட்டினால் (code) நிச்சயமாகச் சரிபார்க்கக்கூடிய விதிகளை மட்டுமே நான் சரிசெய்கிறேன்.

இந்த பாடம் ஸ்பானிஷ் மொழியைப் பற்றியது அல்ல. இது ப்ராம்ப்ட் இன்ஜினியரிங்கின் (prompt engineering) வரம்புகளைப் பற்றியது.

ப்ராம்ப்டிங் செயல்திறனை மேம்படுத்துகிறது, ஆனால் அது உத்தரவாதங்களை வழங்காது. ஒரு விதி நிலையானது மற்றும் சோதிக்கக்கூடியது என்றால், அதை அமல்படுத்த குறியீட்டைப் (code) பயன்படுத்துங்கள்.

சரளமான உரையை உருவாக்க LLM-களைப் பயன்படுத்துங்கள். பிராண்ட் சொற்கள் (brand terms), ஒழுங்குமுறை வார்த்தைகள் (regulatory wording) மற்றும் வடிவமைப்புக் விதிகளை (formatting rules) அமல்படுத்த தீர்மானிக்கப்பட்ட குறியீட்டைப் (deterministic code) பயன்படுத்துங்கள்.

நம்பகமான அமைப்புகள் பொறுப்புகளைப் பிரிக்கின்றன: • மாடல் உள்ளடக்கத்தை உருவாக்குகிறது. • குறியீடு கடுமையான விதிகளை அமல்படுத்துகிறது. • மனிதர்கள் இறுதித் திருத்த முடிவை எடுக்கிறார்கள்.

Source: https://dev.to/zendev2112/prompts-arent-enough-enforcing-hard-constraints-on-llm-output-2hpo

Optional learning community: https://t.me/GyaanSetuAi