𝗣𝗿𝗼𝗺𝗽𝘁𝘀 𝗔𝗿𝗲𝗻'𝘁 𝗘𝗻𝗼𝘂𝗴𝗵: 𝗘𝗻𝗳𝗼𝗿𝗰𝗶𝗻𝗴 𝗛𝗮𝗿𝗱 𝗖𝗼𝗻𝘀𝘁𝗿𝗮𝗶𝗻𝘁𝘀 𝗼𝗻 𝗟𝗟𝗠 𝗢𝘂𝘁𝗽𝘂𝘁

📅3 hours ago⏱2 min read

கடுமையான தேவைகளைச் சந்திக்கும் வரை LLM டெமோக்கள் சிறப்பாகத் தோன்றும்.

மாடல்கள் நிகழ்தகவின் (probability) அடிப்படையில் செயல்படுகின்றன. ஆனால் உற்பத்தி அமைப்புகளுக்கு (production systems) உத்தரவாதங்கள் தேவை.

அர்ஜென்டினாவில் உள்ள Radio del Volga-விற்கான ஒரு AI செய்தித் தொகுப்பை (news pipeline) உருவாக்கும்போது இதை நான் கற்றுக்கொண்டேன். இந்த அமைப்பு செய்திகளைத் திருத்தி எழுதுவதோடு சமூக ஊடகப் பதிவுகளையும் உருவாக்குகிறது. ஒரு பிரச்சனை வரும் வரை இது நன்றாகவே செயல்பட்டது. Gemini தொடர்ந்து தவறான ஸ்பானிஷ் மொழியில் எழுதி வந்தது.

அர்ஜென்டினாவில், மக்கள் குறிப்பிட்ட சொற்களைப் பயன்படுத்துகிறார்கள். அவர்கள் "puedes" என்பதற்குப் பதிலாக "podés" என்றும், "eres" என்பதற்குப் பதிலாக "sos" என்றும் கூறுகிறார்கள். மாடல் நடுநிலையான ஸ்பானிஷ் மொழியைப் பயன்படுத்தினால், அந்த உரை உள்ளூர் வாசகர்களுக்குத் தவறாகத் தோன்றும்.

முதலில் நான் சிறந்த ப்ராம்ப்டிங் (prompting) முறைகளை முயற்சி செய்தேன். நான் மாடலிடம் கூறினேன்:

Rioplatense ஸ்பானிஷ் மொழியைப் பயன்படுத்து.
ஒருபோதும் நடுநிலையான ஸ்பானிஷ் மொழியைப் பயன்படுத்தாதே.
குறிப்பிட்ட தடைசெய்யப்பட்ட சொற்களின் பட்டியலைப் பயன்படுத்து.
அனுப்புவதற்கு முன் உனது பதிலைத் மீண்டும் ஒருமுறை வாசி.

இது உதவியது, ஆனால் அனைத்தையும் சரிசெய்யவில்லை. முறையான செய்தி ஆதாரங்கள் மாடலை மீண்டும் நடுநிலையான ஸ்பானிஷ் மொழிக்குத் தள்ளின. நான் ப்ராம்ப்ட்டில் எவ்வளவு எழுதினாலும், பிழைகள் நீடிக்கவே செய்தன.

இதை ஒரு ப்ராம்ப்டிங் பிரச்சனையாகக் கருதுவதை நான் நிறுத்தினேன். இதை ஒரு சரிபார்ப்பு (validation) பிரச்சனையாகக் கருதத் தொடங்கினேன்.

தொனி (tone) அல்லது பாணி (style) போன்ற சில விஷயங்கள் நிகழ்தகவு சார்ந்தவை. மற்றவை தீர்மானிக்கப்பட்டவை (deterministic). ஒரு உரையில் "puedes" என்று இருந்தால், அது தவறு. அதைத் தெரிந்துகொள்ள உங்களுக்கு AI தேவையில்லை. உங்களுக்குத் தேவை ஒரு எளிய குறியீடு (code) மட்டுமே.

நான் ஒரு post-processing படிநிலையைச் சேர்த்தேன். இது AI வேலையை முடித்த பிறகு இயங்கும். இது குறிப்பிட்ட சொற்களைத் தேடி அவற்றை மாற்றியமைக்கும்:

puedes என்பது podés ஆக மாறும்
tienes என்பது tenés ஆக மாறும்
eres என்பது sos ஆக மாறும்

இந்த பட்டியல் சிறியது மற்றும் பாதுகாப்பானது. நான் முழு ஸ்பானிஷ் மொழியையும் சரிசெய்ய முயற்சிக்கவில்லை. குறியீட்டினால் (code) நிச்சயமாகச் சரிபார்க்கக்கூடிய விதிகளை மட்டுமே நான் சரிசெய்கிறேன்.

இந்த பாடம் ஸ்பானிஷ் மொழியைப் பற்றியது அல்ல. இது ப்ராம்ப்ட் இன்ஜினியரிங்கின் (prompt engineering) வரம்புகளைப் பற்றியது.

ப்ராம்ப்டிங் செயல்திறனை மேம்படுத்துகிறது, ஆனால் அது உத்தரவாதங்களை வழங்காது. ஒரு விதி நிலையானது மற்றும் சோதிக்கக்கூடியது என்றால், அதை அமல்படுத்த குறியீட்டைப் (code) பயன்படுத்துங்கள்.

சரளமான உரையை உருவாக்க LLM-களைப் பயன்படுத்துங்கள். பிராண்ட் சொற்கள் (brand terms), ஒழுங்குமுறை வார்த்தைகள் (regulatory wording) மற்றும் வடிவமைப்புக் விதிகளை (formatting rules) அமல்படுத்த தீர்மானிக்கப்பட்ட குறியீட்டைப் (deterministic code) பயன்படுத்துங்கள்.

நம்பகமான அமைப்புகள் பொறுப்புகளைப் பிரிக்கின்றன: • மாடல் உள்ளடக்கத்தை உருவாக்குகிறது. • குறியீடு கடுமையான விதிகளை அமல்படுத்துகிறது. • மனிதர்கள் இறுதித் திருத்த முடிவை எடுக்கிறார்கள்.

Source: https://dev.to/zendev2112/prompts-arent-enough-enforcing-hard-constraints-on-llm-output-2hpo

Optional learning community: https://t.me/GyaanSetuAi

𝗣𝗿𝗼𝗺𝗽𝘁𝘀 𝗔𝗿𝗲𝗻'𝘁 𝗘𝗻𝗼𝘂𝗴𝗵: 𝗘𝗻𝗳𝗼𝗿𝗰𝗶𝗻𝗴 𝗛𝗮𝗿𝗱 𝗖𝗼𝗻𝘀𝘁𝗿𝗮𝗶𝗻𝘁𝘀 𝗼𝗻 𝗟𝗟𝗠 𝗢𝘂𝘁𝗽𝘂𝘁

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

AI என்பது வெறும் ப்ராம்ப்ட்களைத் தாண்டியது

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

AI ஏஜென்ட்களை மதிப்பிடுதல்: தீர்மானிக்கப்பட்ட அளவீடுகள் + ஒரு LLM நீதிபதி