முன் பயிற்சி பெற்ற சுருக்கமாக்கல் வடிகட்டுதல்

📅2 hours ago⏱1 min read

𝗣𝗿𝗲-𝘁𝗿𝗮𝗶𝗻𝗲𝗱 𝗦𝘂𝗺𝗺𝗮𝗿𝗶𝘇𝗮𝘁𝗶𝗼𝗻 𝗗𝗶𝘀𝘁𝗶𝗹𝗹𝗮𝘁𝗶𝗼𝗻 (முன்-பயிற்சி அளிக்கப்பட்ட சுருக்கமாக்கல் வடிகட்டுதல்)

பெரிய மொழி மாதிரிகளுக்கு (Large language models) மிகப்பெரிய அளவிலான தரவுகள் தேவைப்படுகின்றன. இதற்கு அதிக நேரமும் பணமும் செலவாகிறது.

சுருக்கமாக்கல் வடிகட்டுதல் (Summarization distillation) ஒரு சிறந்த வழியை வழங்குகிறது. இது பெரிய மாதிரிகளைப் போலவே செயல்படும் சிறிய மாதிரிகளை உருவாக்க உங்களுக்கு உதவுகிறது.

இந்த செயல்முறை ஒரு ஆசிரியர் மாதிரியிலிருந்து (teacher model) ஒரு மாணவர் மாதிரிக்கு (student model) அறிவை மாற்றுவதன் மூலம் செயல்படுகிறது. மாணவர் மாதிரி ஆசிரியரைப் போலவே செயல்படக் கற்றுக்கொள்கிறது.

இந்த முறையின் நன்மைகள்:

குறைந்த கணக்கீட்டுச் செலவுகள் (Lower computational costs)
வேகமான அனுமான வேகம் (Faster inference speeds)
குறைக்கப்பட்ட நினைவகப் பயன்பாடு (Reduced memory usage)
குறிப்பிட்ட பணிகளுக்கு அதிக துல்லியம் (Higher accuracy for specific tasks)

அதிகப்படியான வன்பொருள் (hardware) தேவைகள் இன்றி உயர்தரச் சுருக்கங்களைப் பெறலாம். இது அன்றாட பயன்பாடுகளுக்கு AI-ஐ எளிதில் அணுகக்கூடியதாக மாற்றுகிறது.

ஆதாரம்: https://dev.to/paperium/pre-trained-summarization-distillation-2843

விருப்பத்தேர்வு கற்றல் சமூகம்: https://t.me/GyaanSetuAi

முன் பயிற்சி பெற்ற சுருக்கமாக்கல் வடிகட்டுதல்

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

AI என்பது வெறும் ப்ராம்ப்ட்களைத் தாண்டியது

𝗗𝗶𝘀𝗰𝗼𝘂𝗿𝘀𝗲 𝗕𝗮𝘀𝗲𝗱 𝗢𝗯𝗷𝗲𝗰𝘁𝗶𝘃𝗲𝘀 𝗳𝗼𝗿 𝗙𝗮𝘀𝘁 𝗦𝗲𝗻𝘁𝗲𝗻𝗰𝗲 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴

𝗧𝗼𝘄𝗮𝗿𝗱𝘀 𝗘𝗳𝗳𝗶𝗰𝗶𝗲𝗻𝘁 𝗟𝗟𝗠 𝗦𝗲𝗿𝘃𝗶𝗻𝗴

செயற்கை தரவு குறித்த சிறந்த நடைமுறைகள் மற்றும் கற்றுக்கொண்ட பாடங்கள்