𝗣𝗿𝗲-𝘁𝗿𝗮𝗶𝗻𝗲𝗱 𝗦𝘂𝗺𝗺𝗮𝗿𝗶𝘇𝗮𝘁𝗶𝗼𝗻 𝗗𝗶𝘀𝘁𝗶𝗹𝗹𝗮𝘁𝗶𝗼𝗻 (முன்-பயிற்சி அளிக்கப்பட்ட சுருக்கமாக்கல் வடிகட்டுதல்)
பெரிய மொழி மாதிரிகளுக்கு (Large language models) மிகப்பெரிய அளவிலான தரவுகள் தேவைப்படுகின்றன. இதற்கு அதிக நேரமும் பணமும் செலவாகிறது.
சுருக்கமாக்கல் வடிகட்டுதல் (Summarization distillation) ஒரு சிறந்த வழியை வழங்குகிறது. இது பெரிய மாதிரிகளைப் போலவே செயல்படும் சிறிய மாதிரிகளை உருவாக்க உங்களுக்கு உதவுகிறது.
இந்த செயல்முறை ஒரு ஆசிரியர் மாதிரியிலிருந்து (teacher model) ஒரு மாணவர் மாதிரிக்கு (student model) அறிவை மாற்றுவதன் மூலம் செயல்படுகிறது. மாணவர் மாதிரி ஆசிரியரைப் போலவே செயல்படக் கற்றுக்கொள்கிறது.
இந்த முறையின் நன்மைகள்:
- குறைந்த கணக்கீட்டுச் செலவுகள் (Lower computational costs)
- வேகமான அனுமான வேகம் (Faster inference speeds)
- குறைக்கப்பட்ட நினைவகப் பயன்பாடு (Reduced memory usage)
- குறிப்பிட்ட பணிகளுக்கு அதிக துல்லியம் (Higher accuracy for specific tasks)
அதிகப்படியான வன்பொருள் (hardware) தேவைகள் இன்றி உயர்தரச் சுருக்கங்களைப் பெறலாம். இது அன்றாட பயன்பாடுகளுக்கு AI-ஐ எளிதில் அணுகக்கூடியதாக மாற்றுகிறது.
ஆதாரம்: https://dev.to/paperium/pre-trained-summarization-distillation-2843
விருப்பத்தேர்வு கற்றல் சமூகம்: https://t.me/GyaanSetuAi