𝗥𝗡𝗡𝗦, 𝗧𝗿𝗮𝗻𝘀𝗳𝗼𝗿𝗺𝗲𝗿𝘀, மற்றும் 𝗦𝘁𝗮𝘁𝗲 𝗦𝗽𝗮𝗰𝗲 𝗠𝗼𝗱𝗲𝗹𝘀
இன்று AI துறையில் Transformers ஆதிக்கம் செலுத்துகின்றன. ஆனால் ஒரு புதிய சிக்கல் உள்ளது. நீண்ட காலத்திற்குத் தகவல்களை AI எவ்வாறு நினைவில் வைத்துக்கொள்ளும்?
Large Language Models வெறும் எளிய கேள்விகளைக் கடந்து முன்னேறி வருகின்றன. அவை தன்னாட்சி முகவர்களாகவும் (autonomous agents) மற்றும் கோடிங் உதவியாளர்களாகவும் (coding assistants) மாறி வருகின்றன. இந்த அமைப்புகள் செயல்பட நம்பகமான நினைவகம் தேவைப்படுகிறது.
நினைவகத்தைக் கையாள மூன்று வழிகள்:
RNNs (Recurrent Neural Networks)
- வரிசைமுறைத் தரவுகளுக்கு (sequential data) சிறந்தது.
- லேசானது (Lightweight).
- நீண்ட கால நினைவகத்தில் (long-range memory) பலவீனமானது.
Transformers
- தர்க்கரீதியான சிந்தனைக்கு (reasoning) சிறந்தது.
- இணையச் செயலாக்கத்தைப் (parallel processing) பயன்படுத்துகிறது.
- உரை நீளமடையும் போது செலவுகள் விரைவாக அதிகரிக்கின்றன.
State Space Models (Mamba)
- நேரியல் சிக்கலைப் (linear complexity) பயன்படுத்துகிறது.
- நீண்ட சூழலை (long context) சிறப்பாகக் கையாள்கிறது.
- இன்ஃபரன்ஸ் (inference) செலவுகளைக் குறைக்கிறது.
எதிர்காலம் ஒரு வெற்றியாளரை மட்டும் தேர்ந்தெடுக்காது. நவீன AI அமைப்புகள் இந்த கட்டமைப்புகளை (architectures) ஒன்றிணைக்கும். நினைவகம் என்பது இப்போது ஒரு மாடல் சவாலாக (model challenge) இல்லாமல், ஒரு சிஸ்டம் சவாலாக (system challenge) மாறியுள்ளது.
நீங்கள் என்ன நினைக்கிறீர்கள்?
விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi