இலகுரக திறந்த மூல LLM-களுக்கான ப்ராம்ப்ட் சார்ந்த கருவி அழைப்பு
GPT-4 போன்ற பெரிய மாதிரிகள் சிறப்பாகச் செயல்படுகின்றன. அவற்றுக்கு அதிக கணக்கீட்டுத் திறன் தேவைப்படுகிறது.
சிறிய திறந்த மூல மாதிரிகள் பெரும்பாலும் சிக்கலான தர்க்கரீதியான சிந்தனையில் (complex reasoning) சிரமப்படுகின்றன. பெரிய மாதிரிகளை இயக்க மிகப்பெரிய GPU-க்கள் தேவைப்படுகின்றன.
கட்டமைக்கப்பட்ட ப்ராம்ப்ட்கள் (structured prompts) மூலம் சிறிய மாதிரிகள் கருவிகளைப் பயன்படுத்துவதற்கு உதவும் ஒரு வழியை நான் ஆராய்ச்சி செய்தேன். இந்த ஆராய்ச்சி "Prompt-Driven Tool-Calling for Lightweight Open Source LLMs" என்று தலைப்பிடப்பட்டுள்ளது.
சிக்கல்:
- சிறிய மாதிரிகளிடம் தர்க்கரீதியான சிந்தனைத் திறன் இல்லை.
- பெரிய மாதிரிகளை இயக்குவது செலவு அதிகம்.
- குறைந்த வன்பொருளில் (hardware) இயங்கக்கூடிய திறமையான ஏஜெண்டுகள் (agents) நமக்குத் தேவை.
தீர்வு: மாதிரிகள் அனைத்தையும் மனப்பாடம் செய்யுமாறு கட்டாயப்படுத்துவதை நிறுத்துங்கள். மாதிரியை ஒரு கட்டுப்பாட்டாளராக (controller) மாற்ற ப்ராம்ப்ட்களைப் பயன்படுத்துங்கள்.
இது எவ்வாறு செயல்படுகிறது: ப்ராம்ப்ட் மாதிரியை பின்வருவனவற்றிற்கு வழிநடத்துகிறது:
- உங்கள் நோக்கத்தைப் புரிந்துகொள்ள.
- சிக்கல்களைப் படிநிலைகளாகப் பிரிக்க.
- யூகிக்காமல் ஒரு கருவியைத் தேர்ந்தெடுக்க.
பணிப்பாய்வு (workflow) இந்த நிலைகளைப் பின்பற்றுகிறது: பயனர் கேள்வி $\rightarrow$ LLM $\rightarrow$ கருவித் தேர்வு $\rightarrow$ கருவிச் செயல்பாடு $\rightarrow$ இறுதிப் பதில்.
உண்மைகளைச் சரியாகப் பெற மாதிரி கால்குலேட்டர் போன்ற கருவிகளைப் பயன்படுத்துகிறது.
முக்கிய நன்மைகள்:
- சிறிய மாதிரிகள் புத்திசாலித்தனமான ஏஜெண்டுகளாகச் செயல்படுகின்றன.
- AI அதிக அணுகக்கூடியதாக மாறுகிறது.
- புத்திசாலித்தனம் என்பது மாதிரியின் அளவை விட, அமைப்பின் வடிவமைப்பைப் (system design) பொறுத்தே அமைகிறது.
நாம் வெறும் அளவுருக்களை (parameters) அதிகரிப்பதற்குப் பதிலாக, கருவி ஒருங்கிணைப்பை (tool integration) அதிகரிக்க வேண்டும்.
இந்த ஆய்வு AIS2C2 2025 இல் வெளியிடப்பட்டுள்ளது.
ஆதாரம்: https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf
விருப்பத்தேர்வு கற்றல் சமூகம்: https://t.me/GyaanSetuAi