இலகுரக திறந்த மூல LLM-களுக்கான ப்ராம்ப்ட் சார்ந்த கருவி அழைப்பு

GPT-4 போன்ற பெரிய மாதிரிகள் சிறப்பாகச் செயல்படுகின்றன. அவற்றுக்கு அதிக கணக்கீட்டுத் திறன் தேவைப்படுகிறது.

சிறிய திறந்த மூல மாதிரிகள் பெரும்பாலும் சிக்கலான தர்க்கரீதியான சிந்தனையில் (complex reasoning) சிரமப்படுகின்றன. பெரிய மாதிரிகளை இயக்க மிகப்பெரிய GPU-க்கள் தேவைப்படுகின்றன.

கட்டமைக்கப்பட்ட ப்ராம்ப்ட்கள் (structured prompts) மூலம் சிறிய மாதிரிகள் கருவிகளைப் பயன்படுத்துவதற்கு உதவும் ஒரு வழியை நான் ஆராய்ச்சி செய்தேன். இந்த ஆராய்ச்சி "Prompt-Driven Tool-Calling for Lightweight Open Source LLMs" என்று தலைப்பிடப்பட்டுள்ளது.

சிக்கல்:

  • சிறிய மாதிரிகளிடம் தர்க்கரீதியான சிந்தனைத் திறன் இல்லை.
  • பெரிய மாதிரிகளை இயக்குவது செலவு அதிகம்.
  • குறைந்த வன்பொருளில் (hardware) இயங்கக்கூடிய திறமையான ஏஜெண்டுகள் (agents) நமக்குத் தேவை.

தீர்வு: மாதிரிகள் அனைத்தையும் மனப்பாடம் செய்யுமாறு கட்டாயப்படுத்துவதை நிறுத்துங்கள். மாதிரியை ஒரு கட்டுப்பாட்டாளராக (controller) மாற்ற ப்ராம்ப்ட்களைப் பயன்படுத்துங்கள்.

இது எவ்வாறு செயல்படுகிறது: ப்ராம்ப்ட் மாதிரியை பின்வருவனவற்றிற்கு வழிநடத்துகிறது:

  • உங்கள் நோக்கத்தைப் புரிந்துகொள்ள.
  • சிக்கல்களைப் படிநிலைகளாகப் பிரிக்க.
  • யூகிக்காமல் ஒரு கருவியைத் தேர்ந்தெடுக்க.

பணிப்பாய்வு (workflow) இந்த நிலைகளைப் பின்பற்றுகிறது: பயனர் கேள்வி $\rightarrow$ LLM $\rightarrow$ கருவித் தேர்வு $\rightarrow$ கருவிச் செயல்பாடு $\rightarrow$ இறுதிப் பதில்.

உண்மைகளைச் சரியாகப் பெற மாதிரி கால்குலேட்டர் போன்ற கருவிகளைப் பயன்படுத்துகிறது.

முக்கிய நன்மைகள்:

  • சிறிய மாதிரிகள் புத்திசாலித்தனமான ஏஜெண்டுகளாகச் செயல்படுகின்றன.
  • AI அதிக அணுகக்கூடியதாக மாறுகிறது.
  • புத்திசாலித்தனம் என்பது மாதிரியின் அளவை விட, அமைப்பின் வடிவமைப்பைப் (system design) பொறுத்தே அமைகிறது.

நாம் வெறும் அளவுருக்களை (parameters) அதிகரிப்பதற்குப் பதிலாக, கருவி ஒருங்கிணைப்பை (tool integration) அதிகரிக்க வேண்டும்.

இந்த ஆய்வு AIS2C2 2025 இல் வெளியிடப்பட்டுள்ளது.

ஆதாரம்: https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf

விருப்பத்தேர்வு கற்றல் சமூகம்: https://t.me/GyaanSetuAi