𝗣𝗿𝗼𝗺𝗽𝘁-𝗗𝗿𝗶𝘃𝗲𝗻 𝗧𝗼𝗼𝗹-𝗖𝗮𝗹𝗹𝗶𝗻𝗴 𝗳𝗼𝗿 𝗟𝗶𝗴𝗵𝘁𝘄𝗲𝗶𝗴𝗵𝘁 𝗢𝗽𝗲𝗻 𝗦𝗼𝘂𝗿𝗰𝗲 𝗟𝗟𝗠𝘀

GPT-4 جیسے بڑے ماڈلز بہترین کام کرتے ہیں۔ انہیں زیادہ کمپیوٹنگ کی ضرورت ہوتی ہے۔

چھوٹے اوپن سورس ماڈلز اکثر پیچیدہ استدلال (reasoning) میں دشواری کا شکار ہوتے ہیں۔ بڑے ماڈلز چلانے کے لیے آپ کو بڑے پیمانے پر GPUs کی ضرورت ہوتی ہے۔

میں نے اس طریقے پر تحقیق کی ہے جس کے ذریعے چھوٹے ماڈلز کو منظم پرامپٹس (structured prompts) کے ذریعے ٹولز استعمال کرنے میں مدد مل سکے۔ اس تحقیق کا عنوان Prompt-Driven Tool-Calling for Lightweight Open Source LLMs ہے۔

مسئلہ:

  • چھوٹے ماڈلز میں استدلال کی مہارتوں کی کمی ہوتی ہے۔
  • بڑے ماڈلز چلانا مہنگا ہے۔
  • ہمیں ایسے موثر ایجنٹس کی ضرورت ہے جو کم ہارڈ ویئر پر چل سکیں۔

حل: ماڈلز کو ہر چیز یاد کرنے پر مجبور کرنا بند کریں۔ ماڈل کو ایک کنٹرولر میں تبدیل کرنے کے لیے پرامپٹس کا استعمال کریں۔

یہ کیسے کام کرتا ہے: پرامپٹ ماڈل کی رہنمائی کرتا ہے تاکہ وہ:

  • آپ کے ارادے کو سمجھے۔
  • مسائل کو مراحل میں تقسیم کرے۔
  • اندازہ لگانے کے بجائے ایک ٹول کا انتخاب کرے۔

ورک فلو ان مراحل پر عمل کرتا ہے: صارف کا سوال $\rightarrow$ LLM $\rightarrow$ ٹول کا انتخاب $\rightarrow$ ٹول کا استعمال $\rightarrow$ حتمی جواب۔

ماڈل حقائق کو درست طریقے سے حاصل کرنے کے لیے کیلکولیٹر جیسے ٹولز کا استعمال کرتا ہے۔

اہم فوائد:

  • چھوٹے ماڈلز ذہین ایجنٹس کی طرح کام کرتے ہیں۔
  • AI زیادہ قابل رسائی بن جاتا ہے۔
  • ذہانت ماڈل کے سائز کے بجائے سسٹم کے ڈیزائن پر منحصر ہوتی ہے۔

ہمیں صرف پیرامیٹرز بڑھانے کے بجائے ٹول انٹیگریشن (tool integration) کو وسعت دینی چاہیے۔

یہ کام AIS2C2 2025 میں شائع ہوا ہے۔

ماخذ: https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf

اختیاری لرننگ کمیونٹی: https://t.me/GyaanSetuAi