হালকা ওজনের ওপেন সোর্স LLM-এর জন্য প্রম্পট-চালিত টুল-কলিং (Prompt-Driven Tool-Calling)
GPT-4 এর মতো বড় মডেলগুলো ভালো কাজ করে। তবে এগুলোর কম্পিউটেশনাল চাহিদা অনেক বেশি।
ছোট ওপেন সোর্স মডেলগুলো প্রায়ই জটিল যুক্তিনির্ভর কাজে (complex reasoning) হিমশিম খায়। বড় মডেল চালানোর জন্য বিশাল পরিমাণ GPU প্রয়োজন হয়।
আমি স্ট্রাকচার্ড প্রম্পটের মাধ্যমে ছোট মডেলগুলোকে টুল ব্যবহার করতে সাহায্য করার একটি উপায় নিয়ে গবেষণা করেছি। এই গবেষণার শিরোনাম হলো Prompt-Driven Tool-Calling for Lightweight Open Source LLMs।
সমস্যা:
- ছোট মডেলগুলোর যুক্তিনির্ভর দক্ষতার অভাব রয়েছে।
- বড় মডেল চালানো ব্যয়বহুল।
- আমাদের এমন দক্ষ এজেন্ট প্রয়োজন যা কম হার্ডওয়্যারে চলতে পারে।
সমাধান: মডেলগুলোকে সবকিছু মুখস্থ করতে বাধ্য করা বন্ধ করুন। প্রম্পট ব্যবহার করে মডেলটিকে একটি কন্ট্রোলার হিসেবে রূপান্তর করুন।
এটি যেভাবে কাজ করে: প্রম্পট মডেলটিকে নির্দেশ দেয়:
- আপনার উদ্দেশ্য বুঝতে।
- সমস্যাগুলোকে ধাপে ধাপে ভাগ করতে।
- অনুমানের পরিবর্তে সঠিক টুল নির্বাচন করতে।
কাজের ধারাটি (workflow) এই ধাপগুলো অনুসরণ করে: ব্যবহারকারীর প্রশ্ন $\rightarrow$ LLM $\rightarrow$ টুল নির্বাচন $\rightarrow$ টুল প্রয়োগ $\rightarrow$ চূড়ান্ত উত্তর।
তথ্য সঠিকভাবে পাওয়ার জন্য মডেলটি ক্যালকুলেটরের মতো টুল ব্যবহার করে।
মূল সুবিধাসমূহ:
- ছোট মডেলগুলো বুদ্ধিমান এজেন্টের মতো কাজ করে।
- AI আরও সহজলভ্য হয়ে ওঠে।
- বুদ্ধিমত্তা মডেলের আকারের চেয়ে সিস্টেম ডিজাইনের ওপর বেশি নির্ভর করে।
আমাদের শুধুমাত্র প্যারামিটার বাড়ানোর পরিবর্তে টুল ইন্টিগ্রেশন বাড়ানোর দিকে নজর দেওয়া উচিত।
এই কাজটি AIS2C2 2025-এ প্রকাশিত হয়েছে।
উৎস: https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf
ঐচ্ছিক লার্নিং কমিউনিটি: https://t.me/GyaanSetuAi