فراخوانی ابزار مبتنی بر پرامپت برای مدلهای زبانی بزرگ (LLM) متنباز سبکوزن
مدلهای بزرگ مانند GPT-4 به خوبی عمل میکنند، اما نیاز به توان محاسباتی بالایی دارند.
مدلهای متنباز کوچک اغلب در استدلالهای پیچیده دچار مشکل میشوند. همچنین برای اجرای مدلهای بزرگ به پردازندههای گرافیکی (GPU) بسیار قدرتمندی نیاز دارید.
من روشی را برای کمک به مدلهای کوچک جهت استفاده از ابزارها از طریق پرامپتهای ساختاریافته تحقیق کردم. عنوان این تحقیق Prompt-Driven Tool-Calling for Lightweight Open Source LLMs است.
مسئله:
- مدلهای کوچک فاقد مهارتهای استدلالی هستند.
- اجرای مدلهای بزرگ هزینهبر است.
- ما به عاملهای (agents) کارآمدی نیاز داریم که روی سختافزار کمتری اجرا شوند.
راه حل: از مجبور کردن مدلها به حفظ کردن همه چیز دست بردارید. از پرامپتها استفاده کنید تا مدل را به یک کنترلکننده تبدیل کنید.
نحوه عملکرد: پرامپت، مدل را برای موارد زیر هدایت میکند:
- درک قصد و نیت شما.
- تجزیه مسائل به گامهای مختلف.
- انتخاب یک ابزار به جای حدس زدن.
گردش کار از این مراحل پیروی میکند: سوال کاربر $\rightarrow$ LLM $\rightarrow$ انتخاب ابزار $\rightarrow$ اجرای ابزار $\rightarrow$ پاسخ نهایی.
مدل از ابزارهایی مانند ماشینحساب استفاده میکند تا واقعیتها را به درستی استخراج کند.
مزایای کلیدی:
- مدلهای کوچک مانند عاملهای هوشمند عمل میکنند.
- هوش مصنوعی در دسترستر میشود.
- هوشمندی به جای اندازه مدل، به طراحی سیستم بستگی دارد.
ما باید به جای صرفاً افزایش تعداد پارامترها، یکپارچهسازی ابزارها را گسترش دهیم.
این اثر در AIS2C2 2025 منتشر شده است.
منبع: https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf
انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi