فراخوانی ابزار مبتنی بر پرامپت برای مدل‌های زبانی بزرگ (LLM) متن‌باز سبک‌وزن

مدل‌های بزرگ مانند GPT-4 به خوبی عمل می‌کنند، اما نیاز به توان محاسباتی بالایی دارند.

مدل‌های متن‌باز کوچک اغلب در استدلال‌های پیچیده دچار مشکل می‌شوند. همچنین برای اجرای مدل‌های بزرگ به پردازنده‌های گرافیکی (GPU) بسیار قدرتمندی نیاز دارید.

من روشی را برای کمک به مدل‌های کوچک جهت استفاده از ابزارها از طریق پرامپت‌های ساختاریافته تحقیق کردم. عنوان این تحقیق Prompt-Driven Tool-Calling for Lightweight Open Source LLMs است.

مسئله:

  • مدل‌های کوچک فاقد مهارت‌های استدلالی هستند.
  • اجرای مدل‌های بزرگ هزینه‌بر است.
  • ما به عامل‌های (agents) کارآمدی نیاز داریم که روی سخت‌افزار کمتری اجرا شوند.

راه حل: از مجبور کردن مدل‌ها به حفظ کردن همه چیز دست بردارید. از پرامپت‌ها استفاده کنید تا مدل را به یک کنترل‌کننده تبدیل کنید.

نحوه عملکرد: پرامپت، مدل را برای موارد زیر هدایت می‌کند:

  • درک قصد و نیت شما.
  • تجزیه مسائل به گام‌های مختلف.
  • انتخاب یک ابزار به جای حدس زدن.

گردش کار از این مراحل پیروی می‌کند: سوال کاربر $\rightarrow$ LLM $\rightarrow$ انتخاب ابزار $\rightarrow$ اجرای ابزار $\rightarrow$ پاسخ نهایی.

مدل از ابزارهایی مانند ماشین‌حساب استفاده می‌کند تا واقعیت‌ها را به درستی استخراج کند.

مزایای کلیدی:

  • مدل‌های کوچک مانند عامل‌های هوشمند عمل می‌کنند.
  • هوش مصنوعی در دسترس‌تر می‌شود.
  • هوشمندی به جای اندازه مدل، به طراحی سیستم بستگی دارد.

ما باید به جای صرفاً افزایش تعداد پارامترها، یکپارچه‌سازی ابزارها را گسترش دهیم.

این اثر در AIS2C2 2025 منتشر شده است.

منبع: https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi