𝗣𝗿𝗼𝗺𝗽𝘁-𝗗𝗿𝗶𝘃𝗲𝗻 𝗧𝗼𝗼𝗹-𝗖𝗮𝗹𝗹𝗶𝗻𝗴 𝗳𝗼𝗿 𝗟𝗶𝗴𝗵𝘁𝘄𝗲𝗶𝗴𝗵𝘁 𝗢𝗽𝗲𝗻 𝗦𝗼𝘂𝗿𝗰𝗲 𝗟𝗟𝗠𝘀

GPT-4 सारखी मोठी मॉडेल्स उत्तम काम करतात. त्यांना उच्च संगणकीय क्षमतेची (compute needs) आवश्यकता असते.

लहान ओपन सोर्स मॉडेल्सना अनेकदा जटिल तर्कामध्ये (complex reasoning) अडचणी येतात. मोठी मॉडेल्स चालवण्यासाठी तुम्हाला मोठ्या प्रमाणात GPUs लागतात.

मी संरचित प्रॉम्प्ट्सच्या (structured prompts) माध्यमातून लहान मॉडेल्सना टूल्स वापरण्यास मदत करण्याचा एक मार्ग शोधला आहे. या संशोधनाचे शीर्षक 'Prompt-Driven Tool-Calling for Lightweight Open Source LLMs' असे आहे.

समस्या:

  • लहान मॉडेल्समध्ये तर्काचा (reasoning) अभाव असतो.
  • मोठी मॉडेल्स चालवणे खर्चिक असते.
  • आपल्याला कमी हार्डवेअरवर चालणारे कार्यक्षम एजंट्स (efficient agents) हवे आहेत.

उपाय: मॉडेल्सना सर्व काही पाठ (memorize) करण्यास भाग पाडणे थांबवा. मॉडेलला कंट्रोलरमध्ये रूपांतरित करण्यासाठी प्रॉम्प्ट्सचा वापर करा.

हे कसे कार्य करते: प्रॉम्प्ट मॉडेलला खालील गोष्टींसाठी मार्गदर्शन करते:

  • तुमचा हेतू समजून घेणे.
  • समस्यांचे टप्प्यांमध्ये विभाजन करणे.
  • अंदाज लावण्याऐवजी योग्य टूल निवडणे.

कार्यप्रवाह (workflow) या पायऱ्यांचे अनुसरण करतो: User Question $\rightarrow$ LLM $\rightarrow$ Tool Selection $\rightarrow$ Tool Execution $\rightarrow$ Final Answer.

तथ्ये अचूक मिळवण्यासाठी मॉडेल कॅल्क्युलेटरसारखी टूल्स वापरते.

मुख्य फायदे:

  • लहान मॉडेल्स बुद्धिमान एजंट्सप्रमाणे काम करतात.
  • AI अधिक सुलभ होते.
  • बुद्धिमत्ता ही मॉडेलच्या आकारापेक्षा सिस्टम डिझाइनवर अवलंबून असते.

आपण केवळ पॅरामीटर्स वाढवण्याऐवजी टूल इंटिग्रेशन (tool integration) वाढवले पाहिजे.

हे कार्य AIS2C2 2025 मध्ये प्रकाशित झाले आहे.

स्रोत: https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf

ऐच्छिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi