การเรียกใช้เครื่องมือด้วย Prompt สำหรับ Lightweight Open Source LLMs
โมเดลขนาดใหญ่เช่น GPT-4 ทำงานได้ดี แต่ต้องใช้ทรัพยากรในการประมวลผลสูง
โมเดลโอเพนซอร์สขนาดเล็กมักจะมีปัญหาในการใช้เหตุผลที่ซับซ้อน และการรันโมเดลขนาดใหญ่ก็จำเป็นต้องใช้ GPU จำนวนมหาศาล
ผมได้วิจัยวิธีการช่วยให้โมเดลขนาดเล็กสามารถใช้เครื่องมือต่างๆ ได้ผ่านการใช้ Prompt ที่มีโครงสร้าง งานวิจัยนี้มีชื่อว่า Prompt-Driven Tool-Calling for Lightweight Open Source LLMs
ปัญหาที่พบ:
- โมเดลขนาดเล็กขาดทักษะการใช้เหตุผล
- การรันโมเดลขนาดใหญ่มีค่าใช้จ่ายสูง
- เราต้องการ Agent ที่มีประสิทธิภาพซึ่งสามารถทำงานบนฮาร์ดแวร์ที่น้อยกว่าได้
แนวทางแก้ไข: หยุดบังคับให้โมเดลต้องจดจำทุกอย่าง แต่ใช้ Prompt เพื่อเปลี่ยนโมเดลให้กลายเป็นตัวควบคุม (Controller)
หลักการทำงาน: Prompt จะช่วยนำทางโมเดลให้:
- เข้าใจเจตนาของคุณ
- ย่อยปัญหาออกเป็นขั้นตอน
- เลือกใช้เครื่องมือแทนการคาดเดา
ขั้นตอนการทำงาน (Workflow) มีดังนี้: คำถามจากผู้ใช้ $\rightarrow$ LLM $\rightarrow$ การเลือกเครื่องมือ $\rightarrow$ การเรียกใช้เครื่องมือ $\rightarrow$ คำตอบสุดท้าย
โมเดลจะใช้เครื่องมือ เช่น เครื่องคิดเลข เพื่อให้ได้ข้อมูลที่ถูกต้อง
ประโยชน์หลัก:
- โมเดลขนาดเล็กทำงานได้เหมือน Agent ที่ชาญฉลาด
- AI เข้าถึงได้ง่ายขึ้น
- ความฉลาดขึ้นอยู่กับการออกแบบระบบมากกว่าขนาดของโมเดล
เราควรขยายขอบเขตการรวมเครื่องมือ (Tool Integration) แทนที่จะมุ่งเน้นเพียงแค่การเพิ่มจำนวนพารามิเตอร์
งานวิจัยนี้ได้รับการตีพิมพ์ใน AIS2C2 2025
แหล่งที่มา: https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf
ชุมชนแห่งการเรียนรู้ (ไม่บังคับ): https://t.me/GyaanSetuAi