การเรียกใช้เครื่องมือด้วย Prompt สำหรับ Lightweight Open Source LLMs

โมเดลขนาดใหญ่เช่น GPT-4 ทำงานได้ดี แต่ต้องใช้ทรัพยากรในการประมวลผลสูง

โมเดลโอเพนซอร์สขนาดเล็กมักจะมีปัญหาในการใช้เหตุผลที่ซับซ้อน และการรันโมเดลขนาดใหญ่ก็จำเป็นต้องใช้ GPU จำนวนมหาศาล

ผมได้วิจัยวิธีการช่วยให้โมเดลขนาดเล็กสามารถใช้เครื่องมือต่างๆ ได้ผ่านการใช้ Prompt ที่มีโครงสร้าง งานวิจัยนี้มีชื่อว่า Prompt-Driven Tool-Calling for Lightweight Open Source LLMs

ปัญหาที่พบ:

  • โมเดลขนาดเล็กขาดทักษะการใช้เหตุผล
  • การรันโมเดลขนาดใหญ่มีค่าใช้จ่ายสูง
  • เราต้องการ Agent ที่มีประสิทธิภาพซึ่งสามารถทำงานบนฮาร์ดแวร์ที่น้อยกว่าได้

แนวทางแก้ไข: หยุดบังคับให้โมเดลต้องจดจำทุกอย่าง แต่ใช้ Prompt เพื่อเปลี่ยนโมเดลให้กลายเป็นตัวควบคุม (Controller)

หลักการทำงาน: Prompt จะช่วยนำทางโมเดลให้:

  • เข้าใจเจตนาของคุณ
  • ย่อยปัญหาออกเป็นขั้นตอน
  • เลือกใช้เครื่องมือแทนการคาดเดา

ขั้นตอนการทำงาน (Workflow) มีดังนี้: คำถามจากผู้ใช้ $\rightarrow$ LLM $\rightarrow$ การเลือกเครื่องมือ $\rightarrow$ การเรียกใช้เครื่องมือ $\rightarrow$ คำตอบสุดท้าย

โมเดลจะใช้เครื่องมือ เช่น เครื่องคิดเลข เพื่อให้ได้ข้อมูลที่ถูกต้อง

ประโยชน์หลัก:

  • โมเดลขนาดเล็กทำงานได้เหมือน Agent ที่ชาญฉลาด
  • AI เข้าถึงได้ง่ายขึ้น
  • ความฉลาดขึ้นอยู่กับการออกแบบระบบมากกว่าขนาดของโมเดล

เราควรขยายขอบเขตการรวมเครื่องมือ (Tool Integration) แทนที่จะมุ่งเน้นเพียงแค่การเพิ่มจำนวนพารามิเตอร์

งานวิจัยนี้ได้รับการตีพิมพ์ใน AIS2C2 2025

แหล่งที่มา: https://www.aiscindia.co.in/wp-content/uploads/2026/06/ilovepdf_merged-4.pdf

ชุมชนแห่งการเรียนรู้ (ไม่บังคับ): https://t.me/GyaanSetuAi