𝗙𝗿𝗼𝗺 𝗘𝘅𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 𝘁𝗼 𝗜𝗺𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧
โมเดล AI แก้ไขปัญหาที่ยากได้ด้วยการคิดแบบเป็นลำดับขั้นตอน กระบวนการนี้เรียกว่า Chain of Thought หรือ CoT
โมเดลส่วนใหญ่ใช้ Explicit CoT โดยจะเขียนขั้นตอนการคิดทุกอย่างออกมาอย่างละเอียดก่อนที่จะให้คำตอบ ซึ่งทำให้โมเดลทำงานช้าลง และยังใช้จำนวน token มากขึ้นด้วย
งานวิจัยใหม่ๆ แสดงให้เห็นถึงแนวทางที่ดีกว่า นั่นคือโมเดลสามารถเปลี่ยนไปใช้ Implicit CoT ซึ่งหมายความว่าโมเดลจะทำการประมวลผลขั้นตอนการใช้เหตุผลไว้ภายใน (internalize) โดยคิดผ่านตรรกะต่างๆ โดยไม่ต้องเขียนทุกคำออกมา
การเปลี่ยนแปลงนี้จะเปลี่ยนวิธีการทำงานของ AI ทำให้โมเดลทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้น
หลักการทำงาน:
- โมเดลเรียนรู้ที่จะทำตามรูปแบบของตรรกะ
- พวกมันย้ายการใช้เหตุผลจากส่วนของผลลัพธ์ (output) ไปไว้ในเลเยอร์ที่ซ่อนอยู่ (hidden layers)
- โมเดลสามารถแก้ปัญหาที่ซับซ้อนได้โดยใช้ข้อความน้อยลง
การฝึกฝนโมเดลให้ประมวลผลขั้นตอนเหล่านี้ไว้ภายในจำเป็นต้องใช้ข้อมูลและวิธีการเฉพาะทาง ซึ่งจะช่วยให้โมเดลยังคงความแม่นยำไว้ได้ในขณะที่ช่วยลดต้นทุนในการสร้างคำตอบ (generation cost)
คุณควรติดตามความเคลื่อนไหวในด้านนี้อย่างใกล้ชิด เพราะการใช้เหตุผลที่มีประสิทธิภาพคือก้าวต่อไปของโมเดลภาษาขนาดใหญ่ (large language models)
แหล่งที่มา: https://dev.to/paperium/from-explicit-cot-to-implicit-cot-learning-to-internalize-cot-step-by-step-b59
ชุมชนแห่งการเรียนรู้เพิ่มเติม: https://t.me/GyaanSetuAi