จาก Explicit CoT สู่ Implicit CoT

📅1 hour ago⏱1 min read

𝗙𝗿𝗼𝗺 𝗘𝘅𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧 𝘁𝗼 𝗜𝗺𝗽𝗹𝗶𝗰𝗶𝘁 𝗖𝗼𝗧

โมเดล AI แก้ไขปัญหาที่ยากได้ด้วยการคิดแบบเป็นลำดับขั้นตอน กระบวนการนี้เรียกว่า Chain of Thought หรือ CoT

โมเดลส่วนใหญ่ใช้ Explicit CoT โดยจะเขียนขั้นตอนการคิดทุกอย่างออกมาอย่างละเอียดก่อนที่จะให้คำตอบ ซึ่งทำให้โมเดลทำงานช้าลง และยังใช้จำนวน token มากขึ้นด้วย

งานวิจัยใหม่ๆ แสดงให้เห็นถึงแนวทางที่ดีกว่า นั่นคือโมเดลสามารถเปลี่ยนไปใช้ Implicit CoT ซึ่งหมายความว่าโมเดลจะทำการประมวลผลขั้นตอนการใช้เหตุผลไว้ภายใน (internalize) โดยคิดผ่านตรรกะต่างๆ โดยไม่ต้องเขียนทุกคำออกมา

การเปลี่ยนแปลงนี้จะเปลี่ยนวิธีการทำงานของ AI ทำให้โมเดลทำงานได้เร็วขึ้นและมีประสิทธิภาพมากขึ้น

หลักการทำงาน:

โมเดลเรียนรู้ที่จะทำตามรูปแบบของตรรกะ
พวกมันย้ายการใช้เหตุผลจากส่วนของผลลัพธ์ (output) ไปไว้ในเลเยอร์ที่ซ่อนอยู่ (hidden layers)
โมเดลสามารถแก้ปัญหาที่ซับซ้อนได้โดยใช้ข้อความน้อยลง

การฝึกฝนโมเดลให้ประมวลผลขั้นตอนเหล่านี้ไว้ภายในจำเป็นต้องใช้ข้อมูลและวิธีการเฉพาะทาง ซึ่งจะช่วยให้โมเดลยังคงความแม่นยำไว้ได้ในขณะที่ช่วยลดต้นทุนในการสร้างคำตอบ (generation cost)

คุณควรติดตามความเคลื่อนไหวในด้านนี้อย่างใกล้ชิด เพราะการใช้เหตุผลที่มีประสิทธิภาพคือก้าวต่อไปของโมเดลภาษาขนาดใหญ่ (large language models)

แหล่งที่มา: https://dev.to/paperium/from-explicit-cot-to-implicit-cot-learning-to-internalize-cot-step-by-step-b59

ชุมชนแห่งการเรียนรู้เพิ่มเติม: https://t.me/GyaanSetuAi

จาก Explicit CoT สู่ Implicit CoT

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

อย่าปล่อยให้ AI คิดแทนคุณ

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗟𝗮𝘁𝗲𝗻𝗰𝘆 𝗜𝘀 𝗧𝗵𝗲 𝗠𝗼𝘀𝘁 𝗛𝗼𝗻𝗲𝘀𝘁 𝗣𝗮𝗿𝘁 𝗢𝗳 𝗔𝗜

AI จะมีประสิทธิภาพก็ต่อเมื่อคุณเคยผ่านความยากลำบากมาแล้ว