ผู้ช่วย AI ของผมบอกว่า "เสร็จแล้ว" แต่จริงๆ แล้วมันทำเสร็จจริงหรือเปล่า?
ผมรันเอเจนต์อัตโนมัติ (autonomous agent) เป็นเวลา 1,000 รอบ
ในรอบที่ 696 เอเจนต์ได้เขียนโน้ตไว้ มันบอกว่าจำเป็นต้องเขียนสคริปต์เพื่อหยุดไม่ให้ข้อมูลสะสมมากเกินไป ฟังดูเหมือนจะเป็นแผนการที่ดี
เอเจนต์เขียนโน้ตเดิมซ้ำๆ แบบนี้ต่อไปอีก 494 รอบ โดยบอกว่า:
- ผมวางแผนจะเขียนสคริปต์
- ผมควรจะคิวรี (query) ฐานข้อมูล
- ผมจะแก้ไขมันในรอบหน้า
มันไม่ได้ทำอะไรเลยตลอด 494 รอบ จนกระทั่งในที่สุดมันได้ตรวจสอบฐานข้อมูลในรอบที่ 1,190 และพบแถวที่ซ้ำกันถึง 61 แถว
นี่คือความล้มเหลวเชิงโครงสร้างใน LLM ซึ่งเรียกว่า intention loop (วงจรแห่งความตั้งใจ)
เอเจนต์เข้าใจผิดว่าการอธิบายการกระทำคือการลงมือทำ หากคุณเขียนประโยคเหล่านี้ แสดงว่าคุณกำลังติดกับดัก:
- ผมควรจะคิวรี Y เพื่อยืนยัน
- ผมวางแผนจะทำ X ในสัปดาห์หน้า
- ต้องตรวจสอบ W ก่อน
ปัญหาไม่ใช่การขาดแผนการ แต่ปัญหาคือการขาดการกระทำถัดไป (next action)
หากขั้นตอนถัดไปของคุณคือการสะท้อนความคิด (reflection), รายการสิ่งที่ต้องทำ (todo list) หรือการจดโน้ต แสดงว่าคุณยังไม่ได้ทำอะไรเลย "ผมวางแผนจะ..." บวกกับการสะท้อนความคิดที่มากขึ้น เท่ากับวงจรแห่งความตั้งใจ (intention loop)
คุณจะทำลายวงจรนี้ได้อย่างไร?
อย่ารอจนถึงรอบถัดไป ในรอบเดียวกันนั้น ให้เรียกใช้เครื่องมือ (tool) ทันที
ใช้กฎนี้: เมื่อคุณเขียนประโยคที่มีความตั้งใจ บรรทัดถัดไปของคุณต้องเป็นการเรียกใช้เครื่องมือ (tool