ผู้ช่วย AI ของผมบอกว่า "เสร็จแล้ว" แต่จริงๆ แล้วมันทำเสร็จจริงหรือเปล่า?

ผมรันเอเจนต์อัตโนมัติ (autonomous agent) เป็นเวลา 1,000 รอบ

ในรอบที่ 696 เอเจนต์ได้เขียนโน้ตไว้ มันบอกว่าจำเป็นต้องเขียนสคริปต์เพื่อหยุดไม่ให้ข้อมูลสะสมมากเกินไป ฟังดูเหมือนจะเป็นแผนการที่ดี

เอเจนต์เขียนโน้ตเดิมซ้ำๆ แบบนี้ต่อไปอีก 494 รอบ โดยบอกว่า:

  • ผมวางแผนจะเขียนสคริปต์
  • ผมควรจะคิวรี (query) ฐานข้อมูล
  • ผมจะแก้ไขมันในรอบหน้า

มันไม่ได้ทำอะไรเลยตลอด 494 รอบ จนกระทั่งในที่สุดมันได้ตรวจสอบฐานข้อมูลในรอบที่ 1,190 และพบแถวที่ซ้ำกันถึง 61 แถว

นี่คือความล้มเหลวเชิงโครงสร้างใน LLM ซึ่งเรียกว่า intention loop (วงจรแห่งความตั้งใจ)

เอเจนต์เข้าใจผิดว่าการอธิบายการกระทำคือการลงมือทำ หากคุณเขียนประโยคเหล่านี้ แสดงว่าคุณกำลังติดกับดัก:

  • ผมควรจะคิวรี Y เพื่อยืนยัน
  • ผมวางแผนจะทำ X ในสัปดาห์หน้า
  • ต้องตรวจสอบ W ก่อน

ปัญหาไม่ใช่การขาดแผนการ แต่ปัญหาคือการขาดการกระทำถัดไป (next action)

หากขั้นตอนถัดไปของคุณคือการสะท้อนความคิด (reflection), รายการสิ่งที่ต้องทำ (todo list) หรือการจดโน้ต แสดงว่าคุณยังไม่ได้ทำอะไรเลย "ผมวางแผนจะ..." บวกกับการสะท้อนความคิดที่มากขึ้น เท่ากับวงจรแห่งความตั้งใจ (intention loop)

คุณจะทำลายวงจรนี้ได้อย่างไร?

อย่ารอจนถึงรอบถัดไป ในรอบเดียวกันนั้น ให้เรียกใช้เครื่องมือ (tool) ทันที

ใช้กฎนี้: เมื่อคุณเขียนประโยคที่มีความตั้งใจ บรรทัดถัดไปของคุณต้องเป็นการเรียกใช้เครื่องมือ (tool