การก้าวขึ้นมาของ Agentic Loops: พรมแดนใหม่แห่งความสามารถในการทำงานด้วยตนเองของ AI

วิวัฒนาการของปัญญาประดิษฐ์กำลังเคลื่อนที่อย่างรวดเร็วจากการสร้างโค้ดแบบคงที่ (static code generation) ไปสู่ระบบนิเวศที่ขับเคลื่อนด้วยตนเองและมีความยืดหยุ่น (dynamic, self-sustaining ecosystems) ในขณะที่นักพัฒนาเปลี่ยนผ่านจากการเขียนโค้ดไปสู่การใช้เอเจนต์ (agents) อุตสาหกรรมกำลังเข้าสู่ยุคของ "loops" ซึ่งเป็นยุคที่เอเจนต์หนึ่งจะสั่งการเอเจนต์อื่น ๆ เพื่อทำงานที่ต่อเนื่องและทำซ้ำไปมา (iterative work)

จากซอร์สโค้ดสู่ฝูงเอเจนต์ (Agentic Swarms)

ในงานประชุม @Scale ของ Meta, Boris Cherny ผู้สร้าง Claude Code ได้เน้นย้ำถึงการเปลี่ยนแปลงครั้งสำคัญในวงจรการพัฒนา AI ในขณะที่ความสำเร็จครั้งสำคัญก่อนหน้านี้คือการเปลี่ยนจากการเขียนซอร์สโค้ดด้วยมือไปสู่โค้ดที่เขียนโดย AI, Cherny แย้งว่าก้าวกระโดดถัดไปนั้นมีความสำคัญไม่แพ้กัน นั่นคือการเปลี่ยนผ่านไปสู่เอเจนต์ที่จัดการเอเจนต์อื่น ๆ

นี่ไม่ใช่แค่เรื่องทางทฤษฎี Cherny ได้อธิบายถึงเวิร์กโฟลว์ที่เอเจนต์เฉพาะทางทำงานในวงจรที่ต่อเนื่อง ตัวอย่างเช่น เอเจนต์หนึ่งอาจมุ่งเน้นไปที่การปรับปรุงโครงสร้างโค้ด (code architecture) โดยเฉพาะ ในขณะที่อีกเอเจนต์หนึ่งทำหน้าที่สแกนหาการสร้างนามธรรมที่ซ้ำซ้อน (duplicated abstractions) เพื่อนำมารวมกัน เอเจนต์เหล่านี้ทำงานเหมือนวิศวกรที่เป็นมนุษย์ โดยมีการส่ง pull requests และทำงานแบบไม่พร้อมกัน (asynchronously) ต่างจากการทำงานอัตโนมัติแบบดั้งเดิม loops เหล่านี้เป็นแบบ non-deterministic; แทนที่จะทำตามเงื่อนไขการจบงานที่ถูกกำหนดไว้ตายตัว (hard-coded exit condition) เอเจนต์ย่อยจะใช้การให้เหตุผล (reasoning) เพื่อตัดสินใจว่างานนั้นได้รับการปรับปรุงให้เหมาะสมที่สุดหรือเสร็จสิ้นแล้วหรือยัง

ทำความเข้าใจตรรกะของ Loop และ Test-Time Compute

แนวคิดเรื่อง "loops" หยิบยืมมาจากวิทยาการคอมพิวเตอร์ขั้นพื้นฐาน โดยเฉพาะฟังก์ชันแบบเรียกซ้ำ (recursive functions) แต่มีการเพิ่มชั้นของการให้เหตุผลเชิงความน่าจะเป็น (probabilistic reasoning) เข้าไป รูปแบบหนึ่งที่น่าสนใจคือ "Ralph Loop" (ตั้งชื่อตามตัวละคร Ralph Wiggum จากเรื่อง The Simpsons) ซึ่งเป็นเทคนิคที่ใช้เพื่อป้องกันไม่ให้โมเดลเกิดอาการ "drift" (หลุดออกจากเป้าหมาย) ในระหว่างการทำงานที่ยาวนาน โมเดลจะสรุปความคืบหน้าของตัวเองและประเมินว่าบรรลุเป้าหมายแล้วหรือไม่ โดยเป็นการ "ส่งต่อ" (bouncing) ตรรกะไปมาจนกว่าจะบรรลุผลลัพธ์ที่สำเร็จ

แนวโน้มนี้มีความเชื่อมโยงอย่างใกล้ชิดกับแนวคิดเรื่อง "test-time compute" ดังที่ Noam Brown นักวิจัยจาก OpenAI ได้ตั้งข้อสังเกตไว้ว่า โมเดลในปัจจุบันสามารถแก้ปัญหาที่มีความซับซ้อนมากขึ้นเรื่อย ๆ ได้ หากได้รับทรัพยากรการคำนวณ (computational resources) ที่เพียงพอ ในสถานการณ์แบบ "hill-climbing" เช่น การปรับปรุงโค้ดเบสแบบทีละน้อย (incremental improvement), loops จะช่วยให้ AI สามารถทำซ้ำเพื่อแก้ปัญหาได้อย่างต่อเนื่อง โดยใช้การคำนวณที่มากขึ้นเพื่อรีดประสิทธิภาพให้สูงขึ้นจนกว่าจะถึงเกณฑ์ที่กำหนด

ความเป็นจริงทางเศรษฐกิจ: การใช้ Token เทียบกับมูลค่าที่ได้รับ

แม้ว่าศักยภาพทางเทคนิคของ agentic loops จะน่าทึ่ง แต่ผลกระทบทางเศรษฐกิจนั้นก็สำคัญไม่แพ้กัน ต่างจากการโต้ตอบกับแชทบอทแบบถาม-ตอบทั่วไป agentic loops ถูกออกแบบมาให้ทำงานในพื้นหลังอย่างต่อเนื่องไม่สิ้นสุด สิ่งนี้ทำให้เกิดการใช้ token พุ่งสูงขึ้นอย่างมหาศาล ซึ่งอาจนำไปสู่ต้นทุนที่สูงขึ้นอย่างรวดเร็วสำหรับองค์กร

สำหรับผู้ให้บริการ AI อย่าง Anthropic นี่คือโมเดลรายได้ที่มีการเติบโตสูง อย่างไรก็ตาม สำหรับนักพัฒนาและผู้ก่อตั้ง การนำ loops มาใช้งานจำเป็นต้องอาศัยความสมดุลที่ซับซ้อน ความสำเร็จในภูมิทัศน์ใหม่นี้จะขึ้นอยู่กับการวางระบบตรวจสอบที่เข้มงวดเพื่อจัดการกับอาการ "drift" (ภาวะที่ AI สูญเสียการรับรู้เป้าหมายเดิม) และการกำหนด guardrails ที่เคร่งครัดในการใช้ token เพื่อให้มั่นใจว่ามูลค่าที่ได้จาก loop นั้นคุ้มค่ากับต้นทุนการดำเนินงาน

สรุปประเด็นสำคัญ

  • การเปลี่ยนผ่านของความสามารถในการทำงานด้วยตนเอง: AI กำลังเปลี่ยนจากการสร้างโค้ดแบบครั้งเดียว (single-turn) ไปสู่ agentic loops ที่ทำงานได้ด้วยตนเอง ซึ่งเอเจนต์จะคอยดูแลและสั่งการกันและกัน
  • Test-Time Compute: Agentic loops ใช้ประโยชน์จากการเพิ่มการคำนวณในช่วงการอนุมาน (inference phase) เพื่อแก้ปัญหาแบบ "hill-climbing" ที่มีความซับซ้อนและต้องทำซ้ำ
  • การจัดการต้นทุนเป็นเรื่องสำคัญยิ่ง: ลักษณะการทำงานที่ต่อเนื่องของ loops เหล่านี้อาจนำไปสู่การใช้ token แบบทวีคูณ ทำให้การตรวจสอบและ guardrails ด้านงบประมาณเป็นสิ่งจำเป็นสำหรับการนำไปใช้ในระดับองค์กร