ทำไม AI Agent ส่วนใหญ่ถึงถูกออกแบบให้ซับซ้อนเกินความจำเป็น

AI agent มีอยู่ทุกหนทุกแห่ง คุณจะเห็นทั้ง agent swarms, ทีมที่ทำงานได้ด้วยตัวเอง (autonomous teams) และระบบที่พัฒนาตัวเองได้ (self-improving systems) ทุกสัปดาห์จะมีเฟรมเวิร์กใหม่ๆ ออกมาสัญญาว่าจะสร้าง AI ยุคถัดไป

หลังจากศึกษาเวิร์กโฟลว์ของ AI ผมก็ได้ข้อสรุปง่ายๆ อย่างหนึ่ง คือ AI agent ส่วนใหญ่ถูกออกแบบให้ซับซ้อนเกินความจำเป็น (overengineered)

Agent ไม่ได้ไร้ประโยชน์ อย่างไรก็ตาม ผู้สร้างหลายคนพยายามแก้ปัญหาด้วยการใช้ agent ทั้งที่จริงๆ แล้วสามารถใช้วิธีที่ง่ายกว่านั้นได้

อุตสาหกรรมนี้หลงรักความซับซ้อน

ลองจินตนาการว่าคุณต้องการสร้างระบบเพื่ออ่าน PDF, ดึงข้อมูล และตอบคำถาม ผู้สร้างหลายคนสร้างสถาปัตยกรรมที่ซับซ้อนโดยใช้ agent ถึงหกตัว, มี prompt จำนวนมาก และมีการจัดการสถานะ (state management) ซึ่งสิ่งนี้สร้างปัญหาปวดหัวตามมามากมาย

ปัญหาเดียวกันนี้มักจะจัดการได้ด้วยลำดับขั้นตอนง่ายๆ:

  • PDF to Chunk
  • Chunk to Embed
  • Embed to Vector DB
  • LLM to Response

บางครั้งแค่เวิร์กโฟลว์ก็เพียงพอแล้ว คุณไม่จำเป็นต้องมีกองทัพ agent

เวิร์กโฟลว์แก้ปัญหาได้เกือบทั้งหมด

แอปพลิเคชัน AI ส่วนใหญ่เป็นแบบ deterministic (กำหนดผลลัพธ์ได้แน่นอน) พวกมันทำงานตามลำดับขั้นตอนที่วางไว้ ตัวอย่างเช่น:

  • Document Q&A
  • Customer support
  • Meeting summaries
  • Blog generation
  • Code review

สิ่งเหล่านี้คือเวิร์กโฟลว์ ไม่ใช่ระบบอัตโนมัติ (autonomous systems) เวิร์กโฟลว์นั้นดีบั๊ก (debug) ได้ง่ายกว่า, ขยายระบบ (scale) ได้ง่ายกว่า, บำรุงรักษาง่ายกว่า และอธิบายการทำงานได้ชัดเจนกว่า

Agent นำมาซึ่งต้นทุนแฝง

Agent ใหม่ทุกตัวจะเพิ่มปัญหาตามมา:

  • ค่า token ที่สูงขึ้นจากการใช้ prompt มากขึ้น
  • ความหน่วง (latency) ที่มากขึ้นจากขั้นตอนที่เพิ่มขึ้น
  • โอกาสที่จะเกิดอาการหลอน (hallucinations) มากขึ้น
  • การดีบั๊กที่ยากขึ้น
  • ความต้องการด้านโครงสร้างพื้นฐาน (infrastructure) ที่มากขึ้น

แอปพลิเคชันง่ายๆ กลายเป็นโปรเจกต์วิศวกรรมขนาดมหึมา

เมื่อไหร่ที่ Agent จะโดดเด่นจริงๆ

ผมไม่ได้ต่อต้าน agent นะ Agent จะมีประโยชน์เมื่อ:

  • งานต้องใช้เวลานาน เช่น การค้นคว้าข้อมูลจากหลายเว็บไซต์
  • ต้องมีการตัดสินใจโดยอิงจากตรรกะเฉพาะเจาะจง
  • มีการให้มนุษย์เข้ามามีส่วนร่วมในกระบวนการ (human intervention)
  • ต้องมีการทำงานร่วมกันของเครื่องมือหลายอย่าง เช่น Slack, GitHub และ email

กฎของผม

ผู้สร้างมักจะกระโดดเข้าหาเฟรมเวิร์กที่ซับซ้อนทันที ก่อนที่คุณจะทำแบบนั้น ให้ถามคำถามเดียว: "เวิร์กโฟลว์สามารถแก้ปัญหานี้ได้หรือไม่?"

ถ้าคำตอบคือใช่ ให้เริ่มจากตรงนั้น เพิ่ม agent เข้ามาก็ต่อเมื่อความซับซ้อนของงานบังคับให้ต้องทำเท่านั้น

ให้ยึดหลักการนี้:

  • Workflow มาก่อน
  • Agent มาเป็นอันดับสอง
  • Multi-agent มาเป็นลำดับสุดท้าย

ความซับซ้อนไม่ใช่นวัตกรรม ความซับซ้อนคือต้นทุน ผู้ใช้ไม่สนใจว่าคุณใช้ agent ไปกี่ตัว พวกเขาสนใจแค่ว่าเครื่องมือนั้นใช้งานได้จริงหรือไม่ ความเรียบง่ายคือฟีเจอร์อย่างหนึ่ง

Source: https://dev.to/jaideepparashar/why-i-think-most-ai-agents-are-overengineered-249o