𝗧𝗵𝗲 𝗔𝗴𝗲𝗻𝘁-𝗡𝗮𝘁𝗶𝘃𝗲 𝗦𝘁𝗮𝗰𝗸: การออกแบบโครงสร้างพื้นฐานใหม่สำหรับ AI

AI coding agents อย่าง Claude Code และ Codex กำลังส่งคำขอ API หลายล้านครั้งในทุกๆ เดือน เอเจนต์เหล่านี้ไม่ได้ใช้เบราว์เซอร์ พวกเขาไม่ได้คลิกปุ่ม และพวกเขาไม่ได้แก้ CAPTCHA

หากโครงสร้างพื้นฐานของคุณต้องให้มนุษย์ล็อกอินหรือคลิก "confirm" เอเจนต์จะทำงานล้มเหลว เมื่อเอเจนต์เจออุปสรรค (friction) พวกเขาก็จะเลิกใช้งานไป

เพื่อให้ยังคงมีความสำคัญ คุณต้องสร้างโครงสร้างพื้นฐานแบบ agent-native นี่คือ 5 เสาหลักของ stack ใหม่นี้:

  • Ephemeral Deployments: เอเจนต์ต้องการสภาพแวดล้อมแบบชั่วคราว (throwaway environments) เพื่อทดสอบโค้ด ปัจจุบัน Cloudflare อนุญาตให้มีการ deploy แบบชั่วคราวโดยไม่จำเป็นต้องมีบัญชีหรือ OAuth สิ่งนี้ช่วยสร้างวงจรการตอบกลับ (feedback loop) ที่รวดเร็วสำหรับเอเจนต์แบบอัตโนมัติ

  • Dual-Mode CLIs: มนุษย์ชอบสีสันและตาราง แต่เอเจนต์ชอบข้อมูลที่มีโครงสร้าง เครื่องมืออย่าง Hugging Face CLI ในปัจจุบันสามารถตรวจจับได้ว่ามีเอเจนต์กำลังทำงานอยู่หรือไม่ โดยจะสลับจากการแสดงผลที่เหมาะสำหรับมนุษย์ ไปเป็นรูปแบบ TSV หรือ JSON ที่เครื่องอ่านได้โดยอัตโนมัติ ซึ่งช่วยลดต้นทุน token ได้สูงสุดถึง 6 เท่า

  • Agent-Friendly Auth: โมเดล OAuth ตั้งอยู่บนสมมติฐานว่ามีมนุษย์คอยใช้งานเบราว์เซอร์อยู่ ซึ่งทำให้เอเจนต์ทำงานไม่ได้ โปรโตคอลใหม่ๆ อย่าง auth.md ช่วยให้เอเจนต์สามารถค้นหาและใช้งานขั้นตอนการยืนยันตัวตน (authentication flows) ได้โดยไม่ต้องอาศัยมนุษย์เข้ามาแทรกแซง

  • Agentic Benchmarking: การวัดผลความสำเร็จกำลังเปลี่ยนไป เราไม่ได้แค่ตรวจสอบว่าคำตอบถูกต้องหรือไม่อีกต่อไป แต่เราวัดจากเส้นทางที่ใช้ (path taken) เราติดตามการใช้งาน token, การเรียกใช้เครื่องมือ (tool calls) และอัตราข้อผิดพลาด เพื่อดูว่าเอเจนต์ทำงานได้อย่างมีประสิทธิภาพเพียงใด

  • OpenEnv and RL: เราต้องการวิธีการมาตรฐานในการฝึกฝนเอเจนต์ OpenEnv มอบอินเทอร์เฟซที่เป็นสากลระหว่างเอเจนต์และสภาพแวดล้อมใดๆ สิ่งนี้ช่วยให้เอเจนต์สามารถเรียนรู้โดยใช้เครื่องมือแบบเดียวกับที่จะใช้ในสภาพแวดล้อมการทำงานจริง (production)

บริการของคุณต้องเปลี่ยนจาก "นักพัฒนาสามารถใช้งานสิ่งนี้ได้หรือไม่?" ไปเป็น "เอเจนต์สามารถใช้งานสิ่งนี้ได้อย่างอิสระหรือไม่?"

Checklist สำหรับการออกแบบแบบ agent-native: • ให้ผลลัพธ์เป็น JSON ที่เครื่องอ่านได้ • เพิ่ม flag --non-interactive ในทุกคำสั่ง CLI • เผยแพร่ไฟล์ auth.md ที่อธิบายวิธีการยืนยันตัวตนของเอเจนต์ • ใช้คำใบ้แบบ pre-parameterized ใน CLI ของคุณเพื่อบอกเอเจนต์ว่าควรใช้คำสั่งถัดไปคืออะไร • ห้ามตัดทอน (truncate) ผลลัพธ์ในโหมดเอเจนต์โดยเด็ดขาด

ยุคที่ AI agent จะกลายเป็นผู้ใช้งานหลักของ API มาถึงแล้ว จงสร้างเพื่อรองรับพวกเขาตั้งแต่วันนี้ หรือไม่ก็ต้องถูกทิ้งไว้ข้างหลัง

Source: https://dev.to/monuminu/the-agent-native-stack-how-developers-must-redesign-infrastructure-for-the-agentic-ai-era-362j