การระเบิดตัวของเครื่องมือสำหรับ AI Agent
AI agent กำลังพัฒนาไปอย่างรวดเร็ว สัปดาห์นี้ผู้คนพูดถึงเรื่องแชท สัปดาห์หน้าพวกเขาก็พูดถึงเอเจนต์ที่สามารถส่งมอบฟีเจอร์ได้ในขณะที่คุณกำลังหลับ
ปลั๊กอินใหม่ตัวหนึ่งเพิ่งได้รับ GitHub stars ถึง 73,000 ดวงภายในเวลาเพียงสามสัปดาห์ นี่ไม่ใช่แค่กระแสชั่วคราว แต่มันคือการเปลี่ยนแปลงในวิธีการที่เราสร้างซอฟต์แวร์
ผมได้ศึกษาเครื่องมือเอเจนต์แบบโอเพนซอร์สที่ได้รับความนิยมมากที่สุด เพียงแค่ 5 โปรเจกต์นี้ก็มีดาวรวมกันเกือบ 500,000 ดวงแล้ว พวกมันไม่ได้แข่งขันกัน แต่พวกมันช่วยแก้ปัญหาคนละส่วนของปัญหาเดียวกัน
นี่คือข้อมูล:
• obra/superpowers: 245,614 stars. เฟรมเวิร์กสำหรับทักษะและระเบียบวิธีของเอเจนต์ • thedotmack/claude-mem: 85,713 stars. หน่วยความจำแบบถาวรสำหรับเอเจนต์ • bytedance/deer-flow: 76,027 stars. เครื่องมือสำหรับการวิจัยและการเขียนโค้ด • DietrichGebert/ponytail: 73,143 stars. ช่วยให้เอเจนต์คิดเหมือนนักพัฒนาอาวุโส (senior devs) • cobusgreyling/loop-engineering: ใหม่. เฟรมเวิร์กสำหรับวงจรการทำงานทางวิศวกรรม (engineering loop)
เครื่องมือเหล่านี้แสดงให้เราเห็นบทเรียน 5 ประการ:
เขียนโค้ดให้น้อยลง เครื่องมือส่วนใหญ่เน้นที่ปริมาณ พวกเขาต้องการสร้างโค้ดให้ได้มากที่สุดเท่าที่จะเป็นไปได้ แต่เครื่องมือที่ดีที่สุดจะเน้นที่มูลค่า เครื่องมือที่ชื่อ Ponytail สอนให้เอเจนต์ทำตัวเหมือนนักพัฒนาอาวุโสที่ขี้เกียจ มันจะถามก่อนว่าการเปลี่ยนแปลงนั้นจำเป็นหรือไม่ก่อนที่จะเริ่มเขียน โค้ดที่เร็วที่สุดคือโค้ดที่คุณไม่ต้องเขียนเลย
โครงสร้างสำคัญกว่าโมเดลที่ฉลาด คุณไม่สามารถแค่สั่งให้เอเจนต์สร้างฟีเจอร์ได้ แต่คุณต้องมีกระบวนการ เครื่องมือที่ประสบความสำเร็จจะใช้ขั้นตอนการทำงานที่มีโครงสร้างชัดเจน:
- Spec: กำหนดสิ่งที่จะสร้าง
- Plan: แบ่งงานออกเป็นขั้นตอน
- Implement: เขียนโค้ดทีละขั้นตอน
- Review: ตรวจสอบแบบอัตโนมัติ
- Refactor: ปรับปรุงตามสิ่งที่พบ
เอเจนต์ต้องการหน่วยความจำ เอเจนต์ทั่วไปมักจะลืมสิ่งที่ทำไปเมื่อห้านาทีก่อน เครื่องมืออย่าง Claude-mem ช่วยให้เอเจนต์มี "สมอง" พวกมันสามารถจัดเก็บรูปแบบของโปรเจกต์และการตัดสินใจต่างๆ ข้ามเซสชันได้ สิ่งนี้จะช่วยป้องกันไม่ให้คุณต้องสั่งงานซ้ำซาก
ให้ความสำคัญกับเลเยอร์ระดับกลาง อย่าถามแค่ว่าจะใช้เอเจนต์ตัวไหน มูลค่าที่แท้จริงอยู่ที่เลเยอร์ระดับกลางของ Stack:
- Skills: พฤติกรรมของเอเจนต์
- Memory: วิธีการจดจำ
- Orchestration: วิธีการจัดการงาน
- ความปลอดภัยคือความเสี่ยงที่สำคัญ เอเจนต์หลายตัวทำข้อมูล System Prompt รั่วไหล หากเอเจนต์ของคุณสามารถเข้าถึงโค้ดหรือข้อมูลประจำตัว (credentials) ได้ นี่ถือเป็นเรื่องอันตราย ควรใช้สภาพแวดล้อมแบบ Sandbox และให้สิทธิ์การเข้าถึงแก่เอเจนต์เพียงเท่าที่จำเป็นเท่านั้น
อนาคตไม่ใช่การมีซูเปอร์เอเจนต์เพียงตัวเดียว แต่อนาคตคือการทำงานร่วมกันของชุดเครื่องมือ (stack of tools)
Optional learning community: https://t.me/GyaanSetuAi
