Sự bùng nổ của các công cụ AI Agent
Các AI agent đang tiến triển rất nhanh. Tuần này người ta nói về chat. Tuần sau họ đã nói về những agent có thể triển khai tính năng ngay cả khi bạn đang ngủ.
Một plugin mới gần đây đã đạt được 73.000 sao trên GitHub chỉ trong ba tuần. Đây không phải là sự thổi phồng. Đây là một sự chuyển dịch trong cách chúng ta xây dựng phần mềm.
Tôi đã nghiên cứu các công cụ agent mã nguồn mở phổ biến nhất. Chỉ riêng năm dự án đã có gần 500.000 sao. Chúng không cạnh tranh nhau. Chúng giải quyết các phần khác nhau của cùng một vấn đề.
Dưới đây là dữ liệu:
• obra/superpowers: 245.614 sao. Một framework cho các kỹ năng và phương pháp luận của agent. • thedotmack/claude-mem: 85.713 sao. Bộ nhớ bền vững cho các agent. • bytedance/deer-flow: 76.027 sao. Các công cụ dành cho nghiên cứu và lập trình. • DietrichGebert/ponytail: 73.143 sao. Giúp các agent tư duy như những lập trình viên cao cấp (senior devs). • cobusgreyling/loop-engineering: Mới. Một framework về vòng lặp kỹ thuật (engineering loop).
Những công cụ này cho chúng ta thấy năm bài học:
Viết ít code hơn. Hầu hết các công cụ đều tập trung vào số lượng. Chúng muốn tạo ra càng nhiều code càng tốt. Những công cụ tốt nhất lại tập trung vào giá trị. Một công cụ có tên Ponytail dạy các agent hành động như những lập trình viên cao cấp "lười biếng". Nó sẽ hỏi liệu một thay đổi có thực sự cần thiết hay không trước khi viết code. Đoạn code nhanh nhất chính là đoạn code mà bạn không bao giờ phải viết.
Cấu trúc quan trọng hơn các mô hình thông minh. Bạn không thể chỉ yêu cầu một agent xây dựng một tính năng. Bạn cần một quy trình. Các công cụ thành công sử dụng một vòng đời có cấu trúc:
- Spec: Xác định những gì cần xây dựng.
- Plan: Chia nhỏ công việc thành các bước.
- Implement: Viết code từng bước một.
- Review: Tự động hóa việc kiểm duyệt.
- Refactor: Tối ưu hóa dựa trên các phát hiện.
Agent cần bộ nhớ. Các agent tiêu chuẩn thường quên những gì chúng đã làm cách đây năm phút. Các công cụ như Claude-mem cung cấp cho agent một "bộ não". Chúng lưu trữ các mô hình dự án và các quyết định qua các phiên làm việc khác nhau. Điều này giúp bạn tránh việc phải lặp lại chính mình.
Tập trung vào các lớp trung gian. Đừng chỉ hỏi nên sử dụng agent nào. Giá trị thực sự nằm ở giữa các lớp (stack):
- Skills: Cách agent hành xử.
- Memory: Cách nó ghi nhớ.
- Orchestration: Cách nó quản lý các tác vụ.
- Bảo mật là một rủi ro lớn. Nhiều agent bị rò rỉ system prompt. Nếu agent của bạn có quyền truy cập vào mã nguồn hoặc thông tin xác thực (credentials), điều này sẽ rất nguy hiểm. Hãy sử dụng môi trường sandbox và chỉ cấp cho agent những quyền truy cập tối thiểu cần thiết.
Tương lai không phải là một siêu agent duy nhất. Tương lai là một stack các công cụ làm việc cùng nhau.
Optional learning community: https://t.me/GyaanSetuAi
