𝗪𝗵𝘆 𝗠𝗼𝘀𝘁 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗢𝘃𝗲𝗿𝗲𝗻𝗴𝗶𝗻𝗲𝗲𝗿𝗲𝗱
Các AI agent đang có mặt ở khắp mọi nơi. Bạn thấy các bầy đàn agent (agent swarms), các đội ngũ tự trị và các hệ thống tự cải thiện. Mỗi tuần, một framework mới lại hứa hẹn xây dựng thế hệ AI tiếp theo.
Sau khi nghiên cứu các workflow của AI, tôi có một kết luận đơn giản. Hầu hết các AI agent đều bị thiết kế quá mức (overengineered).
Agent không hề vô dụng. Tuy nhiên, nhiều người xây dựng giải quyết vấn đề bằng agent trong khi họ có thể sử dụng thứ gì đó đơn giản hơn.
Ngành công nghiệp yêu thích sự phức tạp
Hãy tưởng tượng bạn muốn xây dựng một hệ thống để đọc PDF, trích xuất dữ liệu và trả lời câu hỏi. Nhiều người xây dựng tạo ra một kiến trúc phức tạp với sáu agent, nhiều prompt và quản lý trạng thái (state management). Điều này gây ra rất nhiều rắc rối.
Cùng một vấn đề đó thường có thể giải quyết bằng một chuỗi đơn giản:
- PDF sang Chunk
- Chunk sang Embed
- Embed sang Vector DB
- LLM sang Response
Đôi khi một workflow là đủ. Bạn không cần một đội quân agent.
Workflow giải quyết hầu hết các vấn đề
Hầu hết các ứng dụng AI đều có tính xác định (deterministic). Chúng tuân theo một chuỗi trình tự nhất định. Các ví dụ bao gồm:
- Hỏi đáp tài liệu (Document Q&A)
- Hỗ trợ khách hàng
- Tóm tắt cuộc họp
- Tạo blog
- Kiểm tra mã nguồn (Code review)
Đây là các workflow, không phải các hệ thống tự trị. Workflow dễ debug, mở rộng, bảo trì và giải thích hơn.
Agent mang lại những chi phí ẩn
Mỗi agent mới đều phát sinh thêm các vấn đề:
- Chi phí token cao hơn do có nhiều prompt hơn
- Độ trễ cao hơn do có thêm các bước phụ
- Nhiều khả năng xảy ra hiện tượng ảo giác (hallucinations) hơn
- Khó debug hơn
- Nhu cầu về hạ tầng lớn hơn
Một ứng dụng đơn giản biến thành một dự án kỹ thuật khổng lồ.
Nơi Agent thực sự tỏa sáng
Tôi không phản đối agent. Agent hữu ích khi:
- Các tác vụ chạy trong thời gian dài, chẳng hạn như nghiên cứu nhiều trang web.
- Cần đưa ra quyết định dựa trên các logic cụ thể.
- Có sự can thiệp của con người trong quy trình (human-in-the-loop).
- Nhiều công cụ như Slack, GitHub và email phải phối hợp với nhau.
Quy tắc của tôi
Những người xây dựng thường nhảy thẳng vào các framework phức tạp. Trước khi làm vậy, hãy tự hỏi một câu: Liệu một workflow có thể giải quyết việc này không?
Nếu câu trả lời là có, hãy bắt đầu từ đó. Chỉ thêm agent khi sự phức tạp thực sự yêu cầu.
Hãy tuân theo nguyên tắc này:
- Workflow trước tiên.
- Agent thứ hai.
- Multi-agent cuối cùng.
Sự phức tạp không phải là sự đổi mới. Sự phức tạp là chi phí. Người dùng không quan tâm bạn sử dụng bao nhiêu agent. Họ chỉ quan tâm liệu công cụ đó có hoạt động hay không. Sự đơn giản chính là một tính năng.
Source: https://dev.to/jaideepparashar/why-i-think-most-ai-agents-are-overengineered-249o