Đừng tin tưởng AI một cách mù quáng: Cách giảm thiểu tình trạng ảo giác của AI Agent

Các AI agent thường mắc lỗi. Chúng tạo ra mã nguồn ảo giác, vi phạm các quy tắc kinh doanh hoặc chọn sai công cụ.

Hầu hết mọi người cố gắng khắc phục điều này bằng cách viết prompt tốt hơn. Đó là một sai lầm.

Nếu bạn muốn có các AI agent đáng tin cậy, bạn phải thiết kế hệ thống với các ràng buộc rõ ràng. Bạn cần chuyển từ vai trò một "Người đánh máy" (Typist) sang một "Kiến trúc sư" (Architect).

Người đánh máy vs. Kiến trúc sư

Hầu hết người dùng hành động như những Người đánh máy:

  • Bạn yêu cầu: "Hãy triển khai một hệ thống xác thực."
  • AI sẽ tự quyết định cấu trúc, các thư viện và bố cục thư mục.
  • Mỗi quyết định đưa ra đều là một cơ hội dẫn đến ảo giác.

Các kỹ sư hành động như những Kiến trúc sư:

  • Bạn xác định cấu trúc và các thư viện trước.
  • Bạn thiết lập các ràng buộc và quy tắc.
  • AI chỉ viết mã trong phạm vi giới hạn của bạn.

AI không bị ảo giác vì nó thiếu kỹ năng lập trình. Nó bị ảo giác vì nó cố gắng đoán ngữ cảnh mà bạn đang có trong đầu nhưng chưa bao giờ chia sẻ.

Chiến lược 1: Các tệp ngữ cảnh (Context Files)

Đừng lặp lại các hướng dẫn trong mỗi cuộc trò chuyện. Hãy sử dụng các tệp cấu hình để cung cấp cho AI một khung làm việc cố định. Các công cụ khác nhau sử dụng các tiêu chuẩn khác nhau:

• CLAUDE.md cho Claude Code • AGENTS.md cho các hệ sinh thái mã nguồn mở • .cursorrules cho Cursor • .copilotrules cho GitHub Copilot

Mẹo chuyên nghiệp: Tạo một tệp AGENTS.md trung tâm và sử dụng symlinks để tất cả các tệp khác tự động cập nhật.

Chiến lược 2: ADR (Architecture Decision Records)

Trước khi yêu cầu một agent xây dựng thứ gì đó, hãy tạo một ADR. Tài liệu này giúp loại bỏ nhu cầu phải "đoán" của AI.

Một ADR tốt bao gồm:

  • Chính xác những gì cần xây dựng.
  • Những tệp nào cần tạo và những tệp nào tuyệt đối không được chạm vào.
  • Tech stack và các thư viện cụ thể cần sử dụng.
  • Các ràng buộc rõ ràng (ví dụ: "Không lưu trạng thái trong bộ nhớ").
  • Danh sách những điều mà agent KHÔNG được phép tự quyết định.

Khi một Orchestrator nhận được một ADR, các quyết định thiết kế đã được hoàn tất. Agent Developer chỉ đơn giản là chuyển đổi đặc tả thành mã nguồn. Điều này giúp giảm thiểu lỗi và giữ cho mã nguồn của bạn nhất quán.

Tôi đang bắt đầu một chuỗi bài viết về cách xây dựng quy trình làm việc cho AI agent đáng tin cậy. Trong các phần tiếp theo, tôi sẽ đề cập đến việc soạn thảo system prompt và các kỹ thuật kỹ thuật nâng cao.

Nguồn: https://dev.to/devjohanadrian/el-problema-de-la-confianza-ciega-como-reducir-las-alucinaciones-en-agentes-de-ia-parte-1-2aah