𝗬𝗼𝘂𝗿 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁 𝗜𝘀𝗻't 𝗕𝗿𝗼𝗸𝗲𝗻. 𝗬𝗼𝘂𝗿 𝗖𝗼𝗺𝗽𝗮𝗻𝘆's 𝗧𝗿𝘂𝘁𝗵 𝗜𝘀.

Một tác nhân AI chỉ có một nhiệm vụ duy nhất. Nó cần thanh toán một hóa đơn nhà cung cấp đã được phê duyệt. Đội ngũ tài chính muốn ngừng thực hiện việc này một cách thủ công.

Vào một ngày thứ Ba, tác nhân này đã tiếp nhận một hóa đơn trị giá 48.000 Ksh. Hệ thống ERP đánh dấu hóa đơn đó là đã phê duyệt nhưng chưa thanh toán. Tác nhân kiểm tra các quy tắc. Mọi thứ đều hợp lệ. Nó đã thanh toán hóa đơn.

Vấn đề là gì? Hóa đơn đó thực chất đã được một con người thanh toán vào thứ Năm tuần trước.

Không có hệ thống nào sai cả, nhưng tất cả chúng lại mâu thuẫn với nhau:

• Hệ thống ERP nói rằng nó chưa được thanh toán vì việc đồng bộ hóa với ngân hàng bị lỗi. • Dữ liệu ngân hàng (bank feed) cho biết nó đã được thanh toán. • Một luồng thảo luận trên Slack yêu cầu tạm dừng mọi khoản thanh toán cho nhà cung cấp này. • Một email từ nhà cung cấp xác nhận rằng họ đã nhận được tiền.

Mỗi hệ thống đều nắm giữ một mảnh ghép của vấn đề. Nhưng không có hệ thống nào có thể trả lời câu hỏi quan trọng duy nhất: Hóa đơn cụ thể này đã được thanh toán chưa?

Một nhân viên văn phòng sẽ phát hiện ra điều này. Không phải vì họ thông minh hơn, mà vì họ cảm nhận được sự bất thường. Con người ghi nhớ nhiệm vụ hoặc chú ý đến tin nhắn trên Slack. Con người đóng vai trò là chất keo gắn kết giữa các hệ thống hỗn loạn. Chúng ta đưa ra sự phán đoán.

Các tác nhân AI không có bản năng. Chúng đọc dữ liệu với tốc độ máy móc. Chúng thấy "Đã phê duyệt" (Approved) và "Chưa thanh toán" (Unpaid) và chúng thực hiện hành động. Chúng không cảm thấy có điều gì đó không ổn.

Tác nhân đó không hề thất bại. Nó đã hoạt động chính xác như thiết kế. Sự thất bại này là cái mà tôi gọi là sự sụp đổ về nhận thức luận (epistemic collapse).

Hầu hết các công ty cố gắng sửa lỗi các tác nhân bằng cách sử dụng các câu lệnh (prompt) tốt hơn hoặc các mô hình tốt hơn. Đây là một bước đi sai lầm. Bạn không thể dùng prompt để tìm ra thông tin vốn không tồn tại trong dữ liệu của mình.

Vấn đề thực sự nằm ở sự thiếu hụt hạ tầng nhận thức luận (epistemic infrastructure).

Dữ liệu là những gì hệ thống của bạn lưu trữ. Sự thật là những gì thực sự đang diễn ra. Hầu hết các công ty có rất nhiều dữ liệu nhưng lại có con số không tròn trĩnh về sự thật.

Các hệ thống hiện tại đang gộp ba thứ khác nhau vào cùng một trường dữ liệu:

  • Quan sát (Observation): Những gì một hệ thống nói là đã xảy ra.
  • Sự thật (Truth): Những gì thực sự đúng.
  • Lịch sử (History): Những gì đã từng đúng.

Khi một cơ sở dữ liệu ghi "Status: Unpaid", nó xóa bỏ cả lịch sử lẫn sự nghi ngờ. Nó trình bày một quan sát duy nhất như thể đó là sự thật tuyệt đối.

Các tác nhân AI là một bài kiểm tra áp lực (stress test) cho vấn đề cũ kỹ này. Chúng loại bỏ những con người vốn đang âm thầm khắc phục những mâu thuẫn này mỗi ngày. Nếu không có con người để lấp đầy các khoảng trống, những vết nứt trong dữ liệu của bạn sẽ trở thành những sai lầm đắt giá.

Đừng cố gắng xây dựng các tác nhân tốt hơn. Hãy bắt đầu xây dựng lớp nền tảng bên dưới chúng. Bạn cần một hệ thống có khả năng theo dõi các quan sát, nhận diện các điểm mâu thuẫn và xác định dữ liệu lỗi thời.

Cho đến khi bạn xây dựng được một lớp sự thật, các agent của bạn sẽ tiếp tục thực hiện những điều sai lầm một cách hoàn hảo.

Nguồn: https://dev.to/code_with_mwai/your-ai-agent-isnt-broken-your-companys-truth-is-2cl8

Cộng đồng học tập (tùy chọn): https://t.me/GyaanSetuAi