Vấn đề về Nguồn Sự thật

Các đội ngũ AI trong doanh nghiệp phải đối mặt với một câu hỏi hóc búa.

"Câu trả lời chính xác là gì?"

Câu hỏi này không đến từ mô hình. Nó đến từ phía doanh nghiệp.

Ở quy mô nhỏ, việc này có vẻ dễ dàng. Ở quy mô doanh nghiệp, nó trở thành một vấn đề kiến trúc khổng lồ. Hầu hết các công ty không có một nguồn sự thật duy nhất. Họ có rất nhiều nguồn.

Các công ty sử dụng nhiều hệ thống:

  • CRM
  • ERP
  • Hệ thống ticketing
  • Cơ sở dữ liệu nội bộ
  • Bảng tính
  • Nền tảng tài liệu

Mỗi hệ thống nắm giữ dữ liệu. Mỗi hệ thống thay đổi theo thời gian. Một khách hàng có thể tồn tại ở ba nơi khác nhau với ba trạng thái khác nhau.

AI không tạo ra những vấn đề này. Nó chỉ phơi bày chúng.

Trước khi có AI, con người xử lý dữ liệu lộn xộn. Nhân viên biết báo cáo nào đã cũ. Họ biết cơ sở dữ liệu nào đáng tin cậy.

AI thiếu đi trực giác này. Khi AI truy xuất dữ liệu từ nhiều nguồn, nó nhìn thấy mọi phiên bản của sự thật cùng một lúc.

Nếu một hệ thống nói khách hàng đang "Hoạt động" (Active) và hệ thống khác nói "Bị tạm ngưng" (Suspended), AI sẽ rơi vào bế tắc. Không có hệ thống nào bị lỗi. Vấn đề nằm ở quyền sở hữu dữ liệu.

Một sai lầm phổ biến là nghĩ rằng nhiều dữ liệu hơn sẽ cải thiện AI. Thông thường, càng nhiều dữ liệu càng gây ra nhiều sự nhầm lẫn. Càng nhiều tích hợp sẽ dẫn đến càng nhiều dữ liệu trùng lặp và xung đột.

Các hệ thống truy xuất tìm thấy dữ liệu liên quan. Chúng không tìm thấy dữ liệu chuẩn (authoritative data).

Bạn phải quyết định:

  • Hệ thống nào nắm giữ trạng thái khách hàng?
  • Hệ thống nào nắm giữ giá cả?
  • Hệ thống nào nắm giữ hàng tồn kho?

Những quyết định này thuộc về quản trị (governance), không phải thuật toán.

Để khắc phục điều này, bạn phải xác định một hệ thống phân cấp nguồn. Không phải tất cả các hệ thống đều bình đẳng. Bạn phải gắn nhãn cho chúng:

  • Nguồn chính (Primary source)
  • Nguồn phụ (Secondary source)
  • Nguồn dự phòng (Fallback source)

Điều này loại bỏ việc phỏng đoán. Cơ sở hạ tầng sẽ quyết định sự thật trước khi mô hình kịp nhìn thấy dữ liệu.

Thành công của AI doanh nghiệp phụ thuộc vào quản trị nhiều hơn là việc lựa chọn mô hình. Nếu bạn không xác định quyền sở hữu, bạn sẽ đối mặt với:

  • Câu trả lời không nhất quán
  • Kết quả xung đột
  • Tự động hóa không đáng tin cậy
  • Niềm tin của người dùng thấp

Nếu người dùng thấy AI thay đổi ý kiến liên tục, họ sẽ ngừng sử dụng nó.

Đừng coi AI là một vấn đề về truy xuất. Hãy bắt đầu coi nó là một vấn đề về quyền sở hữu dữ liệu.

Câu hỏi khó nhất không phải là mô hình nên trả lời điều gì. Câu hỏi khó nhất là điều gì mới thực sự là sự thật.

Source: https://dev.to/karan2598/the-source-of-truth-problem-every-enterprise-ai-team-faces-2m2k

Optional learning community: https://t.me/GyaanSetuAi