𝗤𝘄𝗲𝗻 𝟮.𝟱 𝟳𝗕 𝗖𝗼𝗻𝗳𝗶𝗱𝗲𝗻𝗰𝗲 𝗜𝘀 𝗨𝗻𝗿𝗲𝗹𝗶𝗮𝗯𝗹𝗲

Các mô hình ngôn ngữ lớn thường "nói dối" về mức độ chắc chắn của chúng.

Một nghiên cứu mới từ Đại học Minnesota cho thấy một lỗ hổng lớn trong Qwen 2.5 7B. Khi mô hình này làm việc với dữ liệu lâm sàng, điểm số độ tự tin của nó hầu như không thay đổi.

Mô hình báo cáo mức độ tự tin trong khoảng từ 0,856 đến 0,937. Điều này xảy ra ngay cả khi mô hình đưa ra kết quả sai.

Các phát hiện chính từ nghiên cứu:

  • Mô hình không được hiệu chuẩn về mặt nhận thức (epistemically uncalibrated). Sự chắc chắn của nó phụ thuộc vào định dạng câu lệnh (prompt) thay vì độ chính xác.
  • Độ tự tin cao không đồng nghĩa với độ chính xác cao.
  • Mô hình thường đưa ra những kết luận sai lầm với sự tự tin cao nhất trong các trường hợp dễ.
  • Các mô hình truyền thống như XGBoost hoạt động hiệu quả hơn các LLM trên dữ liệu bảng có cấu trúc.

Tại sao điều này lại xảy ra?

Các LLM học từ ngôn ngữ tự nhiên. Chúng thiếu trực giác đối với các hàng số liệu lâm sàng. Chúng dựa vào các mẫu ngôn ngữ thay vì các bằng chứng dữ liệu thực tế.

Điều này tạo ra rủi ro trong lĩnh vực chăm sóc sức khỏe. Nếu bạn tin vào điểm số độ tự tin của mô hình, bạn có thể chấp nhận một câu trả lời sai như một sự thật.

Các nhà nghiên cứu đã tìm ra cách để khắc phục điều này mà không cần huấn luyện lại mô hình:

  • Kết hợp các ví dụ few-shot với việc chèn thuộc tính SHAP (SHAP attribution injection).
  • Điều này đã tăng độ chính xác từ 49% lên 75,3%.
  • Sử dụng một bộ hiệu chuẩn chéo giữa các mô hình (cross-model calibrator).
  • Bằng cách so sánh LLM với một mô hình ML cổ điển, bạn có thể phát hiện khi nào LLM không đáng tin cậy.
  • Phương pháp này đã giảm đáng kể tỷ lệ lỗi.

Bài học rút ra rất đơn giản. Đừng tin vào các điểm số độ tự tin được diễn đạt bằng văn bản đối với dữ liệu có cấu trúc. Hãy sử dụng các pipeline lai. Hãy để các mô hình cổ điển xử lý các con số và sử dụng LLM để suy luận và giải thích.

Nguồn: https://arxiv.org/abs/2606.19509

Cộng đồng học tập tùy chọn: https://t.me/GyaanSetuAi