Tại sao các LLM gặp khó khăn trong việc mô phỏng sự đa dạng của con người trong các lập luận
Khi các mô hình ngôn ngữ lớn (LLM) ngày càng được tích hợp sâu rộng vào việc sáng tạo nội dung, một câu hỏi quan trọng được đặt ra: liệu chúng ta có thực sự phân biệt được văn bản do máy tạo ra với văn bản do con người viết hay không? Max Spero, CEO của startup phát hiện văn bản AI Pangram, cho rằng câu trả lời không nằm ở ngữ pháp, mà nằm ở sự thiếu hụt tính đa dạng về nhận thức vốn có bên trong các mô hình AI.
"Vấn đề về sự đồng nhất" trong lập luận của AI
Một trong những khiếm khuyết đáng kể nhất của các LLM hiện nay là xu hướng hướng tới sự phân cụm thống kê (statistical clustering). Mặc dù AI có thể vượt xa con người trung bình về mặt ngữ pháp hoàn hảo và logic hình thức, nhưng nó lại thiếu "chiều rộng lập luận" (argumentative breadth) vốn là đặc trưng của trí tuệ con người. Theo Spero, nếu bạn yêu cầu một LLM đưa ra 100 lập luận khác nhau về cùng một chủ đề, các kết quả đầu ra chắc chắn sẽ tập trung trong một phạm vi hẹp và có thể dự đoán được.
Ngược lại, bối cảnh tư duy của con người rất rộng lớn và hỗn loạn. Con người rút ra từ những trải nghiệm sống riêng biệt, các sắc thái văn hóa và logic phi truyền thống để xây dựng các quan điểm. Các LLM, được huấn luyện để dự đoán token tiếp theo có khả năng xảy ra cao nhất, thường có xu hướng hướng về "trung tâm" của một phân phối, dẫn đến một mô hình lập luận lặp đi lặp lại, khiến bản chất tổng hợp của chúng có thể bị phát hiện bởi các bộ phân loại tinh vi.
Cách Pangram phát hiện các mô hình máy tính
Pangram sử dụng một bộ phân loại học sâu (deep-learning classifier) được thiết kế để xác định các dấu hiệu cấu trúc tinh vi này. Thú vị là, Spero mô tả công nghệ của chính Pangram như một "hộp đen" (black box), lưu ý rằng mô hình này xác định các mô hình mà ngay cả những người tạo ra nó cũng không thể giải thích đầy đủ. Mặc dù công cụ này có thể đưa ra các cụm từ nghi vấn cụ thể làm manh mối, nhưng sức mạnh thực sự của nó nằm ở việc phát hiện các khuôn mẫu cấu trúc tiềm ẩn mà các LLM để lại khi tổ chức một tài liệu.
Những khuôn mẫu này chính là dấu vân tay kỹ thuật số của xác suất. Vì các LLM được tối ưu hóa cho tính mạch lạc và cấu trúc tiêu chuẩn, chúng tuân theo các lộ trình tổ chức mà về mặt thống kê là khó có khả năng xảy ra đối với một người viết, vốn có thể nhảy cóc giữa các ý tưởng hoặc sử dụng các bước chuyển tiếp phi tuyến tính.
Tương lai của việc phát hiện AI và tính toàn vẹn của nội dung
Sự phát triển này làm nổi bật một cuộc chạy đua vũ trang đang gia tăng trong bối cảnh AI. Khi các mô hình tạo sinh phát triển trở nên tinh vi hơn, việc khớp mô hình đơn giản có thể không còn đủ nữa. Để thực sự "đánh lừa" được các bộ phát hiện tiên tiến như Pangram, các nhà phát triển sẽ cần phải vượt xa việc tạo văn bản dựa trên xác suất và hướng tới các mô hình có khả năng đa dạng lập luận thực sự.
Đối với các nhà sáng lập và nhà phát triển đang xây dựng trong không gian tạo sinh, đây là một cảnh báo kỹ thuật: con đường dẫn đến AI "cấp độ con người" đòi hỏi nhiều hơn là chỉ ngữ pháp tốt hơn; nó đòi hỏi khả năng thoát khỏi mức trung bình có thể dự đoán được và đón nhận sự đa dạng hỗn loạn của tư duy con người.
Các điểm chính cần lưu ý
- Phân cụm thống kê: Các LLM có xu hướng tạo ra các lập luận tập trung trong một phạm vi hẹp, trong khi lập luận của con người được đặc trưng bởi tính đa dạng cao và không thể dự đoán trước.
- Dấu vân tay cấu trúc: Các bộ phát hiện văn bản AI như Pangram xác định nội dung do máy tạo ra bằng cách nhận diện các mô hình cấu trúc sâu và các khuôn mẫu tổ chức mà các mô hình xác suất để lại.
- Khoảng cách logic: Mặc dù các LLM có thể xuất sắc về logic hình thức và ngữ pháp, nhưng sự thiếu hụt biến thiên nhận thức khiến chúng dễ bị phát hiện thông qua tính đồng nhất vốn có.
