Phá vỡ "Tư duy bầy đàn" của AI: Cách Flint đang chống lại sự rập khuôn của LLM
Trong khi các mô hình ngôn ngữ lớn như ChatGPT và Claude tỏ ra xuất sắc trong việc lập trình và nghiên cứu, chúng đang ngày càng rơi vào cái bẫy của "tư duy bầy đàn" (groupthink) đầy tính dự đoán. Khi các mô hình phổ biến dần hội tụ về những phản hồi lặp đi lặp lại với xác suất cao, một startup mới đang nỗ lực đưa sự khác biệt cần thiết vào hệ sinh thái AI tạo sinh.
Vấn đề: Hiệu ứng "Tư duy bầy đàn nhân tạo"
Một hạn chế đáng kể trong quá trình phát triển LLM hiện nay là xu hướng các mô hình có xu hướng hướng tới câu trả lời có xác suất thống kê cao nhất, dẫn đến một hiện tượng mà các nhà nghiên cứu gọi là "Tư duy bầy đàn nhân tạo" (Artificial Hivemind). Một bài báo đạt giải thưởng tại NeurIPS có tiêu đề “Artificial Hivemind: The Open-Ended Homogeneity of Language Models (and Beyond)” đã vạch trần sự lặp lại sâu sắc này.
Nhóm nghiên cứu đã thử nghiệm 25 LLM khác nhau, bao gồm các mô hình lớn của Mỹ và các phiên bản mã nguồn mở từ Trung Quốc. Khi được yêu cầu đưa ra một phép ẩn dụ cho "thời gian", đại đa số trong số 1.250 phản hồi đều hội tụ về những câu nói sáo rỗng như "Thời gian là một dòng sông" hoặc "Thời gian là một người thợ dệt". Sự thiếu đa dạng này không chỉ là một đặc điểm kỳ lạ; nó là hệ quả của việc huấn luyện các mô hình trên các tập dữ liệu tương tự nhau với mục tiêu chính là tối đa hóa độ tin cậy và tính mạch lạc. OpenAI đã thừa nhận rằng việc thúc đẩy tính mới lạ đôi khi có thể dẫn đến các phản hồi yếu hơn, kém tin cậy hơn, đó là lý do tại sao hầu hết các mô hình đều mặc định đưa ra các kết quả "xác suất cao" và an toàn.
Sự xuất hiện của Flint: Ưu tiên sự đa dạng thay vì tính dự đoán
Startup Springboards của Úc đang thách thức thực trạng này với mô hình mới của mình, Flint. Khác với các mô hình phổ biến vốn tìm mọi cách để chống lại hiện tượng "ảo giác" (hallucinations), CEO của Springboards, Pip Bingemann, lập luận rằng một mức độ khác biệt không thể dự đoán trước là cần thiết cho các tác vụ sáng tạo.
Trong các thử nghiệm thực tế, sự khác biệt trong phân phối đầu ra là rất rõ rệt:
- Tính ngẫu nhiên: Khi được yêu cầu một con số ngẫu nhiên, ChatGPT và Claude thường mặc định chọn số "7", trong khi Flint cung cấp các con số có độ chính xác cao và không theo quy chuẩn như "3.7916".
- Thương hiệu sáng tạo: Khi được yêu cầu viết một câu khẩu hiệu (tagline) cho New Balance, cả Claude và ChatGPT đều tạo ra "Run your way", trong khi Flint đưa ra một lựa chọn khác biệt: "Built to last, run to win".
- Lựa chọn danh từ: Trong khi các mô hình phổ biến thiên về các thương hiệu "an toàn" như Toyota hay Honda, Flint cho thấy phạm vi rộng hơn khi lựa chọn các phương án ít dự đoán hơn như Ford F-150.
Một công cụ sáng tạo dành cho giới chuyên gia
Springboards không chỉ xây dựng một mô hình độc lập; họ đang phát triển một công cụ chuyên dụng cho các chuyên gia quảng cáo và marketing. Nền tảng này cho phép người dùng tổng hợp đầu ra từ nhiều mô hình khác nhau—bao gồm cả ChatGPT và Claude—và kết hợp chúng để tổng hợp nên những ý tưởng mới. Flint đóng vai trò như một "máy phóng sáng tạo" (creative catapult) trong hệ sinh thái này, được thiết kế đặc biệt để đưa người dùng thoát khỏi các khuôn mẫu tư duy sẵn có.
Zoe Scaman, Giám đốc Chiến lược tại 77X, lưu ý rằng trong khi các mô hình phổ biến thường gợi ý những giải pháp cũ kỹ (chẳng hạn như "dạy về kiến thức tài chính một cách thú vị"), Flint lại mang đến những sự thay đổi mang tính đột phá về góc nhìn, chẳng hạn như đề xuất tái định nghĩa hoàn toàn khái niệm về việc tích lũy tài sản.
Các điểm chính cần lưu ý
- Sự đồng nhất của LLM: Các mô hình lớn đang hội tụ về các câu trả lời tương tự và có thể dự đoán được do các phương pháp huấn luyện giống nhau, tạo ra hiệu ứng "Tư duy bầy đàn nhân tạo".
- Cách tiếp cận của Flint: Mô hình Flint của Springboards ưu tiên sự đa dạng và khác biệt trong phản hồi, giúp nó phù hợp hơn cho việc động não (brainstorming) và chiến lược sáng tạo so với các mô hình tiêu chuẩn.
- Sự đánh đổi về độ tin cậy: Ngành công nghiệp đang đối mặt với một sự mâu thuẫn cơ bản giữa độ tin cậy của mô hình (duy trì trong phạm vi xác suất cao) và tính mới lạ sáng tạo (chấp nhận các đầu ra đa dạng với xác suất thấp hơn).
