Tại sao một nhà nghiên cứu của Microsoft lại xây dựng một mạng thần kinh bằng cách sử dụng những con dê trong Age of Empires II

Trong một màn châm biếm kỹ thuật đầy tài tình, Adrian de Wynter, nhà nghiên cứu tại Microsoft và Đại học York, đã xây dựng một mạng thần kinh hoạt động được ngay trong trình chỉnh sửa bản đồ của Age of Empires II. Mặc dù việc sử dụng những con dê để đại diện cho các bit nhị phân có vẻ vô lý, nhưng thí nghiệm này đóng vai trò như một lời phê bình sâu sắc về các định kiến nhân hóa đang bủa vây các nghiên cứu khoa học về AI hiện nay.

Mô hình tính toán dựa trên dê

Kiến trúc của de Wynter sử dụng trình chỉnh sửa kịch bản và các công cụ lập trình của trò chơi để tạo ra một mạch logic hoạt động được. Trong thiết lập "vô lý" này, những con dê đóng vai trò là các bit: một con dê đứng trên cỏ đại diện cho số 0, trong khi một con dê đứng trên cầu đại diện cho số 1. Bằng cách sử dụng các dốc băng để ngăn chặn lỗi tính toán, de Wynter đã xây dựng thành công một mạng lưới nhỏ bao gồm hai cổng XNOR và một cổng AND, giúp học hàm logic AND một cách hiệu quả.

Chiều sâu kỹ thuật của thí nghiệm này vượt xa các cổng logic đơn giản. De Wynter chứng minh rằng các cơ chế của trò chơi—cụ thể là thị trường trong game nơi giá tài nguyên bị giới hạn ở mức 9.999—về lý thuyết có thể cho phép một chu kỳ kinh tế vận hành vĩnh cửu. Điều này có thể biến các tòa nhà thành các ô nhớ và các trang trại đang hoạt động thành các trạng thái tính toán, biến trò chơi trở nên mạnh mẽ như một máy tính hoàn chỉnh.

Ngụy biện về sự nhân hóa trong nghiên cứu LLM

Mục tiêu cốt lõi của thí nghiệm này là thách thức cách chúng ta gán các đặc điểm giống con người cho các Mô hình Ngôn ngữ Lớn (LLM). De Wynter lập luận rằng nếu một mô hình ngôn ngữ có thể được tái tạo bằng cách sử dụng những con dê, các viên gạch Lego, hoặc thậm chí là 667.000 cư dân của vùng Greater Boston nhắn tin cho nhau, thì các kết quả toán học vẫn không thay đổi. Tuy nhiên, "lớp vỏ bọc"—giao diện trò chuyện mượt mà và độ trễ thấp—đã tạo ra một ảo giác về sự có tri giác.

Để chứng minh đây không phải là một quan sát đơn lẻ, de Wynter đã phân tích 315 bài báo về AI từ giữa năm 2024 đến giữa năm 2026. Sử dụng GPT-5.2 để lọc, nghiên cứu đã tiết lộ một định kiến mang tính hệ thống trong cộng đồng khoa học:

Điều này tạo ra một vòng lặp của lập luận vòng quanh: các nhà nghiên cứu thiết kế các thí nghiệm để chứng minh một mô hình có "nỗi sợ" hoặc "đạo đức", và vì họ bắt đầu với giả định đó, các kết quả chắc chắn sẽ xác nhận nó.

Hướng tới Khoa học AI Quan sát được

De Wynter cảnh báo rằng các thực hành trong ngành, chẳng hạn như việc Anthropic huấn luyện Claude sử dụng các cụm từ như "Tôi tin rằng", đang làm trầm trọng thêm vấn đề này. Điều này có thể dẫn đến những hậu quả nguy hiểm, bao gồm sự gắn bó về mặt cảm xúc, sự nịnh bợ, và củng cố thêm những ảo tưởng ở người dùng.

Thay vì gán ý thức cho các mô hình, de Wynter đề xuất một "cách tiếp cận tỉnh táo" dựa trên dữ liệu có thể quan sát được. Thay vì tuyên bố một mô hình "hiểu" một khái niệm, các nhà nghiên cứu nên phát biểu rằng "dưới điều kiện X, mô hình tạo ra đầu ra Y". Điều này giúp khoa học có thể kiểm chứng được và ngăn chặn việc lạm dụng toán học phức tạp để biện minh cho những tuyên bố vô căn cứ về khả năng cảm thụ.

Các điểm chính cần lưu ý