Anthropic Thu hồi Tính năng Giám sát Ngầm trong Claude Code
Anthropic đang đối mặt với sự giám sát gắt gao sau khi phát hiện một cơ chế giám sát ẩn bên trong công cụ Claude Code của mình, được thiết kế để nhận diện người dùng Trung Quốc. Tiết lộ này đã làm dấy lên một cuộc tranh luận lớn về quyền riêng tư của người dùng, rủi ro rò rỉ dữ liệu và các ranh giới đạo đức trong việc bảo vệ mô hình.
Cơ chế Phát hiện Lén lút
Tranh cãi bùng nổ khi một người dùng Reddit, LegitMichel777, tiết lộ rằng Claude Code phiên bản 2.1.91—phát hành vào ngày 2 tháng 4 năm 2026—có chứa mã không được tài liệu hóa để đánh dấu người dùng tại Trung Quốc. Khác với các dữ liệu đo lường (telemetry) tiêu chuẩn, tính năng này sử dụng một hình thức giấu tin (steganography) tinh vi để truyền dữ liệu thông qua những thay đổi "gần như không thể nhận ra" trong lời nhắc hệ thống (system prompt).
Phần mềm được thiết kế để so sánh múi giờ hệ thống với "Asia/Shanghai" hoặc "Asia/Urumqi" và quét các URL proxy để tìm các tên miền Trung Quốc hoặc các kết nối tới các phòng thí nghiệm AI của Trung Quốc. Khi tìm thấy sự trùng khớp, công cụ sẽ thay đổi kết quả đầu ra một cách tinh vi bằng cách điều chỉnh định dạng ngày tháng hoặc thay thế dấu nháy đơn tiêu chuẩn bằng một ký tự khác trong cụm từ "Today's date is." Mặc dù mắt người không thể nhìn thấy, nhưng những điều chỉnh siêu nhỏ này cho phép Anthropic nhận diện nguồn gốc của người dùng ngay lập tức. Để che giấu hoạt động này sâu hơn, mã nguồn được cho là đã được làm rối bằng cách sử dụng mã hóa XOR với khóa là 91, ngăn chặn việc nó xuất hiện trong các bản trích xuất văn bản tiêu chuẩn.
Rủi ro Bảo mật và Vi phạm Quyền riêng tư
Phát hiện này đã gióng lên hồi chuông cảnh báo đáng kể trong cộng đồng nhà phát triển. Vì Claude Code hoạt động với quyền truy cập đầy đủ vào hệ thống tệp và shell, các nhà phê bình lập luận rằng bất kỳ kênh liên lạc ngầm nào cũng có khả năng bị khai thác cho các hình thức lạm dụng nghiêm trọng hơn, bao gồm điều khiển từ xa hoặc rò rỉ dữ liệu trái phép.
Ngoài những tác động về bảo mật kỹ thuật, phát hiện này còn được coi là một sự vi phạm cơ bản đối với lòng tin của người dùng. Tính năng này đã được triển khai mà không có bất kỳ đề cập nào trong ghi chú phát hành chính thức, khiến các nhà phát triển không hề biết rằng dữ liệu proxy và cài đặt hệ thống của họ đang bị phân tích để lách các hạn chế về khu vực.
Sự biện hộ của Anthropic: Bảo vệ chống lại việc Chưng cất Mô hình (Model Distillation)
Đáp lại sự phản đối, nhân viên của Anthropic, Thariq Shihipar, đã làm rõ rằng tính năng này là một "thử nghiệm" được triển khai vào tháng 3. Mục tiêu chính là ngăn chặn việc lạm dụng tài khoản bởi các bên bán lại không được phép và để bảo vệ chống lại việc "chưng cất" (distillation)—quy trình mà các đối thủ cạnh tranh sử dụng đầu ra của mô hình để huấn luyện các LLM của riêng họ.
Anthropic có lịch sử căng thẳng với các công ty AI Trung Quốc, trước đó đã cáo buộc các công ty như DeepSeek, Moonshot AI, MiniMax và Alibaba sử dụng đầu ra của Claude mà không được phép. Vì Anthropic không chính thức cung cấp các mô hình của mình tại Trung Quốc vì lý do an ninh quốc gia, việc nhận diện những người dùng truy cập dịch vụ thông qua thẻ tín dụng và số điện thoại nước ngoài được xem là một cách để bảo vệ trí tuệ độc quyền. Tuy nhiên, sau sự phản đối dữ dội, Anthropic đã xác nhận họ đã hợp nhất một pull request để thu hồi hoàn toàn tính năng này.
Các điểm chính cần lưu ý
- Phát hiện bằng kỹ thuật giấu tin: Claude Code đã sử dụng các thay đổi ký tự tinh vi trong lời nhắc hệ thống và mã hóa XOR để bí mật nhận diện người dùng kết nối từ Trung Quốc.
- Lo ngại về bảo mật: Khả năng thực hiện các kiểm tra ngầm trong một công cụ có quyền truy cập đầy đủ vào hệ thống tệp làm dấy lên những lo ngại đáng kể về việc rò rỉ dữ liệu và quyền riêng tư của người dùng.
- Bảo vệ mô hình đối lập với Quyền riêng tư: Anthropic đã bảo vệ động thái này như một thử nghiệm nhằm ngăn chặn việc chưng cất mô hình bởi các phòng thí nghiệm AI Trung Quốc, nhưng kể từ đó đã cam kết thu hồi hoàn toàn.
