Anthropic khôi phục quyền truy cập vào Claude Fable 5 sau các cuộc đàm phán với chính phủ

Sau nhiều tuần đàm phán căng thẳng với chính quyền Trump, Anthropic đã chính thức cho phép sự trở lại của mô hình Claude Fable 5 đầy hứa hẹn. Động thái này diễn ra sau một giai đoạn kiểm soát xuất khẩu nghiêm ngặt, vốn đã khiến một trong những mô hình AI hướng tới người tiêu dùng quan trọng nhất của ngành bị đình trệ.

Dỡ bỏ kiểm soát xuất khẩu và khôi phục quyền truy cập toàn cầu

Bộ Thương mại đã chính thức dỡ bỏ các chỉ thị kiểm soát xuất khẩu vốn trước đây hạn chế quyền truy cập vào cả Claude Fable 5 và công nghệ nền tảng của nó, Mythos 5. Các biện pháp kiểm soát này đã tạo ra một rào cản vận hành khổng lồ, ngăn cản các công dân nước ngoài—bao gồm nhiều nhân viên quốc tế của chính Anthropic và các thành viên không phải công dân Hoa Kỳ thuộc các công ty khách hàng doanh nghiệp—sử dụng các mô hình này.

Anthropic đã xác nhận sẽ bắt đầu khôi phục quyền truy cập vào Fable 5 trên toàn cầu trên các nền tảng Claude bắt đầu từ thứ Tư tuần này. Mặc dù chưa có mốc thời gian cụ thể, công ty có kế hoạch tái kích hoạt mô hình trên các hạ tầng đám mây lớn, bao gồm AWS, Google Cloud và Microsoft Foundry, trong tương lai gần.

Giải quyết lỗ hổng Jailbreak

Sự can thiệp ban đầu của chính phủ được kích hoạt bởi những lo ngại về khả năng xảy ra các vụ "jailbreak" (vượt rào bảo mật), cụ thể là sau một báo cáo từ các nhà nghiên cứu của Amazon cảnh báo về một lỗ hổng. Để đáp lại, Anthropic đã triển khai một kiến trúc an toàn mạnh mẽ hơn.

Công ty đã huấn luyện một bộ phân loại an toàn (safety classifier) cải tiến được thiết kế để nhắm mục tiêu và ngăn chặn các kỹ thuật cụ thể được xác định trong báo cáo của Amazon, với tỷ lệ thành công được tuyên bố là trên 99%. Để đảm bảo trải nghiệm người dùng vẫn liền mạch ngay cả khi một yêu cầu bị chặn, Anthropic đã tích hợp một cơ chế dự phòng: nếu một yêu cầu gửi đến Fable 5 bị bộ phân loại mới gắn cờ, nó sẽ tự động được chuyển hướng sang mô hình Opus 4.8.

Một kỷ nguyên mới của sự hợp tác giữa Chính phủ và AI

Sự trở lại của Fable 5 báo hiệu một sự thay đổi căn bản trong cách các phòng thí nghiệm AI tiên phong tương tác với các cơ quan quản lý liên bang. Anthropic đã vạch ra một chiến lược chủ động để hợp tác chặt chẽ với chính quyền Trump, bao gồm:

  • Quyền truy cập của Chính phủ trước khi phát hành: Cho phép các đối tác chính phủ thực hiện các đánh giá độc lập đối với các mô hình liên quan đến an ninh quốc gia trước khi chúng được công bố rộng rãi.
  • Chia sẻ thông tin nhanh chóng: Cam kết tiết lộ ngay lập tức khi phát hiện các vụ jailbreak nghiêm trọng hoặc các mô hình lạm dụng.
  • Phân bổ nguồn lực: Thành lập các đội ngũ chuyên trách và cung cấp phân bổ tài nguyên tính toán đáng kể để hỗ trợ việc thử nghiệm và nghiên cứu của chính phủ.

Hơn nữa, Anthropic đang dẫn đầu một nỗ lực trên toàn ngành thông qua chương trình Project Glasswing—hợp tác với Amazon, Microsoft và Google—để thiết lập một tiêu chuẩn đánh giá và bảo mật chung, tự nguyện. Khung làm việc này nhằm phân loại mức độ nghiêm trọng của jailbreak dựa trên khả năng đạt được của kẻ tấn công, phạm vi đạt được, mức độ dễ dàng khi vũ khí hóa và khả năng phát hiện.

Tại sao điều này lại quan trọng đối với ngành công nghiệp AI

Sự phát triển này là một bước ngoặt đối với bối cảnh AI, đặc biệt là khi các công ty như OpenAI đang thực hiện các đợt triển khai phân tầng tương tự cho các mô hình như GPT-5. Khi ngành công nghiệp tiến tới các mô hình mạnh mẽ hơn với khả năng an ninh mạng tiên tiến, sự căng thẳng giữa đổi mới nhanh chóng và an ninh quốc gia sẽ ngày càng gia tăng. Động thái chính thức hóa "thử nghiệm trước khi phát hành" và "các tiêu chuẩn tự nguyện" của Anthropic rất có thể sẽ trở thành bản thiết kế cho cách các nhà cung cấp mô hình tiên phong duy trì tính hợp pháp trong một môi trường được quản lý chặt chẽ.

Các điểm chính cần lưu ý

  • Khôi phục toàn cầu: Claude Fable 5 sẽ trở lại các nền tảng Claude toàn cầu vào thứ Tư tuần này, sau đó là quyền truy cập từ các nhà cung cấp đám mây (AWS, Google, Microsoft).
  • Tăng cường an toàn: Một bộ phân loại an toàn mới đã được triển khai, ngăn chặn các kỹ thuật jailbreak đã được xác định trong hơn 99% trường hợp và chuyển hướng các truy vấn bị chặn sang Opus 4.8.
  • Sự liên kết về quy định: Anthropic đang hướng tới một mô hình hợp tác với chính phủ Hoa Kỳ, cung cấp các đánh giá trước khi phát hành và chia sẻ thông tin nhanh chóng về các mối đe dọa an ninh.