Nghiên cứu của Amazon đã dẫn đến các biện pháp hạn chế từ Nhà Trắng đối với Anthropic như thế nào

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial3 tuần trước3min read

In this article

Nghiên cứu của Amazon đã kích hoạt các biện pháp hạn chế của Nhà Trắng đối với Anthropic

Một đột phá về an ninh mạng gần đây của các nhà nghiên cứu Amazon đã gây chấn động ngành công nghiệp AI, dẫn đến các chỉ thị kiểm soát xuất khẩu quan trọng đối với Anthropic. Quyết định hạn chế quyền truy cập vào các mô hình tiên tiến của Anthropic đã làm bùng lên một cuộc tranh luận gay gắt về an ninh quốc gia, lỗ hổng mô hình và bối cảnh chính trị của trí tuệ nhân tạo.

Nghiên cứu của Amazon đã kích hoạt lệnh cấm

Cuộc tranh cãi tập trung vào một báo cáo kỹ thuật do nhóm nghiên cứu bảo mật của Amazon thực hiện. Theo các báo cáo từ Wall Street Journal, các nhà nghiên cứu của Amazon đã chứng minh rằng thông qua một chuỗi các câu lệnh (prompts) cụ thể, các mô hình Fable 5 và Mythos 5 của Anthropic có thể bị thao túng để cung cấp thông tin có khả năng hỗ trợ các cuộc tấn công mạng.

Phát hiện này được cho là đã được CEO của Amazon, Andy Jassy, chia sẻ trực tiếp với Nhà Trắng. Sau các cuộc thảo luận này, chính phủ đã ban hành một chỉ thị kiểm soát xuất khẩu, qua đó ngăn chặn hiệu quả các công dân nước ngoài truy cập vào các mô hình cụ thể này. Động thái này đã tạo ra một cuộc khủng hoảng nội bộ tức thì cho Anthropic, vì nhiều nhà nghiên cứu của chính công ty này là người gốc nước ngoài và hiện đang bị cấm sử dụng chính công nghệ mà họ đã góp phần xây dựng.

Cuộc tranh luận về "Jailbreak" và các lỗ hổng mô hình

Anthropic đã nhanh chóng lên tiếng bác bỏ phân loại kỹ thuật của chính phủ về sự cố này. Trong khi chính quyền mô tả hành vi khai thác này là một vụ "jailbreak", Anthropic lập luận rằng các lỗ hổng được xác định không chỉ riêng có ở kiến trúc của họ. Công ty cho rằng nhiều lỗ hổng bảo mật tương tự có thể được phát hiện bằng cách sử dụng các mô hình nổi tiếng khác đang được cung cấp công khai, chẳng hạn như GPT 5.5.

Tranh chấp kỹ thuật này được hỗ trợ bởi các chuyên gia bảo mật độc lập. Katie Moussouris, người sáng lập và CEO của LutaSecurity, đã tuyên bố công khai rằng những phát hiện trong báo cáo của Amazon không cấu thành một vụ "jailbreak" truyền thống. Sự phân biệt này có ý nghĩa quan trọng đối với ngành công nghiệp, vì nó đặt ra câu hỏi liệu chính phủ đang nhắm vào các lỗi mô hình cụ thể hay đang thực hiện các biện pháp quản lý rộng hơn, có lẽ mang tính phản ứng.

Căng thẳng chính trị và bối cảnh AI

Lệnh cấm này không diễn ra một cách biệt lập; nó xuất hiện giữa bối cảnh rạn nứt ngày càng sâu sắc giữa Anthropic và chính quyền hiện tại. Anthropic đã duy trì một lập trường đạo đức vững vàng, từ chối cho phép các mô hình AI của mình được sử dụng để giám sát hàng loạt công dân Hoa Kỳ hoặc phát triển các vũ khí tự hành gây chết người.

Các rào cản đạo đức này được cho là đã dẫn đến sự xích mích với chính quyền Trump, bên trước đó đã chỉ thị các cơ quan liên bang ngừng sử dụng các dịch vụ AI của Anthropic. Một số nhà quan sát trong ngành, bao gồm cựu quan chức Bộ Thương mại Kate Koren, cho rằng lập trường hiện tại của Nhà Trắng đối với Anthropic có thể đã ảnh hưởng đến tốc độ và mức độ nghiêm trọng của các hạn chế xuất khẩu gần đây. Khi các mô hình AI trở nên mạnh mẽ hơn, điểm giao thoa giữa nghiên cứu an ninh mạng, đạo đức doanh nghiệp và kiểm soát địa chính trị đang trở thành mặt trận mới của việc quản lý công nghệ.

Các điểm chính cần lưu ý

Ngòi nổ an ninh: Nghiên cứu của Amazon đã chứng minh rằng Fable 5 và Mythos 5 có thể bị điều hướng để hỗ trợ các cuộc tấn công mạng, dẫn đến các hạn chế xuất khẩu liên bang.
Thiệt hại ngoài dự kiến: Lệnh cấm công dân nước ngoài truy cập các mô hình của Anthropic đã vô tình ngăn cản nhiều nhà nghiên cứu gốc nước ngoài của chính công ty tiếp cận các công cụ của họ.
Bất đồng về kỹ thuật: Anthropic và các chuyên gia an ninh lập luận rằng lỗ hổng này không phải là một lỗi "jailbreak" duy nhất mà là một vấn đề mang tính hệ thống hiện diện trong các mô hình khác như GPT 5.5.