Anthropic, 정부 협상 끝에 Claude Fable 5에 대한 접근 권한 복구

트럼프 행정부와 수주간의 치열한 협상을 벌인 끝에, Anthropic은 큰 기대를 모았던 Claude Fable 5 모델의 복귀를 공식 승인했습니다. 이번 조치는 업계에서 가장 중요한 소비자용 AI 모델 중 하나를 소외시켰던 엄격한 수출 통제 기간 이후에 이루어졌습니다.

수출 통제 해제 및 글로벌 접근 권한 복구

상무부는 이전에 Claude Fable 5와 그 기반 기술인 Mythos 5에 대한 접근을 제한했던 수출 통제 지침을 공식적으로 해제했습니다. 이러한 통제는 Anthropic의 많은 해외 직원들과 기업 고객사의 미국 외 구성원들을 포함한 외국인들이 모델을 사용하는 것을 금지함으로써 막대한 운영상의 장애물을 초래했습니다.

Anthropic은 이번 주 수요일부터 Claude 플랫폼을 통해 전 세계적으로 Fable 5에 대한 접근 권한 복구를 시작할 것이라고 확인했습니다. 구체적인 일정은 정해지지 않았으나, 회사는 가까운 시일 내에 AWS, Google Cloud, Microsoft Foundry를 포함한 주요 클라우드 인프라에서 모델을 다시 활성화할 계획입니다.

탈옥(Jailbreak) 취약점 해결

정부의 초기 개입은 잠재적인 "탈옥(jailbreak)"에 대한 우려, 특히 취약점을 지적한 Amazon 연구원들의 보고서로 인해 촉발되었습니다. 이에 대응하여 Anthropic은 더욱 강력한 안전 아키텍처를 구현했습니다.

회사는 Amazon 보고서에서 확인된 특정 기술을 타겟팅하고 차단하도록 설계된 개선된 안전 분류기(safety classifier)를 학습시켰으며, 99% 이상의 성공률을 기록했다고 밝혔습니다. 요청이 차단될 때도 사용자 경험이 원활하게 유지되도록 Anthropic은 폴백(fallback) 메커니즘을 통합했습니다. 즉, Fable 5에 대한 요청이 새로운 분류기에 의해 차단될 경우, 자동으로 Opus 4.8 모델로 라우팅됩니다.

정부와 AI 협력의 새로운 시대

Fable 5의 복귀는 프런티어 AI 연구소와 연방 규제 기관이 상호작용하는 방식의 근본적인 변화를 시사합니다. Anthropic은 트럼프 행정부와 긴밀히 협력하기 위한 선제적인 전략을 개설했으며, 여기에는 다음이 포함됩니다:

  • 출시 전 정부 접근 권한: 정부 파트너가 모델이 대중에게 공개되기 전에 국가 안보와 관련된 모델에 대해 독립적인 평가를 수행할 수 있도록 허용합니다.
  • 신속한 정보 공유: 중대한 탈옥 또는 오용 패턴이 식별될 경우 즉각적인 공개를 약속합니다.
  • 자원 할당: 정부의 테스트 및 연구를 지원하기 위해 전담 팀을 구성하고 상당한 컴퓨팅 자원을 할당합니다.

또한, Anthropic은 Amazon, Microsoft, Google과 파트너십을 맺은 Project Glasswing 프로그램을 통해 자발적이고 공유된 보안 및 평가 표준을 수립하려는 업계 전반의 노력을 주도하고 있습니다. 이 프레임워크는 공격자의 능력 향상, 이득의 범위, 무기화 용이성 및 발견 가능성을 기준으로 탈옥의 심각성을 분류하고자 합니다.

이것이 AI 산업에 중요한 이유

이번 진전은 AI 지형의 분수령이 되는 순간이며, 특히 OpenAI와 같은 기업들이 GPT-5와 같은 모델에 대해 유사한 단계적 출시를 진행하고 있는 상황에서 더욱 그러합니다. 업계가 고급 사이버 보안 기능을 갖춘 더욱 강력한 모델로 나아감에 따라, 급격한 혁신과 국가 안보 사이의 긴장은 더욱 심화될 것입니다. "출시 전 테스트"와 "자발적 표준"을 공식화하려는 Anthropic의 움직임은 규제가 엄격한 환경에서 프런티어 모델 제공업체들이 정당성을 유지하는 청사진이 될 수 있습니다.

핵심 요약

  • 글로벌 복구: Claude Fable 5는 이번 주 수요일부터 전 세계 Claude 플랫폼에 복귀하며, 이후 클라우드 제공업체(AWS, Google, Microsoft)를 통한 접근이 이어질 예정입니다.
  • 강화된 안전성: 새로운 안전 분류기가 배포되어 식별된 탈옥 기술을 99% 이상의 사례에서 차단하며, 차단된 쿼리는 Opus 4.8로 리다이렉션됩니다.
  • 규제 정렬: Anthropic은 미국 정부와 협력 모델로 나아가고 있으며, 출시 전 평가와 보안 위협에 대한 신속한 정보 공유를 제공합니다.