米国政府 vs Anthropic:ハッキング不可能なLLMという不可能な要求

Fable 5モデルのリリースを受け、米国政府とAnthropicの間に溝が深まっており、AIの安全性と規制監督をめぐる議論が巻き起こっている。当局がこのAI研究所に対し、大統領令を回避していると非難するなか、より深刻な技術的緊張が表面化している。それは、政府による「ハッキング不可能な」フロンティアモデルへの要求である。

Fable 5とサイバー指令をめぐる対立

この緊張の背景には、トランプ政権による最近のサイバー大統領令で義務付けられた、政府指定のクリアリングハウス(審査機関)が完全に稼働する前に、Anthropicが最新モデルであるFable 5をリリースすることを決定したことがある。同指令は自主的な監督を求めていたものの、政府当局者はAnthropicが指令の精神を無視したと主張しており、同社を「悪質な主体(bad actor)」と非難する動きにつながっている。

商務省、CIA、そして科学顧問のマイケル・クラツィオス氏が関与する現在の議論は、巨大なコミュニケーションの乖離を浮き彫りにしている。当局者は、Amazonやその他のテック業界のパートナーから提供されたとされる「ジェイルブレイク(脱獄)」のリスクを知りながら、Anthropicが強行したことへの懸念を表明している。しかし、この摩擦は技術的なセキュリティの問題であると同時に、規制のタイミングに関する問題でもあるようだ。

技術的な現実:LLMは果たしてハッキング不可能になり得るのか?

政府による批判の核心、すなわちAnthropicが潜在的なジェイルブレイクを無視して「誤った道を選んだ」という主張は、大規模言語モデル(LLM)のアーキテクチャにおける根本的な現実を無視している。AI業界のコンセンサスでは、絶対的なセキュリティは現時点では不可能であるとされている。OpenAIでさえ、プロンプトインジェクションのような脆弱性は完全には解決できない可能性があることを認めている。

AnthropicのCEOであるダリオ・アモデイ氏は、生物学やテクノロジーといった機密性の高い分野におけるジェイルブレイクは「生死に関わる」ものになり得ると以前に指摘しているが、業界はいまだにこれらのリスクをどのように軽減すべきか苦闘している。モデルが国際的に展開される前に、実質的にハッキング不可能であることを要求することで、米国政府はイノベーションを阻害する前例を作ってしまう可能性がある。なぜなら、いかなるフロンティアモデル(GPT-5.5やKimi 2.7を含む)も、完璧なセキュリティシールドを備えてはいないからだ。

業界の反発と輸出管理をめぐる議論

高まる緊張を受け、Alex StamosやRachel Tobacといった業界のベテランを含む100人以上のサイバーセキュリティの専門家やエグゼクティブが、Lutnick商務長官とCairncross国家サイバーディレクターに対し、公開書簡を送りました。彼らは、AnthropicのFableおよびMythosモデルに対する輸出規制の解除を求めています。

専門家たちは、Fableはソフトウェアの欠陥を特定する能力が非常に高いものの、OpusやSonnetといった他のモデルと比較して、特段危険なわけではないと主張しています。極めて重要な点として、彼らは厳格な輸出規制が、実際には西側の防御側を不利にしていると警告しています。米国製の最先端モデルへのアクセスを制限することで、政府は意図せずして、米国の主要なフロンティアモデルからわずか数ヶ月遅れであると報じられている中国のオープンウェイトモデルに、優位性を与えてしまう可能性があるとしています。

主な要点