Anthropic、手頃な価格のAIエージェントを実現する Claude Sonnet 5 をリリース

Anthropicは、高度な推論能力とコスト効率の高い自律的な実行能力のギャップを埋めるために特別に設計されたミッドサイズモデル、Claude Sonnet 5を正式にリリースしました。「エージェンティック(agentic)」な能力、つまりツールの使用、計画、反復といった能力を優先することで、AnthropicはSonnet 5を、自動化ワークフローを構築する開発者にとっての主要なエンジンとして位置づけています。

エージェンティック・インテリジェンスへの移行

現在のAI軍拡競争において、業界は単純なチャットボットを超え、自律型エージェントへと移行しています。Anthropicのリリースは、OpenAIのGPT-5.6 SolやGoogleのGemini 3.5 Flashによる同様の動きに続くものであり、エージェンティックなパフォーマンスが新たな基準であることを示唆しています。

Claude Sonnet 5は、ブラウザやターミナルを活用して多段階のタスクを実行できる自律的なオペレーターとして機能するように設計されています。複雑なシーケンスの途中で停止してしまう可能性があった以前のバージョンとは異なり、Sonnet 5は「自身の出力をチェックする」という独自の能力を備えており、エンドツーエンドのワークフローを完遂できます。例えば、Zapierのエンジニアは、このモデルがSalesforceのアカウントティアの更新とエンタープライズ向けローンチ告知の送信という2部構成のタスクを正常に完了したことを報告しています。これは、以前のモデルでは途中で失敗していたプロセスです。

パフォーマンス・ベンチマーク:重量級モデルに匹敵

Sonnet 5はミッドサイズモデルですが、そのパフォーマンス指標はAnthropicのフラッグシップモデルであるOpus 4.8に迫るものとなっています。エージェンティックなコーディングのベンチマークにおいて、Sonnet 5は63.2%を記録し、前身のSonnet 4.6(58.1%)を大幅に上回り、Opus 4.8(69.2%)にわずかに及ばない程度の結果を出しました。

特筆すべきは、特定のナレッジワークのベンチマークにおいて、Sonnet 5が実際にOpus 4.8を上回ったことです。これにより、最上位モデルの高額なコストをかけずに深い推論を必要とする開発者にとって、非常に効率的な選択肢となります。Anthropicは、Opus 4.8が極めて高い精度と繊細な判断の標準であり続ける一方で、Sonnet 5は日常的な自動化において品質とコストの理想的なバランスを提供すると示唆しています。

攻めの価格設定と安全基準

普及を促進するため、Anthropicは競争力のある価格体系を導入しました。8月31日までは、Sonnet 5の価格は入力トークン100万件あたり2ドル、出力トークン100万件あたり10ドルに設定されています。この期間終了後は、入力トークン100万件あたり3ドル、出力トークン100万件あたり15ドルに調整されます。この価格設定により、Sonnet 5はOpenAIのGPT-5.5やGoogleのGemini 3.1 Proよりも手頃な価格となりますが、Gemini 3.5 Flashよりは高価なままです。

エージェントの展開においては、悪意のあるコマンドを拒否するモデルの能力が極めて重要であり、安全性も同様に不可欠です。Sonnet 5は、Sonnet 4.6と比較して、欺瞞や悪用への協力といった「望ましくない行動」の発生率が低下しています。また、プロンプトインジェクション攻撃に対する耐性の向上や、追従的(sycophantic)な振る舞いの減少も示されており、数百万人のユーザーにツールを展開する開発者にとって、より信頼できるパートナーとなっています。

主なポイント

  • エージェンティックへの注力: Sonnet 5は、ツールの使用(ブラウザ/ターミナル)や自己修正を含む自律的なタスクに最適化されており、複雑な自動化に理想的です。
  • コスト効率: このモデルは、Opus 4.8、GPT-5.5、Gemini 3.1 Proといったフラッグシップモデルに代わる、高性能かつ低コストな選択肢を提供します。
  • 安全性の向上: 悪意のあるリクエストの拒否やプロンプトインジェクションへの耐性が大幅に改善されており、エージェンティックなワークフローにおいてより安全に使用できます。