すべてのAPIはエージェント向けに再構築される

MCPは接続の問題を解決する。しかし、「動詞のギャップ(verb gap)」を解決するわけではない。

完璧なREST APIをMCPでラップするのに、午後のひとときもあれば十分だ。それでも、コーディングエージェントは苦戦するだろう。間違ったエンドポイントを選択したり、1つで足りる場面で3つのツールを呼び出したり、確認なしに破壊的な書き込みを行ったりする可能性がある。

APIが壊れているのではない。単に、対象となるコンシューマー(利用者)が間違っているだけなのだ。

20年もの間、APIは人間向けに構築されてきた。人間は「意図」と「メンタルモデル」を持っている。しかし、エージェントにはそのどちらもない。彼らは、提供されたインターフェースからその両方を再構築しなければならない。

主要なコンシューマーがこれほど大きく変わるなら、インターフェースも変わらなければならない。

本格的なプロダクトのインターフェースは、単に既存のAPIをラップするだけでは済まないだろう。エージェントネイティブな操作を中心に、APIを再構築することになると私は信じている。

これは、リソース中心のAPIから、意図(intent)に基づいたコントラクトへの移行を意味する。目標、状態、副作用、承認、そしてリカバリを中心に再設計しなければならない。

MCPは接続とトランスポートのための優れた標準である。しかし、その仕様において、ツールは単に名前とスキーマを持つ関数に過ぎない。操作の順序や、どれが危険であるかを判断することはない。

これが「動詞のギャップ」を生む。APIはエージェントに「名詞」と「CRUD操作」を与えるが、エージェントが必要としているのは「意図を伴う動詞」なのだ。

GitHubを見てほしい。彼らはエージェントの推論能力を向上させるために、ツールセットを絞り込んでいる。プロダクトのAPIとエージェント用ツールの1対1のマッピングではうまくいかないことを、彼らは学んでいるのだ。

研究によれば、APIは構造的には有効であっても、エージェントにとっては意味的に無用な場合がある。エージェントネイティブなAPIは、「何を返すべきか」以上の問いに答える。それは以下の通りだ:

  • 目標は何か?
  • 現在の状態は何か?
  • 副作用は何か?
  • 承認が必要か?
  • どうやってリカバリするか?

生の書き込み(raw write)の代わりに、プロセスを分割する必要がある:

  • 操作をプレビューする。
  • 明示的な承認を得る。
  • 変更をコミットする。
  • 失敗した場合はロールバックする。

これは単なる「エージェント版」ではない。単に、より優れたAPIなのだ。開発者もまた、プレビュー、明確な権限エラー、そしてロールバックを求めている。最終的には、エージェントネイティブな設計が人間中心の設計に取って代わるだろう。

このシフトは巨大だ。API、CLI、そしてログにまで影響を及ぼす。私たちは、人間が読むための散文から、マシンが解析可能な状態へと移行しなければならない。

安全性は、後から追加するラッパーではない。安全性とは、操作そのものに組み込むべき特性なのだ。

Source: https://dev.to/gyu07/every-api-will-be-rebuilt-for-agents-2hj4

Optional learning community: https://t.me/GyaanSetuAi