𝗚𝗼𝗼𝗴𝗹𝗲 𝗦𝗼𝗹𝘃𝗲𝘀 𝗜𝗻𝗳𝗿𝗮𝘀𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲, 𝗡𝗼𝘁 𝗚𝗼𝘃𝗲𝗿𝗻𝗮𝗻𝗰𝗲
Google I/O 2026では、Gemini APIにおけるManaged Agentsが発表されました。このツールは、エンタープライズチームにマネージドなランタイムを提供します。サンドボックス、認証情報の注入、および永続的なステート(状態)の管理を行います。
これはインフラの問題を解決します。しかし、AIエージェントプロジェクトを頓挫させる根本的な問題は解決しません。
ほとんどのチームは、間違ったものに注力しています。彼らは洗練されたデモを作成します。エージェントが航空券を予約したり、質問に答えたりする様子を見せます。これらのデモは見た目は良いですが、本番環境では失敗します。
本物のエンタープライズ・ワークフローには、チャットUI以上のものが必要です。サポートエージェントの仕事は、質問に答えて終わりではありません。チケットを更新し、返金処理を行い、SalesforceやServiceNowといった異なるシステムを介して顧客に通知を行って初めて完了するのです。
標準的なRAG構成では、以下の3つの要素が欠けているため、ここで失敗します。
- ステート(状態)の欠如:すべての会話がリセットされた状態で始まってしまう。
- 書き込み権限の欠如:データの読み取りはできるが、レコードの更新ができない。
- 認可の欠如:機密性の高いアクションを制限する方法がない。
GoogleはManaged Agents APIによって「エンジン」を構築しました。しかし、「ブレーキ」は構築していません。APIは実行を処理しますが、信頼境界(trust boundaries)の管理はユーザーが行う必要があります。
これからの12ヶ月間、エンタープライズAIの主導権を握るのは、ガバナンスをマスターしたチームです。これをバックエンドの統合問題として扱うなら、失敗するでしょう。これをシステムガバナンスの問題として扱うなら、製品をリリースできるはずです。
本番環境に対応したエージェントを構築するために、この7層フレームワークを活用してください:
- インターフェース:UIまたはトリガー。
- オーケストレーター:目標をステップに分解し、人間による承認ゲートを管理する。
- モデル:サンドボックス内の推論エンジン。
- ツール/APIレイヤー:最小限かつ明示的なスコープを持つすべての統合。
- ナレッジレイヤー:ワークフローをサポートするためのRAG。
- サンドボックス:隔離された実行環境。
- 監査:すべてのアクションのログと、ミスを元に戻すための手段。
ベンダーを選ぶ際、エージェントに「何ができるか」で選んではいけません。エージェントに「何を許可するか」をどのように制御できるかで選んでください。
パイロット運用では、以下のルールに従ってください:
- ワークフローをリスクレベル別にマッピングする。
- まず、レガシーシステム用の軽量なAPIラッパーを構築する。
- ワークフロー全体ではなく、特定のアクションにリスクティア(階層)を割り当てる。
- エージェントが人間にエスカレーションすべきタイミングをテストする。
- 承認の頻度を監視し、摩擦が生じている箇所を特定する。
インフラは今やコモディティです。信頼と制御こそが、新たな差別化要因となります。
Optional learning community: https://t.me/GyaanSetuAi