エンタープライズAIエージェントはサーバーを離れつつある
AIエージェントは、サーバーの枠を超えようとしています。
多くの人は、エージェントはバックエンドにのみ存在するものだと考えています。エージェントはデータベースを更新したり、APIを呼び出したりするものだと思っているのです。しかし、実際の作業が行われるのはブラウザの中です。
エージェントは、画面上で何が選択されているかを知る必要があります。保存されていないフォームデータを見る必要もあります。カーソルの位置やブラウザの権限も把握していなければなりません。
サーバーはこれらのことについては何も知りません。サーバーが見ることができるのは、最終的な結果だけです。
サーバーサイドのツールだけを構築していると、エージェントは目が見えない状態になります。古いデータに基づいて行動し、ミスを犯すことになるでしょう。
だからこそ、クライアントサイドのツールこそが未来なのです。
サーバーに巨大なデータのかたまりを送信する代わりに、フロントエンドのツールを使用すべきです。これらのツールを使えば、エージェントはアプリケーション内で直接アクションを実行できます。
これが重要である理由は以下の通りです:
- コントロール:フロントエンドが、ユーザーの権限に基づいてエージェントが使用できるツールを決定します。
- 正確性:エージェントは古いレコードではなく、UIの現在の状態に基づいて動作します。
- 安全性:サーバーで何かが実行される前に、機密性の高いアクションに対して人間のクリックを必須にすることができます。
- トレーサビリティ:ブラウザからバックエンドに至るまで、アクションを追跡できます。
本番環境レベルのAIエージェントを構築したい場合は、以下のステップに従ってください:
- 明確な型を持つコードとしてツールを定義する。
- システムプロンプトに頼るのではなく、権限ルールを使用する。
- エラーを避けるため、すべてのツール呼び出しに最新の状態バージョンを含める。
- エージェントが行うすべてのアクションに対して、取り消し(undo)パスを構築する。
- クライアントからAPIに至るまでの実行パス全体を追跡する。
AIエージェントは、ユーザーの意図とアプリケーションの状態が交差する「混沌とした中間領域(messy middle)」へと移行しています。勝ち残るためには、インターフェースを掌握しなければなりません。
出典: https://dev.to/focused_dot_io/enterprise-ai-agents-are-leaving-the-server-focused-labs-5740
オプションの学習コミュニティ: https://t.me/GyaanSetuAi