𝗪𝗵𝘆 𝗔𝗴𝗲𝗻𝘁𝗶𝗰 𝗥𝗲𝘀𝗼𝘂𝗿𝗰𝗲 𝗗𝗶𝘀𝗰𝗼𝘃𝗲𝗿𝘆 𝗶𝘀 𝗧𝗵𝗲 𝗠𝗶𝘀𝘀𝗶𝗻𝗴 𝗟𝗮𝘆𝗲𝗿 なぜ Agentic Resource Discovery (ARD) が欠けているレイヤーなのか
AIエージェントは大きな問題に直面しています。適切なタイミングで適切なツールを選択することに苦労しているのです。
モデルの推論能力が高くても、ツールの検索能力が高くても、GUIコントローラーがうまく機能しても、どのようなツールが存在するのか、あるいはそれらをどのようにランク付けすべきかを知らなければ、エージェントは失敗します。
ほとんどの開発者は静的なアプローチを採用しています。ツールをインストールし、後でそれを使用するという方法です。あらかじめスキルを組み込み、それが機能することを期待します。しかし、エージェントが成長すると、この手法は破綻します。何百ものツールを手動で管理することは不可能です。
Agentic Resource Discovery (ARD) はこの問題を解決します。ツールをハードコードする代わりに、エージェントは実行時にレジストリを検索します。
ARDは既存のプロトコルと並行して動作します:
- MCPは、エージェントにツールの呼び出し方を伝えます。
- Skillsは、エージェントに指示に従う方法を伝えます。
- A2Aは、エージェントに他のエージェントへの到達方法を伝えます。
- ARDは、これらが開始される前に、エージェントに何を見つけるべきかを伝えます。
ARDの仕様は、主に2つの部分で構成されています:
- パブリッシャーは
ai-catalog.jsonファイルを共有します。このファイルには、タグやサンプルクエリなどのメタデータが含まれています。 - 検索APIにより、エージェントは自然言語のリクエストを送信できます。レジストリは、機能のランク付けされたリストを返します。
この手法は、すべてのツールの説明をプロンプトに含めるよりもコストが低く抑えられます。また、コンテキストウィンドウをクリーンに保つことができます。
Hugging Faceは、Discoverツールを使用してこれを実装しています。これはHubの結果をスキルやMCPサーバーに変換します。
ディスカバリーは、GUIエージェントにとってさらに重要です。これらのエージェントは、適切なスキルパックやビジュアルプレイブックを選択しなければなりません。研究によれば、マルチモーダルなスキルが有効であることが示されています。VISUALSKILLを使用するClaudeエージェントは、テキストのみのベースラインよりも15.3ポイント高いスコアを記録しました。
エージェントのエコシステムは急速に拡大しています。現在、その機能にはAPI、UIワークフロー、ロボットポリシーが含まれています。このような環境では、すべてのツールを手動で設定することはできません。
エージェント製品を構築する場合は、次の3つのルールに従ってください:
- 静的なツールリストの使用をやめる。これらはすぐに古くなります。
- 豊富なメタデータを使用する。検索の質を高めるために、タスクタイプやクエリを含めます。
- ディスカバリーと実行を分離する。検索でツールを見つけ、プロトコルを使用してそれを実行します。
エージェントにとって最大の課題は、単なる推論ではありません。それは機能のルーティング(capability routing)です。優れたエージェントは、適切なリソースを最も迅速に見つけ出すことができます。
任意の学習コミュニティ: https://t.me/GyaanSetuAi