为什么代理资源发现(Agentic Resource Discovery)是缺失的一层

AI 智能体面临着一个重大问题:它们难以在正确的时间选择正确的工具。

模型可能推理能力很强,工具可能搜索能力很强,GUI 控制器可能运行良好。但如果智能体不知道存在哪些工具,或者不知道如何对它们进行排序,它们就会失败。

大多数开发者使用静态方法。你先安装一个工具,稍后再使用它。你预先接入技能,并寄希望于它们能奏效。当你的智能体规模扩大时,这种方法就会失效。手动管理数百个工具是不可能的。

代理资源发现(Agentic Resource Discovery, ARD)解决了这个问题。智能体不再是硬编码工具,而是在运行时搜索注册表。

ARD 与现有协议协同工作:

  • MCP 告诉智能体如何调用工具。
  • Skills 告诉智能体如何遵循指令。
  • A2A 告诉智能体如何触达另一个智能体。
  • ARD 在上述任何操作开始之前,告诉智能体需要寻找什么。

ARD 规范包含两个主要部分:

  • 发布者共享一个 ai-catalog.json 文件。该文件包含标签和示例查询等元数据。
  • 搜索 API 允许智能体发送自然语言请求。注册表会返回一个按优先级排序的能力列表。

这种方法比将每个工具的描述都放入提示词(prompt)中更经济,同时也能保持上下文窗口的整洁。

Hugging Face 通过其 Discover 工具实现了这一点。它将 Hub 的结果转化为 skills 或 MCP 服务器。

对于 GUI 智能体来说,发现机制更为重要。这些智能体必须选择正确的技能包或视觉剧本(visual playbook)。研究表明,多模态技能很有帮助。使用 VISUALSKILL 的 Claude 智能体比仅限文本的基准得分高出 15.3 分。

智能体生态系统正在快速增长。能力范围现在包括 API、UI 工作流和机器人策略。在这种环境下,你无法手动设置每一个工具。

如果你正在构建智能体产品,请遵循以下三条规则:

  1. 停止使用静态工具列表。它们会很快过时。
  2. 使用丰富的元数据。包含任务类型和查询,以提高搜索质量。
  3. 将发现与执行分离。使用搜索来寻找工具,使用协议来运行工具。

智能体面临的最大挑战不仅是推理,更是能力路由(capability routing)。最优秀的智能体将能以最快的速度找到正确的资源。

来源:https://dev.to/prabhakar_chaudhary_7afe4/why-agentic-resource-discovery-is-the-missing-layer-for-ai-agents-2lnh

可选的学习社区:https://t.me/GyaanSetuAi