为什么代理资源发现(Agentic Resource Discovery)是缺失的一层
AI 智能体面临着一个重大问题:它们难以在正确的时间选择正确的工具。
模型可能推理能力很强,工具可能搜索能力很强,GUI 控制器可能运行良好。但如果智能体不知道存在哪些工具,或者不知道如何对它们进行排序,它们就会失败。
大多数开发者使用静态方法。你先安装一个工具,稍后再使用它。你预先接入技能,并寄希望于它们能奏效。当你的智能体规模扩大时,这种方法就会失效。手动管理数百个工具是不可能的。
代理资源发现(Agentic Resource Discovery, ARD)解决了这个问题。智能体不再是硬编码工具,而是在运行时搜索注册表。
ARD 与现有协议协同工作:
- MCP 告诉智能体如何调用工具。
- Skills 告诉智能体如何遵循指令。
- A2A 告诉智能体如何触达另一个智能体。
- ARD 在上述任何操作开始之前,告诉智能体需要寻找什么。
ARD 规范包含两个主要部分:
- 发布者共享一个
ai-catalog.json文件。该文件包含标签和示例查询等元数据。 - 搜索 API 允许智能体发送自然语言请求。注册表会返回一个按优先级排序的能力列表。
这种方法比将每个工具的描述都放入提示词(prompt)中更经济,同时也能保持上下文窗口的整洁。
Hugging Face 通过其 Discover 工具实现了这一点。它将 Hub 的结果转化为 skills 或 MCP 服务器。
对于 GUI 智能体来说,发现机制更为重要。这些智能体必须选择正确的技能包或视觉剧本(visual playbook)。研究表明,多模态技能很有帮助。使用 VISUALSKILL 的 Claude 智能体比仅限文本的基准得分高出 15.3 分。
智能体生态系统正在快速增长。能力范围现在包括 API、UI 工作流和机器人策略。在这种环境下,你无法手动设置每一个工具。
如果你正在构建智能体产品,请遵循以下三条规则:
- 停止使用静态工具列表。它们会很快过时。
- 使用丰富的元数据。包含任务类型和查询,以提高搜索质量。
- 将发现与执行分离。使用搜索来寻找工具,使用协议来运行工具。
智能体面临的最大挑战不仅是推理,更是能力路由(capability routing)。最优秀的智能体将能以最快的速度找到正确的资源。
可选的学习社区:https://t.me/GyaanSetuAi