Google Cloud 发布 Open Knowledge Format,为 AI Agent 提供动力
Google Cloud 推出了 Open Knowledge Format (OKF),这是一种旨在将组织知识标准化为可移植 Markdown 文件的新规范。通过将碎片化的数据转换为可互操作的格式,OKF 旨在解决目前阻碍 AI Agent 在复杂企业生态系统中高效运行的海量上下文差距问题。
解决智能体工作流中的碎片化问题
随着 AI Agent 变得越来越自主,它们面临着一个重大障碍:“上下文碎片化”。目前,关键信息散落在元数据目录、内部维基 (wikis)、代码注释和 Jupyter notebook 单元格中。当 AI Agent 尝试执行任务时——例如为特定数据集编写精确的 SQL 查询——它必须艰难地拼凑这些零散的碎片。
Google Cloud 指出,目前的现状是由各种定制化的、孤立的解决方案拼凑而成的。开发者目前正在构建定制的上下文解决方案,从 Obsidian Vaults 到像 AGENTS.md 或 CLAUDE.md 这样的自定义约定文件不等。虽然这些“元数据即代码”的模式很有效,但它们缺乏互操作性。知识仍然被锁定在创建它的特定系统或仓库中,阻碍了不同工具和框架之间信息的无缝流动。
OKF 规范:极简且可互操作
Open Knowledge Format (v0.1) 采用了“LLM wiki”的概念,并将其编纂为通用标准。其核心是一个包含使用 YAML frontmatter 的 Markdown 文件的目录,即 OKF bundle。该规范刻意保持极简以鼓励采用;唯一的必填字段是 "type",不过生产者可以包含可选字段,如 title、description、resource、tags 和 timestamps。
由于它依赖于标准 Markdown,知识图谱通过传统的 Markdown 链接形成,从而自然地连接各个概念。这种设计确保了 OKF 具有高度的可移植性:一个 OKF bundle 可以在任何标准文本编辑器中读取,在 GitHub 上原生渲染,并被任何现有的搜索工具索引。最重要的是,该规范将生产者与消费者解耦,这意味着人类编写的文档可以由 AI Agent 处理,而机器生成的 bundle 可以被人类轻松可视化。
生态系统集成与参考实现
为了确保该规范不仅仅停留在理论层面,Google Cloud 正在提供几种参考实现和工具。这包括一个富化代理(enrichment agent),能够爬取 BigQuery 数据集,并为每个表自动生成 OKF 文档。Google 还发布了一个静态 HTML 可视化工具,并为复杂数据集提供了示例包,包括 GA4 电子商务、Stack Overflow 和比特币数据。
至关重要的是,Google Cloud 已更新其自身的 Knowledge Catalog 以摄取 OKF,从而允许将该格式直接提供给 AI 代理。通过在 GitHub 上公开该规范和代码,Google 正将 OKF 定位为下一代智能体工作流(agentic workflows)的基础层,在这种工作流中,知识被视为一种标准化的、可移植的资产,而不是被锁定的数据孤岛。
核心要点
- 标准化的上下文: OKF 将零散的文档转换为统一的 Markdown 文件目录,允许 AI 代理使用标准链接来浏览复杂的知识图谱。
- 极简设计: 通过在 YAML frontmatter 中仅要求一个 "type" 字段,该规范确保了高度的可移植性和对开发者的低摩擦。
- 互操作性: 该格式弥合了人类可读的维基(wikis)与机器可读的元数据之间的鸿沟,可跨任何云提供商、数据库或智能体框架运行。