Google Cloud、AIエージェントを強化するOpen Knowledge Formatを発表
Google Cloudは、組織内の知識をポータブルなMarkdownファイルとして標準化するために設計された新しい仕様であるOpen Knowledge Format (OKF)をリリースしました。断片化されたデータを相互運用可能な形式に変換することで、OKFは、複雑なエンタープライズ・エコシステム全体でAIエージェントが効率的に動作することを妨げている、現在の巨大なコンテキスト・ギャップの解消を目指しています。
エージェント型ワークフローにおける断片化問題の解決
AIエージェントの自律性が高まるにつれ、「コンテキストの断片化」という大きな障害に直面しています。現在、重要な情報はメタデータカタログ、社内Wiki、コードコメント、Jupyter Notebookのセルなどに散在しています。AIエージェントが、特定のデータセットに対して正確なSQLクエリを作成するといったタスクを実行しようとする際、これらのバラバラな断片を繋ぎ合わせるのに苦労しなければなりません。
Google Cloudは、現在の状況がカスタムのサイロ化されたソリューションの寄せ集めであると指摘しています。開発者は現在、Obsidian Vaultから、AGENTS.mdやCLAUDE.mdといったカスタムの規約ファイルに至るまで、独自のコンテキスト・ソリューションを構築しています。これらの「metadata as code(コードとしてのメタデータ)」パターンは効果的ではあるものの、相互運用性に欠けています。知識はそれを生成した特定のシステムやリポジトリ内に閉じ込められたままとなり、異なるツールやフレームワーク間でのシームレスな情報の流れが妨げられています。
OKF仕様:ミニマリストかつ相互運用可能
Open Knowledge Format (v0.1)は、「LLM wiki」というコンセプトを取り入れ、それを普遍的な標準としてコード化するものです。その核となるOKFバンドルは、YAMLフロントマターを利用したMarkdownファイルのディレクトリです。仕様は導入を促進するために意図的に最小限に抑えられており、必須フィールドは「type」のみですが、作成者はtitle、description、resource、tags、timestampsなどのオプションフィールドを含めることができます。
標準的なMarkdownに依存しているため、ナレッジグラフは従来のMarkdownリンクを通じて形成され、概念を自然に接続します。この設計により、OKFは高いポータビリティを確保しています。OKFバンドルは、あらゆる標準的なテキストエディタで読み取ることができ、GitHub上でネイティブにレンダリングされ、既存のあらゆる検索ツールによってインデックス化できます。最も重要な点は、この仕様が作成者(producer)と消費者(consumer)を分離していることです。つまり、人間が書いたドキュメントをAIエージェントが処理でき、マシンが生成したバンドルを人間が簡単に可視化できることを意味します。
エコシステムの統合とリファレンス実装
仕様を理論にとどめないために、Google Cloudはいくつかのリファレンス実装とツールを提供しています。これには、BigQueryのデータセットをクロールして、すべてのテーブルに対してOKFドキュメントを自動生成できるエンリッチメント・エージェントが含まれます。また、Googleは静的なHTMLビジュアライザーをリリースし、GA4 eコマース、Stack Overflow、Bitcoinデータを含む複雑なデータセット向けのサンプルバンドルも提供しています。
極めて重要な点として、Google Cloudは独自のKnowledge Catalogを更新してOKFを取り込めるようにしており、このフォーマットをAIエージェントに直接提供することが可能になりました。仕様とコードをGitHubで公開することで、GoogleはOKFを次世代のエージェンティック・ワークフローの基盤レイヤーとして位置づけています。そこでは、知識は閉じられたデータのサイロではなく、標準化されたポータブルな資産として扱われます。
主なポイント
- 標準化されたコンテキスト: OKFは、散在するドキュメントをMarkdownファイルの統一されたディレクトリに変換し、AIエージェントが標準的なリンクを使用して複雑なナレッジグラフをナビゲートできるようにします。
- ミニマリストな設計: YAMLフロントマターに単一の「type」フィールドを要求するだけで済むため、この仕様は高いポータビリティと開発者にとっての導入の容易さを実現しています。
- 相互運用性: このフォーマットは、人間が読めるWikiとマシンが読めるメタデータの間のギャップを埋め、あらゆるクラウドプロバイダー、データベース、またはエージェントフレームワークにわたって動作します。