Google Cloud Unveils Open Knowledge Format to Power AI Agents
Google Cloud has launched the Open Knowledge Format (OKF), a new specification designed to standardize organizational knowledge into portable Markdown files. By transforming fragmented data into an interoperable format, OKF aims to solve the massive context gap that currently prevents AI agents from operating efficiently across complex enterprise ecosystems.
Solving the Fragmentation Problem in Agentic Workflows
As AI agents become more autonomous, they face a significant hurdle: "context fragmentation." Currently, critical information is scattered across metadata catalogs, internal wikis, code comments, and Jupyter notebook cells. When an AI agent attempts to perform a task—such as writing a precise SQL query for a specific dataset—it must struggle to piece together these disparate fragments.
Google Cloud notes that the current landscape is a patchwork of custom, siloed solutions. Developers are currently building bespoke context solutions, ranging from Obsidian Vaults to custom convention files like AGENTS.md or CLAUDE.md. While these "metadata as code" patterns are effective, they lack interoperability. Knowledge remains locked within the specific system or repository that created it, preventing a seamless flow of information between different tools and frameworks.
The OKF Specification: Minimalist and Interoperable
The Open Knowledge Format (v0.1) takes the "LLM wiki" concept and codifies it into a universal standard. At its core, an OKF bundle is a directory of Markdown files utilizing YAML frontmatter. The specification is intentionally minimal to encourage adoption; the only mandatory field is "type," though producers can include optional fields such as title, description, resource, tags, and timestamps.
Because it relies on standard Markdown, the knowledge graph is formed through traditional Markdown links, connecting concepts naturally. This design ensures that OKF is highly portable: an OKF bundle can be read in any standard text editor, rendered natively on GitHub, and indexed by any existing search tool. Most importantly, the spec decouples producers from consumers, meaning a human-written document can be processed by an AI agent, and a machine-generated bundle can be easily visualized by a human.
Ecosystem Integration and Reference Implementations
لضمان انتقال المواصفات من مجرد نظرية إلى حيز التنفيذ، توفر Google Cloud عدة تطبيقات مرجعية وأدوات. ويشمل ذلك وكيل إثراء (enrichment agent) قادرًا على زحف مجموعات بيانات BigQuery لإنشاء مستندات OKF تلقائيًا لكل جدول. كما أصدرت Google أداة عرض مرئية بصيغة HTML ثابتة، ووفرت حزمًا نموذجية لمجموعات البيانات المعقدة، بما في ذلك بيانات التجارة الإلكترونية لـ GA4، وStack Overflow، وبيانات Bitcoin.
والأهم من ذلك، قامت Google Cloud بتحديث Knowledge Catalog الخاص بها لاستيعاب OKF، مما يسمح بتقديم هذا التنسيق مباشرة إلى وكلاء الذكاء الاصطناعي (AI agents). ومن خلال إتاحة المواصفات والتعليمات البرمجية على GitHub، تضع Google تنسيق OKF كطبقة أساسية للجيل القادم من سير العمل القائم على الوكلاء (agentic workflows)، حيث يتم التعامل مع المعرفة كأصل معياري وقابل للنقل بدلاً من كونها صوامع بيانات مغلقة.
أهم النقاط المستخلصة
- سياق معياري: يحول OKF التوثيقات المشتتة إلى دليل موحد من ملفات Markdown، مما يسمح لوكلاء الذكاء الاصطناعي بالتنقل عبر الرسوم البيانية المعرفية المعقدة باستخدام روابط قياسية.
- تصميم بسيط: من خلال اشتراط حقل "type" واحد فقط في YAML frontmatter، تضمن المواصفات قابلية نقل عالية وسهولة في الاستخدام للمطورين.
- التوافق التشغيلي: يسد هذا التنسيق الفجوة بين الويكي (wikis) القابلة للقراءة من قبل البشر والبيانات الوصفية (metadata) القابلة للقراءة من قبل الآلات، حيث يعمل عبر أي مزود سحابي أو قاعدة بيانات أو إطار عمل للوكلاء.