Google Cloud presenta el Open Knowledge Format para potenciar los agentes de IA

Google Cloud ha lanzado el Open Knowledge Format (OKF), una nueva especificación diseñada para estandarizar el conocimiento organizacional en archivos Markdown portátiles. Al transformar datos fragmentados en un formato interoperable, el OKF busca resolver la enorme brecha de contexto que actualmente impide que los agentes de IA operen de manera eficiente en ecosistemas empresariales complejos.

Resolviendo el problema de la fragmentación en los flujos de trabajo de agentes

A medida que los agentes de IA se vuelven más autónomos, se enfrentan a un obstáculo significativo: la "fragmentación del contexto". Actualmente, la información crítica está dispersa en catálogos de metadatos, wikis internas, comentarios de código y celdas de cuadernos Jupyter. Cuando un agente de IA intenta realizar una tarea —como escribir una consulta SQL precisa para un conjunto de datos específico— debe esforzarse para unir estos fragmentos dispares.

Google Cloud señala que el panorama actual es un mosaico de soluciones personalizadas y aisladas. Los desarrolladores están creando soluciones de contexto a medida, que van desde Obsidian Vaults hasta archivos de convención personalizados como AGENTS.md o CLAUDE.md. Si bien estos patrones de "metadatos como código" son efectivos, carecen de interoperabilidad. El conocimiento permanece bloqueado dentro del sistema o repositorio específico que lo creó, lo que impide un flujo fluido de información entre diferentes herramientas y marcos de trabajo.

La especificación OKF: Minimalista e interoperable

El Open Knowledge Format (v0.1) toma el concepto de "wiki para LLM" y lo codifica en un estándar universal. En su esencia, un paquete OKF es un directorio de archivos Markdown que utilizan YAML frontmatter. La especificación es intencionadamente minimalista para fomentar su adopción; el único campo obligatorio es type, aunque los productores pueden incluir campos opcionales como title, description, resource, tags y timestamps.

Debido a que se basa en Markdown estándar, el grafo de conocimiento se forma a través de enlaces Markdown tradicionales, conectando conceptos de forma natural. Este diseño garantiza que el OKF sea altamente portátil: un paquete OKF puede leerse en cualquier editor de texto estándar, renderizarse de forma nativa en GitHub e indexarse mediante cualquier herramienta de búsqueda existente. Lo más importante es que la especificación desacopla a los productores de los consumidores, lo que significa que un documento escrito por un humano puede ser procesado por un agente de IA, y un paquete generado por una máquina puede ser visualizado fácilmente por un humano.

Integración del ecosistema e implementaciones de referencia

Para asegurar que la especificación vaya más allá de la teoría, Google Cloud está proporcionando varias implementaciones de referencia y herramientas. Esto incluye un agente de enriquecimiento capaz de rastrear conjuntos de datos de BigQuery para generar automáticamente documentos OKF para cada tabla. Google también ha lanzado un visualizador HTML estático y ha proporcionado paquetes de muestra para conjuntos de datos complejos, incluyendo datos de GA4 e-commerce, Stack Overflow y Bitcoin.

De manera crucial, Google Cloud ha actualizado su propio Knowledge Catalog para ingerir OKF, lo que permite que el formato se sirva directamente a los agentes de IA. Al poner la especificación y el código a disposición en GitHub, Google está posicionando a OKF como una capa fundamental para la próxima generación de flujos de trabajo de agentes, donde el conocimiento se trata como un activo estandarizado y portátil en lugar de un silo de datos cerrado.

Conclusiones clave

  • Contexto estandarizado: OKF convierte la documentación dispersa en un directorio unificado de archivos Markdown, lo que permite a los agentes de IA navegar por grafos de conocimiento complejos utilizando enlaces estándar.
  • Diseño minimalista: Al requerir solo un único campo "type" en el frontmatter de YAML, la especificación garantiza una alta portabilidad y una baja fricción para los desarrolladores.
  • Interoperabilidad: El formato cierra la brecha entre las wikis legibles por humanos y los metadatos legibles por máquinas, funcionando en cualquier proveedor de la nube, base de datos o framework de agentes.