Google Cloud dévoile l'Open Knowledge Format pour propulser les agents IA
Google Cloud a lancé l'Open Knowledge Format (OKF), une nouvelle spécification conçue pour standardiser les connaissances organisationnelles sous forme de fichiers Markdown portables. En transformant des données fragmentées en un format interopérable, l'OKF vise à combler l'énorme fossé contextuel qui empêche actuellement les agents IA de fonctionner efficacement au sein d'écosystèmes d'entreprise complexes.
Résoudre le problème de la fragmentation dans les flux de travail agentiques
À mesure que les agents IA gagnent en autonomie, ils sont confrontés à un obstacle majeur : la « fragmentation contextuelle ». Actuellement, les informations critiques sont éparpillées entre les catalogues de métadonnées, les wikis internes, les commentaires de code et les cellules de notebooks Jupyter. Lorsqu'un agent IA tente d'accomplir une tâche — comme l'écriture d'une requête SQL précise pour un ensemble de données spécifique — il doit lutter pour rassembler ces fragments disparates.
Google Cloud note que le paysage actuel est un assemblage de solutions personnalisées et cloisonnées. Les développeurs créent actuellement des solutions de contexte sur mesure, allant des Obsidian Vaults à des fichiers de convention personnalisés tels que AGENTS.md ou CLAUDE.md. Bien que ces modèles de « métadonnées en tant que code » soient efficaces, ils manquent d'interopérabilité. La connaissance reste verrouillée dans le système ou le dépôt spécifique qui l'a créée, empêchant un flux d'informations fluide entre les différents outils et frameworks.
La spécification OKF : minimaliste et interopérable
L'Open Knowledge Format (v0.1) reprend le concept de « wiki pour LLM » et le codifie en une norme universelle. À la base, un bundle OKF est un répertoire de fichiers Markdown utilisant du frontmatter YAML. La spécification est intentionnellement minimaliste pour encourager l'adoption ; le seul champ obligatoire est « type », bien que les producteurs puissent inclure des champs optionnels tels que le titre, la description, la ressource, les tags et les horodatages.
Parce qu'il repose sur le Markdown standard, le graphe de connaissances est formé par des liens Markdown traditionnels, connectant les concepts de manière naturelle. Cette conception garantit que l'OKF est hautement portable : un bundle OKF peut être lu dans n'importe quel éditeur de texte standard, rendu nativement sur GitHub et indexé par n'importe quel outil de recherche existant. Plus important encore, la spécification découple les producteurs des consommateurs, ce qui signifie qu'un document écrit par un humain peut être traité par un agent IA, et qu'un bundle généré par une machine peut être facilement visualisé par un humain.
Intégration de l'écosystème et implémentations de référence
Pour s'assurer que la spécification dépasse le stade théorique, Google Cloud fournit plusieurs implémentations de référence et outils. Cela inclut un agent d'enrichissement capable de parcourir des jeux de données BigQuery pour générer automatiquement des documents OKF pour chaque table. Google a également publié un visualiseur HTML statique et fourni des ensembles d'exemples pour des jeux de données complexes, notamment l'e-commerce GA4, Stack Overflow et les données Bitcoin.
Point crucial, Google Cloud a mis à jour son propre Knowledge Catalog pour ingérer l'OKF, permettant ainsi au format d'être servi directement aux agents d'IA. En mettant la spécification et le code à disposition sur GitHub, Google positionne l'OKF comme une couche fondamentale pour la prochaine génération de workflows agentiques, où la connaissance est traitée comme un actif standardisé et portable plutôt que comme un silo de données verrouillé.
Points clés
- Contexte standardisé : L'OKF convertit une documentation éparpillée en un répertoire unifié de fichiers Markdown, permettant aux agents d'IA de naviguer dans des graphes de connaissances complexes à l'aide de liens standards.
- Conception minimaliste : En ne requérant qu'un seul champ « type » dans le frontmatter YAML, la spécification garantit une grande portabilité et une faible friction pour les développeurs.
- Interopérabilité : Le format comble le fossé entre les wikis lisibles par l'humain et les métadonnées lisibles par la machine, fonctionnant avec n'importe quel fournisseur cloud, base de données ou framework d'agent.