Google Cloud Công bố Định dạng Kiến thức Mở nhằm Thúc đẩy các Tác nhân AI
Google Cloud đã ra mắt Open Knowledge Format (OKF), một đặc tả mới được thiết kế để tiêu chuẩn hóa kiến thức của tổ chức thành các tệp Markdown có tính di động cao. Bằng cách chuyển đổi dữ liệu phân mảnh thành một định dạng có khả năng tương tác, OKF nhằm giải quyết khoảng cách ngữ cảnh khổng lồ hiện đang ngăn cản các tác nhân AI hoạt động hiệu quả trong các hệ sinh thái doanh nghiệp phức tạp.
Giải quyết Vấn đề Phân mảnh trong Quy trình làm việc của Tác nhân
Khi các tác nhân AI ngày càng trở nên tự chủ hơn, chúng phải đối mặt với một trở ngại đáng kể: "sự phân mảnh ngữ cảnh" (context fragmentation). Hiện tại, các thông tin quan trọng đang bị phân tán khắp các danh mục siêu dữ liệu, wiki nội bộ, chú thích mã nguồn và các ô (cells) trong Jupyter notebook. Khi một tác nhân AI cố gắng thực hiện một nhiệm vụ—chẳng hạn như viết một truy vấn SQL chính xác cho một tập dữ liệu cụ thể—nó phải chật vật để chắp vá các mảnh thông tin rời rạc này lại với nhau.
Google Cloud lưu ý rằng bối cảnh hiện tại là một tập hợp chắp vá của các giải pháp tùy chỉnh và biệt lập. Các nhà phát triển hiện đang xây dựng các giải pháp ngữ cảnh riêng biệt, từ Obsidian Vaults đến các tệp quy ước tùy chỉnh như AGENTS.md hoặc CLAUDE.md. Mặc dù các mô hình "siêu dữ liệu dưới dạng mã" (metadata as code) này có hiệu quả, nhưng chúng thiếu khả năng tương tác. Kiến thức vẫn bị khóa chặt trong hệ thống hoặc kho lưu trữ (repository) cụ thể đã tạo ra nó, ngăn cản dòng chảy thông tin liền mạch giữa các công cụ và khung làm việc (frameworks) khác nhau.
Đặc tả OKF: Tối giản và Có khả năng Tương tác
Open Knowledge Format (v0.1) lấy khái niệm "LLM wiki" và mã hóa nó thành một tiêu chuẩn phổ quát. Về cốt lõi, một gói (bundle) OKF là một thư mục gồm các tệp Markdown sử dụng YAML frontmatter. Đặc tả này được thiết kế tối giản một cách có chủ đích để khuyến khích việc áp dụng; trường bắt buộc duy nhất là "type", mặc dù các bên tạo có thể bao gồm các trường tùy chọn như title, description, resource, tags và timestamps.
Vì dựa trên Markdown tiêu chuẩn, đồ thị kiến thức (knowledge graph) được hình thành thông qua các liên kết Markdown truyền thống, giúp kết nối các khái niệm một cách tự nhiên. Thiết kế này đảm bảo rằng OKF có tính di động cao: một gói OKF có thể được đọc trong bất kỳ trình chỉnh sửa văn bản tiêu chuẩn nào, được hiển thị trực tiếp trên GitHub và được lập chỉ mục bởi bất kỳ công cụ tìm kiếm hiện có nào. Quan trọng nhất, đặc tả này tách biệt bên tạo khỏi bên tiêu thụ, nghĩa là một tài liệu do con người viết có thể được xử lý bởi một tác nhân AI, và một gói do máy tạo ra có thể được con người dễ dàng trực quan hóa.
Tích hợp Hệ sinh thái và Các Bản triển khai Tham chiếu
Để đảm bảo đặc tả này không chỉ dừng lại ở mức lý thuyết, Google Cloud đang cung cấp một số công cụ và bản triển khai tham chiếu. Điều này bao gồm một tác nhân làm giàu dữ liệu (enrichment agent) có khả năng thu thập các tập dữ liệu BigQuery để tự động tạo các tài liệu OKF cho mọi bảng. Google cũng đã phát hành một trình trực quan hóa HTML tĩnh và cung cấp các gói mẫu cho các tập dữ liệu phức tạp, bao gồm dữ liệu thương mại điện tử GA4, Stack Overflow và dữ liệu Bitcoin.
Quan trọng hơn, Google Cloud đã cập nhật Knowledge Catalog của chính mình để tiếp nhận OKF, cho phép định dạng này được cung cấp trực tiếp cho các tác nhân AI. Bằng cách cung cấp đặc tả và mã nguồn trên GitHub, Google đang định vị OKF như một lớp nền tảng cho thế hệ quy trình làm việc dựa trên tác nhân (agentic workflows) tiếp theo, nơi kiến thức được coi là một tài sản chuẩn hóa, có thể di chuyển thay vì là một kho dữ liệu bị cô lập.
Những điểm chính cần lưu ý
- Ngữ cảnh chuẩn hóa: OKF chuyển đổi các tài liệu rời rạc thành một thư mục thống nhất gồm các tệp Markdown, cho phép các tác nhân AI điều hướng các đồ thị tri thức phức tạp bằng các liên kết tiêu chuẩn.
- Thiết kế tối giản: Bằng cách chỉ yêu cầu một trường "type" duy nhất trong YAML frontmatter, đặc tả này đảm bảo khả năng di động cao và giảm thiểu trở ngại cho các nhà phát triển.
- Khả năng tương tác: Định dạng này thu hẹp khoảng cách giữa các wiki dễ đọc đối với con người và siêu dữ liệu (metadata) dễ đọc đối với máy móc, hoạt động trên bất kỳ nhà cung cấp đám mây, cơ sở dữ liệu hoặc khung tác nhân (agent framework) nào.