KMM v0.0.2: СОЗДАНИЕ КОНВЕЙЕРОВ ЗНАНИЙ ДЛЯ ИИ-АГЕНТОВ
Большие окна контекста не решают всех проблем.
Если ваш ИИ-агент начинает каждый чат с нуля, у вас проблема. Он забывает вчерашние исследования, PDF-файлы прошлой недели и анализ конкурентов за прошлый месяц.
Большинство пытается решить это с помощью RAG и векторных баз данных. Они терпят неудачу, потому что загружают в систему низкокачественные данные. Проблема не в том, как вы ищете. Проблема в том, как вы собираете данные.
Knowledge-and-Memory-Management (KMM) v0.0.2 исправляет процесс сбора данных. Он предоставляет фреймворк для управления более чем 40 инструментами сбора.
KMM организует инструменты по четырем категориям:
• Web: 6 движков для извлечения данных, включая инструменты для обхода Cloudflare и автоматизации через Chrome DevTools. • Video: 8 инструментов для работы с метаданными, субтитрами и ASR. Включает yt-dlp и Whisper для транскрибации. • Content: 10+ источников, таких как RSS, блоги и новостные агрегаторы. • Documents: Полная поддержка PDF, PPT и Word с использованием высокоточного OCR.
Это не просто список скриптов. Это пятиэтапный конвейер: Сбор → Анализ → Заметка → Граф → Облако.
Ключевой особенностью является логика AugmentedSearch. Она не позволяет вашему агенту лгать вам.
Система сначала ищет в ваших локальных заметках. Если показатель соответствия (match score) в локальных данных превышает установленный порог, она возвращает результат. Если показатель слишком низкий, запускается поиск в вебе. Результаты из сети четко помечаются как «source: web». Это мешает агенту выдавать результаты из интернета за ваши собственные приватные знания.
NoteGenerator следует четкому пути:
- Сбор сырых данных с помощью коллекторов.
- Использование LLM для структурирования аргументов, данных и временных шкал.
- Запись в локальные заметки Markdown.
- Построение графа знаний на основе данных.
- Синхронизация с облачными хранилищами, такими как OneDrive, через rclone.
Вы даже можете превратить PDF-файл в полезный навык. Инструмент refine_pdf автоматически преобразует документ в структурированную заметку и навык для ИИ.
Если ваш агент продолжает забывать то, что вы ему говорили, не покупайте новую базу данных. Создайте лучший конвейер сбора данных. KMM предоставляет фреймворк для оркестрации, который позволяет сделать именно это.
Дополнительное обучающее сообщество: https://t.me/GyaanSetuAi