𝗞𝗠𝗠 𝘃𝟬.𝟬.𝟮: 𝗔𝗜 𝗔𝗚𝗘𝗡𝗧 𝗡𝗢𝗪𝗟𝗘𝗗𝗚𝗘 𝗣𝗜𝗣𝗘𝗟𝗜𝗡𝗘𝗦 𝗕𝗨𝗜𝗟𝗗𝗜𝗡𝗚

大きなコンテキストウィンドウがあればすべてが解決するわけではありません。

もし、あなたのAIエージェントが毎回ゼロからチャットを開始しているとしたら、それは問題です。昨日のリサーチ、先週のPDF、先月の競合分析を忘れてしまうからです。

多くの人はRAGやベクトルデータベースでこれを解決しようとしますが、低品質なデータをシステムに投入してしまうため、失敗に終わります。問題は「どのように検索するか」ではなく、「どのようにデータを収集するか」なのです。

Knowledge-and-Memory-Management (KMM) v0.0.2は、このインテーク(取り込み)プロセスを改善します。40種類以上の収集ツールを管理するためのフレームワークを提供します。

KMMはツールを以下の4つのカテゴリに分類しています:

• Web: 抽出用の6つのエンジン。Cloudflareの回避やChrome DevToolsの自動化ツールを含みます。 • Video: メタデータ、字幕、ASR(自動音声認識)用の8つのツール。文字起こし用にyt-dlpやWhisperを含みます。 • Content: RSS、ブログ、ニュースアグリゲーターなど、10以上のソース。 • Documents: 高精度なOCRを使用した、PDF、PPT、Wordへの完全なサポート。

これは単なるスクリプトのリストではありません。収集 (Collect) → 分析 (Analyze) → ノート化 (Note) → グラフ化 (Graph) → クラウド同期 (Cloud) という5段階のパイプラインです。

主要な機能の一つは、AugmentedSearchロジックです。これにより、エージェントが嘘をつくのを防ぎます。

システムはまずローカルのノートを検索します。ローカルの照合スコアが閾値を超えていれば、その結果を返します。スコアが低すぎる場合は、ウェブ検索を実行します。ウェブの検索結果には「source: web」と明確に表示されます。これにより、エージェントがウェブの検索結果をあたかもユーザー自身のプライベートな知識であるかのように振る舞うのを防ぎます。

NoteGeneratorは、明確なプロセスに従います:

  1. コレクターを介して生データを収集する。
  2. LLMを使用して、論点、データ、タイムラインを構造化する。
  3. ローカルのMarkdownノートに書き込む。
  4. データをナレッジグラフにマッピングする。
  5. rcloneを介してOneDriveなどのクラウドストレージに同期する。

PDFを実用的なスキルに変換することさえ可能です。refine_pdfツールは、ドキュメントを構造化されたノートとAIスキルへと自動的に変換します。

もしエージェントが教えたことをすぐに忘れてしまうなら、新しいデータベースを買うのではなく、より優れた収集パイプラインを構築してください。KMMは、まさにそれを実現するためのオーケストレーション・フレームワークを提供します。

出典: https://dev.to/manoir_yantai_f22f01340f0/yi-wan-quan-liao-jie-kmm-v002-de-zhen-shi-neng-li-zhi-jie-kai-xie--4e5g

オプションの学習コミュニティ: https://t.me/GyaanSetuAi