𝗞𝗠𝗠 𝘃𝟬.𝟬.𝟮: 𝗕𝗨𝗜𝗟𝗗𝗜𝗡𝗚 𝗔𝗜 𝗔𝗚𝗘𝗡𝗧 𝗞𝗡𝗢𝗪𝗟𝗘𝗗𝗚𝗘 𝗣𝗜𝗣𝗘𝗟𝗜𝗡𝗘𝗦

Translated for your language. 原文を読む.

AI-assisted draft.

GyaanSetu Editorial一昨日2分で読めます

𝗞𝗠𝗠 𝘃𝟬.𝟬.𝟮: 𝗔𝗜 𝗔𝗚𝗘𝗡𝗧 𝗡𝗢𝗪𝗟𝗘𝗗𝗚𝗘 𝗣𝗜𝗣𝗘𝗟𝗜𝗡𝗘𝗦 𝗕𝗨𝗜𝗟𝗗𝗜𝗡𝗚

大きなコンテキストウィンドウがあればすべてが解決するわけではありません。

もし、あなたのAIエージェントが毎回ゼロからチャットを開始しているとしたら、それは問題です。昨日のリサーチ、先週のPDF、先月の競合分析を忘れてしまうからです。

多くの人はRAGやベクトルデータベースでこれを解決しようとしますが、低品質なデータをシステムに投入してしまうため、失敗に終わります。問題は「どのように検索するか」ではなく、「どのようにデータを収集するか」なのです。

Knowledge-and-Memory-Management (KMM) v0.0.2は、このインテーク（取り込み）プロセスを改善します。40種類以上の収集ツールを管理するためのフレームワークを提供します。

KMMはツールを以下の4つのカテゴリに分類しています：

• Web: 抽出用の6つのエンジン。Cloudflareの回避やChrome DevToolsの自動化ツールを含みます。 • Video: メタデータ、字幕、ASR（自動音声認識）用の8つのツール。文字起こし用にyt-dlpやWhisperを含みます。 • Content: RSS、ブログ、ニュースアグリゲーターなど、10以上のソース。 • Documents: 高精度なOCRを使用した、PDF、PPT、Wordへの完全なサポート。

これは単なるスクリプトのリストではありません。収集 (Collect) → 分析 (Analyze) → ノート化 (Note) → グラフ化 (Graph) → クラウド同期 (Cloud) という5段階のパイプラインです。

主要な機能の一つは、AugmentedSearchロジックです。これにより、エージェントが嘘をつくのを防ぎます。

システムはまずローカルのノートを検索します。ローカルの照合スコアが閾値を超えていれば、その結果を返します。スコアが低すぎる場合は、ウェブ検索を実行します。ウェブの検索結果には「source: web」と明確に表示されます。これにより、エージェントがウェブの検索結果をあたかもユーザー自身のプライベートな知識であるかのように振る舞うのを防ぎます。

NoteGeneratorは、明確なプロセスに従います：

コレクターを介して生データを収集する。
LLMを使用して、論点、データ、タイムラインを構造化する。
ローカルのMarkdownノートに書き込む。
データをナレッジグラフにマッピングする。
rcloneを介してOneDriveなどのクラウドストレージに同期する。

PDFを実用的なスキルに変換することさえ可能です。refine_pdfツールは、ドキュメントを構造化されたノートとAIスキルへと自動的に変換します。

もしエージェントが教えたことをすぐに忘れてしまうなら、新しいデータベースを買うのではなく、より優れた収集パイプラインを構築してください。KMMは、まさにそれを実現するためのオーケストレーション・フレームワークを提供します。

出典: https://dev.to/manoir_yantai_f22f01340f0/yi-wan-quan-liao-jie-kmm-v002-de-zhen-shi-neng-li-zhi-jie-kai-xie--4e5g

オプションの学習コミュニティ: https://t.me/GyaanSetuAi

𝗞𝗠𝗠 𝘃𝟬.𝟬.𝟮: 𝗕𝗨𝗜𝗟𝗗𝗜𝗡𝗚 𝗔𝗜 𝗔𝗚𝗘𝗡𝗧 𝗞𝗡𝗢𝗪𝗟𝗘𝗗𝗚𝗘 𝗣𝗜𝗣𝗘𝗟𝗜𝗡𝗘𝗦

続きを読む

RAGパイプラインをゼロから構築する

𝗚𝗟𝗠 𝟱.𝟮 𝗜𝘀 𝗛𝗲𝗿𝗲 𝗳𝗼𝗿 𝗟𝗼𝗻𝗴 𝗧𝗮𝘀𝗸𝘀

𝗚𝗶𝘃𝗶𝗻𝗴 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔 𝗣𝗲𝗿𝗺𝗮𝗻𝗲𝗻𝘁 𝗠𝗲𝗺𝗼𝗿𝘆

AIエージェント：記憶 vs. 知識

AI as Your Quality Control Partner for Grant Writers