AIエージェント:メモリ vs. ナレッジ

ほとんどのAIエージェントはメモリしか持っていません。メモリとは、あなたの名前や好みを覚えていることを意味します。しかし、それだけでは不十分です。

真の価値を提供するためには、エージェントにはナレッジが必要です。

メモリは「これを見た」であり、 ナレッジは「これを使える」です。

ほとんどのフレームワークはコンテキスト・キャッシングを使用しています。これらはチャットログや単純なキー・バリュー・ペアを保存するもので、ナレッジベースではありません。メモリしか持たないエージェントは、ウェブサイトや動画、技術書から学習することができません。それには収集レイヤーが欠けているからです。

エージェントを構築する際は、以下の3つのレイヤーを備えましょう:

  • 収集レイヤー (Collection Layer): ウェブページ、動画、ドキュメント、書籍からデータを取得します。
  • 分析レイヤー (Analysis Layer): AIを使用して要約、キーワード抽出、事実確認を行います。
  • ストレージレイヤー (Storage Layer): データを3つのティアに整理します。

3つのストレージ・ティアは次のように機能します:

  • ホット・ティア (Hot Tier / Hermes Memory Tool): ナノ秒単位の速度で、正確なキー・バリューの検索を行います。
  • ウォーム・ティア (Warm Tier / Hindsight Vector DB): ミリ秒単位の速度で、意味的な類似性を検索します。
  • コールド・ティア (Cold Tier / gbrain Knowledge Graph): 秒単位の速度で、複雑な推論やリンクの検索を行います。

検索時、システムはフォールバック・パスを辿ります。まずFTS5から開始し、失敗した場合はHindsightへ、それでも失敗した場合はgbrainへと移行します。一致するものが見つかった時点で停止するため、LLMのトークンを節約できます。

動画のワークフロー例:

  1. yt-dlpを使用して動画をダウンロード。
  2. Whisperを使用して音声をテキストに変換。
  3. OCRを使用してフレームからテキストを抽出。
  4. LLMを使用して構造化された要約を作成。
  5. ナレッジグラフに保存。

一つのコマンドで、この一連のチェーンを起動できます。

ユーザーが言ったことだけを覚えるエージェントを作るのはやめましょう。世界から情報を吸収するエージェントを構築してください。エージェントが新しいウェブデータと既存の知識を結びつけたとき、それは真の理解を始めます。

出典: https://dev.to/manoir_yantai_f22f01340f0/ai-dai-li-de-ji-yi-kun-jing-cong-ji-zhu-dao-zhi-dao--2g9n

オプションの学習コミュニティ: https://t.me/GyaanSetuAi