AIエージェント:メモリ vs. ナレッジ
ほとんどのAIエージェントはメモリしか持っていません。メモリとは、あなたの名前や好みを覚えていることを意味します。しかし、それだけでは不十分です。
真の価値を提供するためには、エージェントにはナレッジが必要です。
メモリは「これを見た」であり、 ナレッジは「これを使える」です。
ほとんどのフレームワークはコンテキスト・キャッシングを使用しています。これらはチャットログや単純なキー・バリュー・ペアを保存するもので、ナレッジベースではありません。メモリしか持たないエージェントは、ウェブサイトや動画、技術書から学習することができません。それには収集レイヤーが欠けているからです。
エージェントを構築する際は、以下の3つのレイヤーを備えましょう:
- 収集レイヤー (Collection Layer): ウェブページ、動画、ドキュメント、書籍からデータを取得します。
- 分析レイヤー (Analysis Layer): AIを使用して要約、キーワード抽出、事実確認を行います。
- ストレージレイヤー (Storage Layer): データを3つのティアに整理します。
3つのストレージ・ティアは次のように機能します:
- ホット・ティア (Hot Tier / Hermes Memory Tool): ナノ秒単位の速度で、正確なキー・バリューの検索を行います。
- ウォーム・ティア (Warm Tier / Hindsight Vector DB): ミリ秒単位の速度で、意味的な類似性を検索します。
- コールド・ティア (Cold Tier / gbrain Knowledge Graph): 秒単位の速度で、複雑な推論やリンクの検索を行います。
検索時、システムはフォールバック・パスを辿ります。まずFTS5から開始し、失敗した場合はHindsightへ、それでも失敗した場合はgbrainへと移行します。一致するものが見つかった時点で停止するため、LLMのトークンを節約できます。
動画のワークフロー例:
- yt-dlpを使用して動画をダウンロード。
- Whisperを使用して音声をテキストに変換。
- OCRを使用してフレームからテキストを抽出。
- LLMを使用して構造化された要約を作成。
- ナレッジグラフに保存。
一つのコマンドで、この一連のチェーンを起動できます。
ユーザーが言ったことだけを覚えるエージェントを作るのはやめましょう。世界から情報を吸収するエージェントを構築してください。エージェントが新しいウェブデータと既存の知識を結びつけたとき、それは真の理解を始めます。
出典: https://dev.to/manoir_yantai_f22f01340f0/ai-dai-li-de-ji-yi-kun-jing-cong-ji-zhu-dao-zhi-dao--2g9n
オプションの学習コミュニティ: https://t.me/GyaanSetuAi
