MCP + RAG：複雑なRAGシステムの構築をやめた理由

Translated for your language. 原文を読む.

AI-assisted draft.

GyaanSetu Editorial先週2分で読めます

MCP + RAG：なぜ私は複雑なRAGシステムの構築をやめたのか

私は4年もの間、複雑なRAGシステムの構築に費やしてきました。

チャンク分割戦略、埋め込みモデル、ベクトルデータベース、そしてリランカー（reranker）を駆使しました。1,800時間分のナレッジベースのためのシステムを構築したのです。そのたびに、完璧に近づいていると考えていました。

しかし、うまく機能することはありませんでした。

そんな時、Model Context Protocol (MCP) のサポートを導入しました。それがすべてを変えました。MCPは、ほとんどの人にとって、従来の複雑なRAGを時代遅れなものにします。

かつて私は、次のような問題に頭を悩ませていました：

私のRAGシステムはコードが2,000行に達しました。見た目は立派でしたが、失敗に終わりました。AI自体がすでに賢いのに、私はデータを賢くしようと躍起になっていたのです。

私はMCPアプローチに切り替えました。わずか150行のコードでサーバーを構築したのです。

AIには2つのツールだけを与えました：

チャンクも、複雑な埋め込みも、ベクトルデータベースもありません。

このシンプルなアプローチは、私の凝ったRAGシステムに対して10回中9回は勝利します。その理由は以下の通りです：

AIがロジックを処理する。あらかじめ設定されたチャンカーよりも、AIの方が何が関連しているかを判断するのが得意です。
完全なコンテキスト。従来のRAGはノートを小さな断片に分割します。これにより、答えが失われることがよくあります。MCPを使えば、AIはノート全体を読み取ります。つまり、概念の全体像を把握できるのです。
予測可能性。テキスト検索はシンプルです。キーワードが存在すれば機能します。埋め込みのドリフト（embedding drift）や次元エラーを回避できます。

ただし、次のような場合は依然として従来のRAGを使用すべきです：

しかし、個人のナレッジベース、サイドプロジェクト、あるいは社内ツールであれば、それらは必要ありません。

MCPのメリット：

オーバーエンジニアリングはやめましょう。大変な作業はAIに任せればいいのです。AIにデータへのアクセス権を与え、自由に読ませましょう。

オプションの学習コミュニティ: https://t.me/GyaanSetuAi

続きを読む