スマートなAIアプリの背後にある隠れたレイヤー

ChatGPT、Gemini、Claudeは素晴らしい存在です。概念を説明したり、メールのドラフトを作成したりするのが得意です。

しかし、実用的なツールを構築しようとすると、壁にぶつかります。自社製品を熟知したサポートボットや、自社のデータを理解するアシスタントが必要になるからです。

標準的なモデルでは、ここでは不十分です。有用なAIを構築するには、RAG、MCP、そしてagentic systemsという3つの特定のレイヤーが必要です。

RAG (Retrieval Augmented Generation) は、AIにデータへのアクセス権を与えます。

例えば、ユーザーが返金ポリシーについて質問したとしましょう。標準的なLLMは、あなたの会社の具体的なルールを知りません。それは学習データに含まれていなかったからです。RAGを使用すると、システムはまずドキュメントを検索します。適切なセクションを抽出し、それをモデルに渡します。すると、モデルは正確に回答できるようになります。RAGは「記憶」の問題を解決します。

MCP (Model Context Protocol) は、AIに「行動する能力」を与えます。

ドキュメントを知っているだけでは不十分です。AIがリアルタイムの為替レートを確認したり、在庫を照会したりする必要がある場合もあります。MCPは、モデルを外部の世界と接続するためのオープンスタンダードです。

次のように考えてみてください: • RAGは、AIが参照する「図書館」です。 • MCPは、AIが電話をかけるために使う「電話」です。

MCPは、モデルをAPI、データベース、ファイルシステムに接続します。モデルは、get_weather()search_inventory() といった利用可能なツールの説明を読み取ります。そして、どのツールを使用するかを決定し、それをリクエストし、取得したリアルタイムデータを回答に活用します。

Agentic architectureが、これらの要素を一つにまとめます。

これが、GitHub Copilotのようなツールの仕組みです。それらは単に推測しているわけではありません。検索、リアルタイムの機能、そして推論をループの中で活用しているのです。

アーキテクチャは次のように機能します:

  • RAGは「既知の情報」を提供します。
  • MCPは「今起きていること」を提供します。
  • Agentic loopsは「問題を解決する能力」を提供します。

より優れたツールを作るために、より大きなモデルが必要なわけではありません。必要なのは、より優れたアーキテクチャなのです。

Source: https://dev.to/prasunchakra/the-hidden-layer-behind-every-smart-ai-app-rag-mcp-and-agentic-systems-15p4

Optional learning community: https://t.me/GyaanSetuAi