MCP + RAG : Pourquoi j'ai arrêté de construire des systèmes RAG complexes

J'ai passé quatre ans à construire des systèmes RAG complexes.

J'utilisais des stratégies de chunking, des modèles d'embedding, des bases de données vectorielles et des rerankers. J'ai construit un système pour ma base de connaissances de 1 800 heures. À chaque fois, je pensais le rendre parfait.

Cela n'a jamais bien fonctionné.

Puis j'ai ajouté la prise en charge du Model Context Protocol (MCP). Cela a tout changé. Le MCP rend le RAG complexe traditionnel obsolète pour la plupart des gens.

J'avais l'habitude de lutter contre ces problèmes :

  • Choisir entre un chunking sémantique ou récursif.
  • Choisir entre les embeddings d'OpenAI, Cohere ou Nomic.
  • Décider entre Pinecone, Weaviate ou Chroma.
  • Gérer la récupération top-k et le reranking.

Mon système RAG a atteint 2 000 lignes de code. C'était impressionnant, mais cela a échoué. J'essayais de rendre mes données intelligentes alors que l'IA l'était déjà.

Je suis passé à une approche MCP. J'ai construit un serveur avec seulement 150 lignes de code.

Je n'ai donné que deux outils à l'IA :

  • search_notes : utilise une simple correspondance de texte pour trouver des notes.
  • get_note_content : renvoie le texte intégral d'une note.

Pas de chunks. Pas d'embeddings complexes. Pas de bases de données vectorielles.

Cette approche simple bat mon système RAG sophistiqué 9 fois sur 10. Voici pourquoi :

  1. L'IA gère la logique. L'IA est plus douée pour décider de ce qui est pertinent qu'un chunker prédéfini.
  2. Contexte complet. Le RAG traditionnel découpe les notes en petits morceaux. Cela fait souvent perdre la réponse. Avec le MCP, l'IA lit la note entière. Elle saisit l'idée complète.
  3. Prévisibilité. La recherche textuelle est simple. Si le mot-clé existe, cela fonctionne. Vous évitez la dérive des embeddings (embedding drift) et les erreurs de dimension.

Vous devriez toujours utiliser le RAG traditionnel si :

  • Vous avez plus de 100 000 documents volumineux.
  • Vous avez besoin d'une production à grande échelle avec une faible latence.

Mais pour les bases de connaissances personnelles, les projets secondaires ou les outils internes, vous n'en avez pas besoin.

Les avantages du MCP :

  • Facile à maintenir : 150 lignes au lieu de 2 000.
  • Pas de coûts d'embedding : vous n'avez pas besoin de ré-encoder les données lorsque les modèles changent.
  • Meilleure précision : l'IA obtient le contexte complet.
  • Facile à déboguer : vous pouvez voir exactement pourquoi une recherche a échoué.

Arrêtez de sur-concevoir. Laissez l'IA faire le gros du travail. Donnez-lui accès à vos données et laissez-la lire.

Source: https://dev.to/kevinten10/mcp-rag-why-i-stopped-building-complex-rag-systems-after-mcp-changed-everything-4g86

Communauté d'apprentissage optionnelle : https://t.me/GyaanSetuAi