MCP + RAG: Neden Karmaşık RAG Sistemleri İnşa Etmeyi Bıraktım
Karmaşık RAG sistemleri inşa etmekle dört yılımı harcadım.
Chunking stratejileri, embedding modelleri, vektör veritabanları ve reranker'lar kullandım. 1.800 saatlik bilgi tabanım için bir sistem kurdum. Her seferinde onu mükemmelleştirdiğimi düşünüyordum.
Hiçbir zaman iyi çalışmadı.
Sonra Model Context Protocol (MCP) desteği ekledim. Her şeyi değiştirdi. MCP, çoğu insan için geleneksel karmaşık RAG sistemlerini gereksiz kılıyor.
Eskiden şu sorunlarla boğuşurdum:
- Semantik mi yoksa rekürsif chunking mi yapılacağı arasında seçim yapmak.
- OpenAI, Cohere veya Nomic embedding'leri arasında seçim yapmak.
- Pinecone, Weaviate veya Chroma arasında karar vermek.
- Top-k retrieval ve reranking süreçlerini yönetmek.
RAG sistemim 2.000 satır koda ulaştı. Etkileyiciydi ama başarısız oldu. Yapay zeka zaten akıllıyken, ben verilerimi akıllı hale getirmeye çalışıyordum.
MCP yaklaşımına geçtim. Sadece 150 satır koddan oluşan bir sunucu inşa ettim.
Yapay zekaya sadece iki araç verdim:
search_notes: Notları bulmak için basit metin eşleştirme kullanır.get_note_content: Bir notun tam metnini döndürür.
Chunk yok. Karmaşık embedding'ler yok. Vektör veritabanları yok.
Bu basit yaklaşım, süslü RAG sistemimi 10 seferin 9'unda yeniyor. İşte nedeni:
- Mantığı yapay zeka yönetir. Yapay zeka, neyin ilgili olduğuna karar vermede önceden ayarlanmış bir chunker'dan daha iyidir.
- Tam bağlam. Geleneksel RAG, notları küçük parçalara böler. Bu durum genellikle cevabın kaybolmasına neden olur. MCP ile yapay zeka notun tamamını okur. Bütünsel fikri görür.
- Öngörülebilirlik. Metin araması basittir. Anahtar kelime varsa çalışır. Embedding kayması (drift) ve boyut (dimension) hatalarından kaçınmış olursunuz.
Şu durumlarda hala geleneksel RAG kullanmalısınız:
- 100.000'den fazla büyük belgeniz varsa.
- Düşük gecikmeli, yüksek ölçekli bir üretim ortamına ihtiyacınız varsa.
Ancak kişisel bilgi tabanları, yan projeler veya dahili araçlar için buna ihtiyacınız yok.
MCP'nin faydaları:
- Bakımı kolay: 2.000 satır yerine 150 satır.
- Embedding maliyeti yok: Modeller değiştiğinde verileri yeniden embed etmeniz gerekmez.
- Daha iyi doğruluk: Yapay zeka tam bağlamı alır.
- Hata ayıklaması kolay: Bir aramanın neden başarısız olduğunu tam olarak görebilirsiniz.
Aşırı mühendislik yapmayı bırakın. Ağır işi yapay zekaya bırakın. Verilerinize erişim sağlayın ve okumasına izin verin.
İsteğe bağlı öğrenme topluluğu: https://t.me/GyaanSetuAi
