MCP + RAG: Mengapa Saya Berhenti Membina Sistem RAG yang Kompleks
Saya menghabiskan masa selama empat tahun membina sistem RAG yang kompleks.
Saya menggunakan strategi chunking, model embedding, pangkalan data vektor, dan reranker. Saya membina satu sistem untuk pangkalan pengetahuan saya yang berjumlah 1,800 jam. Setiap kali, saya fikir saya sedang menjadikannya sempurna.
Ia tidak pernah berfungsi dengan baik.
Kemudian saya menambah sokongan Model Context Protocol (MCP). Ia mengubah segalanya. MCP menjadikan RAG kompleks tradisional tidak lagi relevan bagi kebanyakan orang.
Dahulu saya sering bergelut dengan masalah ini:
- Memilih antara semantic chunking atau recursive chunking.
- Memilih antara embeddings OpenAI, Cohere, atau Nomic.
- Memutuskan antara Pinecone, Weaviate, atau Chroma.
- Menguruskan top-k retrieval dan reranking.
Sistem RAG saya mencecah 2,000 baris kod. Ia nampak hebat tetapi ia gagal. Saya cuba menjadikan data saya pintar sedangkan AI sudah pun pintar.
Saya beralih kepada pendekatan MCP. Saya membina pelayan dengan hanya 150 baris kod.
Saya hanya memberikan AI dua alatan:
search_notes: Menggunakan padanan teks ringkas untuk mencari nota.get_note_content: Mengembalikan teks penuh sesuatu nota.
Tiada chunks. Tiada embeddings yang kompleks. Tiada pangkalan data vektor.
Pendekatan ringkas ini menewaskan sistem RAG canggih saya 9 daripada 10 kali. Ini sebabnya:
- AI mengendalikan logik. AI lebih baik dalam menentukan apa yang relevan berbanding chunker yang telah ditetapkan.
- Konteks penuh. RAG tradisional memotong nota kepada bahagian-bahagian kecil. Ini sering menyebabkan jawapan hilang. Dengan MCP, AI membaca keseluruhan nota. Ia melihat idea yang lengkap.
- Kebolehramalan. Carian teks adalah ringkas. Jika kata kunci wujud, ia akan berfungsi. Anda dapat mengelakkan embedding drift dan ralat dimensi.
Anda masih perlu menggunakan RAG tradisional jika:
- Anda mempunyai lebih daripada 100,000 dokumen besar.
- Anda memerlukan pengeluaran skala tinggi dengan kependaman (latency) yang rendah.
Tetapi untuk pangkalan pengetahuan peribadi, projek sampingan, atau alatan dalaman, anda tidak memerlukannya.
Kelebihan MCP:
- Mudah diselenggara: 150 baris berbanding 2,000.
- Tiada kos embedding: Anda tidak perlu melakukan re-embed data apabila model berubah.
- Ketepatan lebih baik: AI mendapat konteks penuh.
- Mudah untuk nyahpepijat (debug): Anda boleh melihat dengan tepat mengapa carian gagal.
Berhenti melakukan over-engineering. Biarkan AI melakukan kerja berat. Berikan ia akses kepada data anda dan biarkan ia membaca.
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi
