𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗱𝗮𝗻 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝗮𝘀 𝗔𝗴𝗲𝗻
Sebagian besar sistem RAG gagal saat produksi. Mereka tidak gagal karena model bahasa. Mereka gagal pada tahap retrieval.
Sistem gagal mengambil potongan data yang tepat. Atau sistem mengambil datanya tetapi menempatkannya di peringkat 40. Generator tidak pernah melihat informasi tersebut. Tim Anda tidak memiliki cara untuk melihat apa yang salah.
Arsitektur ini memperbaiki kedua masalah tersebut.
Ikuti tiga langkah ini untuk hasil yang lebih baik:
Gunakan Hybrid Retrieval Jalankan pencarian leksikal BM25 dan dense semantic search secara bersamaan. Gunakan reciprocal rank fusion untuk menggabungkan daftar tersebut. Benchmark menunjukkan bahwa hal ini menambah 8 poin persentase pada Recall@5 pada data teks dan tabel dibandingkan dengan hanya menggunakan BM25 saja.
Tambahkan Reranker Reranker adalah cara terbaik Anda untuk meningkatkan presisi. Gunakan cross-encoder pada 50 hingga 100 kandidat teratas. Langkah ini meningkatkan hasil Anda secara signifikan.
Fokus pada Observabilitas Anda memerlukan trace untuk menemukan kesalahan dalam pipeline retrieval Anda. Tanpa trace, Anda tidak dapat memperbaiki sistem tersebut.
Bangun sistem RAG Anda dengan standar produksi ini.
Sumber: https://dev.to/rishi_kora/hybrid-retrieval-and-agent-observability-a-production-rag-build-2h6p
Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi