𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

📅2 hours ago⏱1 min read

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗱𝗮𝗻 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝗮𝘀 𝗔𝗴𝗲𝗻

Sebagian besar sistem RAG gagal saat produksi. Mereka tidak gagal karena model bahasa. Mereka gagal pada tahap retrieval.

Sistem gagal mengambil potongan data yang tepat. Atau sistem mengambil datanya tetapi menempatkannya di peringkat 40. Generator tidak pernah melihat informasi tersebut. Tim Anda tidak memiliki cara untuk melihat apa yang salah.

Arsitektur ini memperbaiki kedua masalah tersebut.

Ikuti tiga langkah ini untuk hasil yang lebih baik:

Gunakan Hybrid Retrieval Jalankan pencarian leksikal BM25 dan dense semantic search secara bersamaan. Gunakan reciprocal rank fusion untuk menggabungkan daftar tersebut. Benchmark menunjukkan bahwa hal ini menambah 8 poin persentase pada Recall@5 pada data teks dan tabel dibandingkan dengan hanya menggunakan BM25 saja.
Tambahkan Reranker Reranker adalah cara terbaik Anda untuk meningkatkan presisi. Gunakan cross-encoder pada 50 hingga 100 kandidat teratas. Langkah ini meningkatkan hasil Anda secara signifikan.
Fokus pada Observabilitas Anda memerlukan trace untuk menemukan kesalahan dalam pipeline retrieval Anda. Tanpa trace, Anda tidak dapat memperbaiki sistem tersebut.

Bangun sistem RAG Anda dengan standar produksi ini.

Sumber: https://dev.to/rishi_kora/hybrid-retrieval-and-agent-observability-a-production-rag-build-2h6p

Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

Continue reading

𝗛𝗶𝗴𝗵 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗗𝗶𝘀𝘁𝗿𝗶𝗯𝘂𝘁𝗲𝗱 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗔𝗚, 𝗔𝗜 𝗠𝗲𝗺𝗼𝗿𝘆, 𝗮𝗻𝗱 𝗚𝗼𝗼𝗴𝗹𝗲 𝗖𝗟𝗜

𝗬𝗢𝗨𝗥 𝗔𝗚𝗘𝗡𝗧 𝗙𝗔𝗜𝗟𝗘𝗗 𝗜𝗡 𝗣𝗥𝗢𝗗. 𝗚𝗢𝗢𝗗 𝗟𝗨𝗖𝗞 𝗥𝗘𝗣𝗥𝗢𝗗𝗨𝗖𝗜𝗡𝗚 𝗜𝗧.

Membangun Agen AI yang Tangguh

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀