𝗜 𝗕𝘂𝗶𝗹𝘁 𝗮 𝗖𝗼𝗱𝗲 𝗤&𝗔 𝗕𝗼𝘁 𝗪𝗶𝘁𝗵 𝗥𝗔𝗚: 𝗪𝗵𝗮𝘁 𝗪𝗼𝗿𝗸𝗲𝗱 𝗮𝗻𝗱 𝗪𝗵𝗮𝘁 𝗙𝗮𝗶𝗹𝗲𝗱

Translated for your language. Read the original.

AI-assisted draft.

Saya Membina Bot Q&A Kod Dengan RAG: Apa Yang Berjaya Dan Apa Yang Gagal

Pembangun kami menghabiskan masa berhari-hari mencari melalui Slack dan dokumen lama untuk memahami mikroperkhidmatan kami. Saya memutuskan untuk membina chatbot bagi menjawab soalan-soalan ini menggunakan RAG.

Saya melakukan banyak kesilapan dalam proses tersebut. Inilah yang saya pelajari.

Kegagalan

Saya cuba memasukkan semua dokumen ke dalam satu prompt. Ia mencapai had token, menyebabkan halusinasi, dan menelan kos yang terlalu tinggi.
Saya menggunakan indeks TF-IDF asas. Ia gagal apabila pengguna menggunakan sinonim atau istilah yang berbeza.
Saya cuba menggunakan pecahan (chunks) 500-aksara yang ringkas. Hasilnya adalah rawak kerana pecahan tersebut sering terputus di tengah ayat.

Penyelesaian

Saya berhenti melayan LLM sebagai enjin carian. Saya mengubahnya menjadi enjin pembacaan untuk indeks carian khusus.

Inilah saluran kerja (pipeline) yang berjaya:

Pecahkan dokumen kepada bahagian 300-token dengan pertindihan (overlap) 50-token.
Benamkan (embed) setiap pecahan ke dalam vektor.
Simpan vektor dalam indeks carian kesamaan (similarity search index).
Semasa waktu pertanyaan, cari 5 pecahan yang paling serupa.
Masukkan hanya pecahan tersebut ke dalam LLM untuk menjana jawapan.

Perubahan ini mengurangkan halusinasi sebanyak 80% dan memotong kos kepada kurang daripada $0.01 bagi setiap pertanyaan.

Pengajaran Utama

Saiz pecahan adalah penting. 150 token memberikan konteks yang terlalu sedikit. 1000 token pula memberikan terlalu banyak gangguan (noise). 300 token adalah titik keseimbangan yang ideal.
Pertindihan (overlap) adalah wajib. Ia mengelakkan kehilangan konteks antara pecahan.
Gunakan model kecil untuk kelajuan. Model embedding yang kecil berfungsi dengan baik untuk keperluan dalaman kami.
Uji pengambilan (retrieval) anda. Jangan bergantung kepada semakan manual. Bina set ujian untuk mengukur ketepatan.

RAG bukanlah magis. Ia adalah satu teka-teki kejuruteraan. Jika pecahan anda teruk, pengambilan anda teruk. Jika pengambilan anda teruk, jawapan anda teruk.

Kami kini menjawab 80% soalan onboarding dengan betul. Ini jauh lebih pantas daripada menunggu manusia membalas di Slack.

Bagaimanakah anda membina pembantu AI untuk dokumentasi anda?

Source: https://dev.to/__c1b9e06dc90a7e0a676b/i-built-a-code-qa-bot-with-rag-what-worked-and-what-failed-2717

Optional learning community: https://t.me/GyaanSetuAi

𝗜 𝗕𝘂𝗶𝗹𝘁 𝗮 𝗖𝗼𝗱𝗲 𝗤&𝗔 𝗕𝗼𝘁 𝗪𝗶𝘁𝗵 𝗥𝗔𝗚: 𝗪𝗵𝗮𝘁 𝗪𝗼𝗿𝗸𝗲𝗱 𝗮𝗻𝗱 𝗪𝗵𝗮𝘁 𝗙𝗮𝗶𝗹𝗲𝗱

Continue reading

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗔𝗻 𝗜𝗻𝘁𝗲𝗿𝗻𝗮𝗹 𝗔𝗜 𝗖𝗵𝗮𝘁𝗯𝗼𝘁: 𝗟𝗲𝘀𝘀𝗼𝗻𝘀 𝗟𝗲𝗮𝗿𝗻𝗲𝗱

Saya Membelanjakan $500 untuk Infrastruktur RAG Sebelum Membetulkan 7 Kesilapan Ini

𝗜 𝗦𝗽𝗲𝗻𝘁 \$𝟱𝟬𝟬 𝗼𝗻 𝗥𝗔𝗚 𝗜𝗻𝗳𝗿𝗮𝘀𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲 𝗕𝗲𝗳𝗼𝗿𝗲 𝗠𝗮𝗸𝗶𝗻𝗴 𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀

𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗲𝘀

𝗪𝗵𝘆 𝗠𝘆 𝗥𝗔𝗚 𝗔𝗽𝗽 𝗞𝗲𝗽𝘁 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗶𝗻𝗴 𝗔𝗻𝗱 𝗛𝗼𝘄 𝗜 𝗙𝗶𝘅𝗲𝗱 𝗜𝘁