Bagaimana Makmal Jepun Membina Sistem RAG yang Lebih Baik

Translated for your language. Read the original.

AI-assisted draft.

Bagaimana Makmal Jepun Membina Sistem RAG yang Lebih Baik

Pangkalan data vektor anda mengembalikan cebisan (chunks) yang relevan. Model embedding anda mendapat skor tinggi dalam penanda aras. Namun, apabila pengguna bertanya soalan yang kompleks, sistem memberikan jawapan yang tidak berguna.

Ini adalah kegagalan seni bina capaian (retrieval architecture). Menala (tuning) LLM anda tidak akan menyelesaikannya.

Sebuah pasukan penyelidik Jepun telah menemui penyelesaiannya. Mereka membina sistem RAG graf pengetahuan (knowledge graph). Pendekatan ini meningkatkan ketepatan tugasan saintifik sebanyak 90%.

Masalah dengan RAG standard adalah persamaan semantik. Satu cebisan tentang pelipatan protein mungkin kelihatan serupa dengan pertanyaan tentang CRISPR. Namun, persamaan tidak bermakna relevan.

Pasukan Jepun tersebut menggunakan hubungan entiti dan bukannya sekadar cebisan teks. Mereka mengekstrak:

Entiti seperti protein atau penyelidik
Hubungan seperti menghalang (inhibits) atau memetik (cites)
Atribut seperti skor keyakinan

Mereka menggunakan proses dua peringkat. Pertama, mereka mengenal pasti subgraf yang relevan. Kedua, mereka mengambil teks yang berpaksikan entiti tersebut. Ini menghentikan hanyutan semantik (semantic drift). Anda mengambil konteks, bukan sekadar perkataan yang serupa.

GraphRAG lebih sukar untuk dibina berbanding RAG standard. Anda memerlukan:

Saluran (pipeline) pengekstrakan entiti
Klasifikasi hubungan
Infrastruktur storan graf
Enjin pertanyaan hibrid

Risiko terbesar adalah penyelenggaraan. Graf akan menjadi lapuk jika anda tidak mengemas kininya. Saya mempelajari perkara ini dengan cara yang sukar pada tahun 2023. Saya membina sistem RAG perundangan dengan ketepatan yang tinggi. Namun, saya gagal membina mekanisme kemas kini. Enam bulan kemudian, data tersebut menjadi usang. Ketepatan merosot daripada 94% kepada 71%.

Cara membina dengan betul:

Mulakan dengan taksonomi entiti. Pilih 20 hingga 30 jenis yang penting.
Gunakan capaian hibrid (hybrid retrieval) dari hari pertama. Gunakan graf untuk hubungan dan vektor untuk topik.
Bina saluran penyelenggaraan anda terlebih dahulu. Rancang bagaimana dokumen baharu mengemas kini graf tersebut.
Ukur rantaian penaakulan (reasoning chains). Jejaki berapa banyak langkah yang diambil oleh sistem untuk menjawab.

Jika anda bekerja dalam bidang sains, undang-undang, atau perubatan, kos penyelenggaraan tersebut berbaloi. Untuk FAQ yang ringkas, RAG standard sudah mencukupi.

Tanya diri anda perkara ini: Berapa peratuskah pertanyaan anda yang bertanya tentang hubungan? Jika lebih daripada 40% pengguna anda bertanya tentang bagaimana sesuatu perkara berkaitan, anda memerlukan graf.

Sumber: https://dev.to/xu_xu_b2179aa8fc958d531d1/how-japans-research-labs-are-building-rag-systems-that-actually-work-and-what-western-teams-keep-21b2

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi

Bagaimana Makmal Jepun Membina Sistem RAG yang Lebih Baik

Continue reading

Membina AI yang Lebih Baik dengan RAG

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

𝗞𝗻𝗼𝘄𝗹𝗲𝗱𝗴𝗲 𝗚𝗿𝗮𝗽𝗵𝘀: 𝗧𝗵𝗲 𝗠𝗶𝘀𝘀𝗶𝗻𝗴 𝗣𝗶𝗲𝗰𝗲 𝗶𝗻 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗲𝘀

Phase 1: Document Ingestion