Menaklukkan Dokumen Panjang dengan LLM

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial3 minggu yang lalu1min read

Menaklukkan Dokumen Panjang dengan LLM

Saya membangun sebuah sistem untuk menjawab pertanyaan dari PDF teknis setebal 100 halaman.

Skrip sederhana gagal. Saya bergelut dengan batasan token dan biaya tinggi selama berminggu-minggu.

Percobaan pertama saya menggunakan GPT-4 dengan teks lengkap. Ini berhasil untuk 10 halaman. Pada 100 halaman, saya mencapai batas token. Model tersebut melupakan detail di bagian tengah. Biayanya terlalu tinggi.

Saya mencoba metode-metode ini:

Chunking dasar: Model memilih bagian yang salah. Ia kehilangan konteks.
Map-reduce: Saya kehilangan detail spesifik.
Sliding windows: Ini terlalu lambat dan mahal.

Saya meniru cara manusia membaca. Kita memindai daftar isi. Kemudian kita membaca bagian tertentu.

Berikut adalah alur kerja barunya:

Buat hierarki. Gunakan LLM untuk membuat ringkasan singkat untuk

Menaklukkan Dokumen Panjang dengan LLM

Continue reading

Membangun Chatbot AI Internal: Pelajaran yang Didapat

𝗧𝗮𝗺𝗶𝗻𝗴 𝗟𝗼𝗻𝗴 𝗗𝗼𝗰𝘂𝗺𝗲𝗻𝘁 𝗔𝗻𝗮𝗹𝘆𝘀𝗶𝘀 𝘄𝗶𝘁𝗵 𝗟𝗟𝗠𝘀

𝗧𝗼𝘄𝗮𝗿𝗱𝘀 𝗘𝗳𝗳𝗶𝗰𝗶𝗲𝗻𝘁 𝗟𝗟𝗠 𝗦𝗲𝗿𝘃𝗶𝗻𝗴

Saya Menghabiskan $500 untuk Infrastruktur RAG Sebelum Memperbaiki 7 Kesalahan Ini

𝗜 𝗦𝗽𝗲𝗻𝘁 \$𝟱𝟬𝟬 𝗼𝗻 𝗥𝗔𝗚 𝗜𝗻𝗳𝗿𝗮𝘀𝘁𝗿𝘂𝗰𝘁𝘂𝗿𝗲 𝗕𝗲𝗳𝗼𝗿𝗲 𝗠𝗮𝗸𝗶𝗻𝗴 𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀