𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗗𝗼𝗲𝘀𝗻'𝘁 𝗥𝗲𝗺𝗲𝗺𝗯𝗲𝗿. 𝗬𝗼𝘂 𝗗𝗼.

Translated for your language. Read the original.

AI-assisted draft.

kemarin dulu1min read

Model Tidak Mengingat. Anda yang Mengingat.

Large Language Models (LLM) tidak memiliki memori.

Dulu saya mengira setiap sesi obrolan menyimpan konteksnya sendiri. Saya salah. Saat Anda berbicara dengan LLM, ia tidak mengingat pertanyaan terakhir Anda kecuali Anda mengirimkannya kembali.

Model ini bersifat stateless. Ini berarti setiap permintaan adalah awal yang baru.

Untuk membuat percakapan, Anda harus mengelola riwayatnya sendiri. Anda melakukannya dengan mengirimkan sebuah array berisi semua pesan sebelumnya pada setiap permintaan baru.

"Memori" hanyalah sebuah daftar pesan:

User: Halo.
Assistant: Hai!
User: Apa kabar?

Jika Anda tidak menyertakan dua baris pertama dalam permintaan berikutnya, model tidak akan tahu bahwa Anda sudah menyapa.

Saya mempelajari hal ini dengan menghindari SDK. Sebagian besar pengembang menggunakan alat seperti Anthropic SDK untuk menyembunyikan kompleksitas ini. SDK menangani riwayat pesan dan header untuk Anda.

Jika Anda ingin mempelajari cara kerja LLM, gunakan fetch mentah sebagai gantinya. Jangan gunakan abstraksi. Saat Anda mengelola siklus permintaan dan respons secara manual, Anda dapat melihat setiap keputusan yang diambil.

Kontrol manual ini memungkinkan Anda untuk membangun strategi tingkat lanjut nantinya, seperti:

Sliding windows untuk mengelola obrolan panjang.
Retrieval Augmented Generation (RAG).
Pencarian semantik (semantic search).

Memahami array ini adalah fondasi dari pengembangan AI. Andalah yang menyediakan konteksnya. Model hanya mengetahui apa yang Anda kirimkan.

Sumber: https://dev.to/marcochavezco/the-model-doesnt-remember-you-do-3mmk

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗗𝗼𝗲𝘀𝗻'𝘁 𝗥𝗲𝗺𝗲𝗺𝗯𝗲𝗿. 𝗬𝗼𝘂 𝗗𝗼.

Continue reading

Mengapa Karakter AI Melupakan Identitas Mereka

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗗𝗼𝗻'𝘁 𝗡𝗲𝗲𝗱 𝗠𝗼𝗿𝗲 𝗠𝗲𝗺𝗼𝗿𝘆. 𝗧𝗵𝗲𝘆 𝗡𝗲𝗲𝗱 𝗚𝗼𝘃𝗲𝗿𝗻𝗲𝗱 𝗥𝗲𝗰𝗮𝗹𝗹.

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗗𝗼𝗲𝘀𝗻'𝘁 𝗥𝗲𝗺𝗲𝗺𝗯𝗲𝗿. 𝗬𝗼𝘂 𝗗𝗼.

𝗧𝗵𝗲 𝗠𝗼𝗱𝗲𝗹 𝗗𝗼𝗲𝘀𝗻'𝘁 𝗥𝗲𝗺𝗲𝗺𝗯𝗲𝗿. 𝗬𝗼𝘂 𝗗𝗼.

LLM untuk Pemahaman Bahasa