𝗔𝗴𝗲𝗻 𝗔𝗜 𝗧𝗶𝗱𝗮𝗸 𝗠𝗲𝗺𝗯𝘂𝘁𝘂𝗵𝗸𝗮𝗻 𝗟𝗲𝗯𝗶𝗵 𝗕𝗮𝗻𝘆𝗮𝗸 𝗠𝗲𝗺𝗼𝗿𝗶. 𝗠𝗲𝗿𝗲𝗸𝗮 𝗠𝗲𝗺𝗯𝘂𝘁𝘂𝗵𝗸𝗮𝗻 𝗥𝗲𝗰𝗮𝗹𝗹 𝘆𝗮𝗻𝗴 𝗧𝗲𝗿𝗸𝗲𝗹𝗼𝗹𝗮.
Kebanyakan orang berpikir agen AI membutuhkan lebih banyak memori agar dapat bekerja lebih baik. Mereka menyarankan riwayat obrolan yang lebih banyak. Mereka menyarankan jendela konteks (context window) yang lebih besar. Mereka menyarankan penyimpanan vektor yang lebih banyak.
Namun, memori yang lebih besar sering kali membuat agen menjadi kurang andal. Agen mulai menggunakan asumsi yang usang. Ia memperlakukan konteks lama sebagai fakta saat ini. Ia mencampuradukkan preferensi pengguna dengan bukti nyata.
Masalahnya bukan pada seberapa banyak yang diingat oleh agen. Masalahnya adalah memutuskan apa yang diizinkan untuk diingat kembali (recall) oleh agen.
Ini adalah masalah rekayasa sistem, bukan masalah kecerdasan.
Retrieval bukanlah tata kelola (governance). Sistem retrieval menemukan informasi yang terlihat mirip dengan kueri. Sistem recall yang terkelola memutuskan apakah informasi tersebut aman untuk digunakan.
Kebijakan recall yang baik mengajukan pertanyaan-pertanyaan ini:
- Apakah informasi ini masih baru?
- Siapa yang diizinkan melihat ini?
- Apakah bukti yang lebih baru menggantikan data lama ini?
- Apa sumber dari informasi ini?
Tidak semua memori memiliki otoritas yang sama. Hasil dari sebuah tool adalah fakta. Ringkasan model adalah sebuah asumsi. Preferensi pengguna adalah sebuah panduan.
Jika Anda memasukkan semua ini ke dalam prompt sebagai fakta yang setara, agen tersebut akan gagal. Sistem harus membedakan antara bukti dan klaim. Bukti saat runtime harus selalu mengalahkan asumsi model.
Memori juga membutuhkan cakupan (scope) dan asal-usul (provenance). Seorang agen tidak seharusnya melihat setiap potongan data di perusahaan Anda. Memori membutuhkan batasan berdasarkan peran, tugas, dan izin. Anda juga perlu mengetahui dari mana memori tersebut berasal. Komentar manusia memiliki bobot yang lebih besar daripada tebakan model.
Berhentilah mencoba memberi agen otak yang lebih besar. Mulailah membangun aturan yang lebih baik tentang apa yang dapat mereka ingat kembali. Runtime harus mengkurasi konteks sebelum mencapai model.
Pertanyaan sebenarnya bukanlah seberapa banyak yang dapat diingat oleh agen. Pertanyaan sebenarnya adalah apakah Anda dapat mempercayai apa yang diingat kembali oleh agen tersebut.
Sumber: https://dev.to/glendel/ai-agents-dont-need-more-memory-they-need-governed-recall-3p73
Komunitas belajar opsional: https://t.me/GyaanSetuAi