Masa Depan Sistem Memori AI Agentic
Memori AI sedang berubah.
Selama bertahun-tahun, memori bermaksud memasukkan sejarah sembang ke dalam tetingkap konteks. Pendekatan itu sudah tidak relevan lagi. Pada tahun 2026, memori merupakan bahagian teras dalam reka bentuk ejen. Ia mempunyai penyelidikan, penanda aras, dan risiko keselamatan tersendiri.
Jika anda membina ejen, memori menentukan sama ada alat anda berguna selepas sesi pertama.
Cara lama adalah mudah tetapi gagal. Pembangun akan menyimpan mesej terkini dalam penimbal dan meringkaskan selebihnya. Ini berkesan untuk bot sembang. Namun, ia gagal untuk ejen yang menjalankan aliran kerja sebenar seperti semakan kod atau penyelidikan. Ejen-ejen tersebut perlu mengingati apa yang mereka lakukan semalam, bukan sekadar lima minit yang lalu.
Memori jangka panjang yang berkesan mempunyai tiga jenis:
- Memori episodik: Pengalaman dan hasil masa lalu yang khusus.
- Memori semantik: Fakta dan hubungan umum.
- Memori prosedur: Kemahiran yang dipelajari dan urutan tindakan yang boleh digunakan semula.
Kebanyakan sistem hari ini kekurangan memori prosedur. Ia memfokuskan kepada fakta melalui carian vektor. Namun, ejen hanya akan menjadi lebih baik dari semasa ke semasa jika ia menguasai memori prosedur.
Seni bina juga sedang terbahagi kepada dua kumpulan:
- Konteks perbualan: Mengekalkan koheren dalam satu interaksi tunggal.
- Pengetahuan operasi: Menyimpan pengetahuan yang tahan lama merentasi banyak sesi.
Dalam sistem ini, anda mesti memilih antara keserupaan vektor dan pengambilan dipertingkat graf. Memori vektor mencari fakta yang serupa tetapi terlepas hubungan. Pendekatan graf mencari fakta melalui entiti dan sambungan. Sistem terbaik kini menggunakan pengambilan pelbagai isyarat. Ini menggabungkan keserupaan semantik, kata kunci, dan pautan entiti.
Model baharu seperti Letta melayan memori seperti sistem operasi. Ia menggunakan pendekatan bertingkat di mana memori teras bertindak seperti RAM. Ini lebih baik daripada sekadar menyambungkan pangkalan data kepada ejen.
Anda juga mesti berwaspada terhadap ancaman keselamatan baharu: Keracunan Memori (Memory Poisoning).
Suntikan prom (prompt injection) akan ditetapkan semula apabila sembang berakhir. Keracunan memori tidak. Penyerang boleh menanam data buruk dalam storan jangka panjang ejen sekali sahaja. Ia kemudian merosakkan setiap interaksi pada masa hadapan. Ini boleh berlaku beberapa hari kemudian. OWASP kini menyenaraikan Keracunan Memori dan Konteks sebagai risiko utama.
Untuk mempertahankan sistem anda, gunakan empat lapisan ini:
- Bersihkan data sebelum pengambilan.
- Sertakan asal-usul pada setiap entri untuk menjejaki sumbernya.
- Gunakan pemberat sedar-kepercayaan semasa pengambilan.
- Pantau hanyutan tingkah laku.
Melihat ke hadapan, tiga trend akan mencorakkan bidang ini:
- Memori pelbagai ejen: Ejen perlu berkongsi dan mempercayai memori satu sama lain.
- Penstandardan: Kita akan melihat protokol tentang cara ejen menerangkan apa yang mereka tahu.
- Pemangkasan: Sistem yang baik akan memutuskan apa yang perlu dilupakan. Memori tanpa had mewujudkan hingar dan kos yang tinggi.
Memori bukan lagi sekadar penyelesaian sementara untuk tetingkap konteks yang kecil. Ia adalah perkara yang membezakan antara demo dengan sistem sebenar. Anggap memori sebagai seni bina teras, bukan sekadar perkara sampingan.
Source: https://dev.to/xenocoregiger31/the-future-of-agentic-ai-memory-systems-5fdp
Optional learning community: https://t.me/GyaanSetuAi
