𝗔𝗜/𝗠𝗟 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗗𝗶𝗴𝗲𝘀𝘁 — 𝗝𝘂𝗻 𝟮𝟬, 𝟮𝟬𝟮𝟲

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial5 jam yang lalu1min read

Ringkasan Riset AI/ML — 20 Jun 2026

Riset baru menunjukkan bagaimana agen mengingat sesuatu dan bagaimana model memproses kode dengan lebih efisien.

Memori dan Keadaan (State) untuk Agen

Agen perlu mengingat dunia di sekitar mereka.

• Linear-temporal attention membangun model dunia yang berjalan. Ini mencegah agen menghitung ulang segalanya setiap saat. • Memori graf asosiatif menyimpan observasi sebagai simpul (node) yang saling terhubung. Ini membantu agen mengingat kembali informasi setelah jeda yang lama. • Metode-metode ini mengatasi masalah dalam menjaga stabilitas perilaku saat aliran input berhenti dan dimulai kembali.

Reinforcement Learning yang Lebih Baik

• Step-level credit assignment memberikan sinyal yang jelas kepada agen. Ini menunjukkan tindakan spesifik mana yang menghasilkan imbalan (reward). • Quality-aware self-distillation membantu model kecil mempertahankan detail halus. Ini meningkatkan penalaran tanpa memerlukan lebih banyak data pelatihan.

Efisiensi dalam Difusi dan Token

• Kompresi token adaptif menghapus bagian gambar yang tidak berguna. Ini memangkas biaya sambil tetap menjaga kualitas tetap tinggi. • Frequency-aware spectral forcing menggunakan lebih sedikit parameter untuk mencapai tingkat detail yang sama. • FastContext menggunakan sub-agen kecil untuk menemukan jalur file. Ini memangkas penggunaan token sebesar 60% dan meningkatkan keberhasilan dalam tugas pengodean. • Peta repositori visual mengubah kode menjadi gambar. Ini mengurangi penggunaan token sebesar 26% untuk tugas pengodean yang panjang.

Stabilitas Kode dan Model

• Model saat ini kesulitan dengan bahasa non-Python. Performa turun sebesar 40% pada beberapa bahasa. • Metode pra-pelatihan (pretraining) 4-bit baru menggunakan kisi (grid) seragam untuk mencegah kesalahan. Ini membuat model besar menjadi lebih andal.

Keamanan dan Risiko

• Sparse autoencoders tidak stabil. Fitur berubah berdasarkan random seed. • Perbaikan terarah pada neuron AI sering kali gagal karena perilaku berbahaya muncul kembali. • Peninjau AI mudah dikelabui. Mengubah tampilan sebuah makalah dapat menipu peninjau otomatis meskipun kontennya tetap sama.

Sumber: https://dev.to/olaughter/aiml-research-digest-jun-20-2026-4neg

Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi

𝗔𝗜/𝗠𝗟 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗗𝗶𝗴𝗲𝘀𝘁 — 𝗝𝘂𝗻 𝟮𝟬, 𝟮𝟬𝟮𝟲

Continue reading

Model Dunia dan Agen AI di 2026

Menambahkan Memori ke Agen

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗗𝗼𝗻'𝘁 𝗡𝗲𝗲𝗱 𝗠𝗼𝗿𝗲 𝗠𝗲𝗺𝗼𝗿𝘆. 𝗧𝗵𝗲𝘆 𝗡𝗲𝗲𝗱 𝗚𝗼𝘃𝗲𝗿𝗻𝗲𝗱 𝗥𝗲𝗰𝗮𝗹𝗹.

𝗥𝗡𝗡𝗦, 𝗧𝗿𝗮𝗻𝘀𝗳𝗼𝗿𝗺𝗲𝗿𝘀, 𝗮𝗻𝗱 𝗦𝘁𝗮𝘁𝗲 𝗦𝗽𝗮𝗰𝗲 𝗠𝗼𝗱𝗲𝗹𝘀

Memberikan Memori Permanen kepada Agen AI