Ringkasan Riset AI/ML — 20 Jun 2026
Riset baru menunjukkan bagaimana agen mengingat sesuatu dan bagaimana model memproses kode dengan lebih efisien.
Memori dan Keadaan (State) untuk Agen
Agen perlu mengingat dunia di sekitar mereka.
• Linear-temporal attention membangun model dunia yang berjalan. Ini mencegah agen menghitung ulang segalanya setiap saat. • Memori graf asosiatif menyimpan observasi sebagai simpul (node) yang saling terhubung. Ini membantu agen mengingat kembali informasi setelah jeda yang lama. • Metode-metode ini mengatasi masalah dalam menjaga stabilitas perilaku saat aliran input berhenti dan dimulai kembali.
Reinforcement Learning yang Lebih Baik
• Step-level credit assignment memberikan sinyal yang jelas kepada agen. Ini menunjukkan tindakan spesifik mana yang menghasilkan imbalan (reward). • Quality-aware self-distillation membantu model kecil mempertahankan detail halus. Ini meningkatkan penalaran tanpa memerlukan lebih banyak data pelatihan.
Efisiensi dalam Difusi dan Token
• Kompresi token adaptif menghapus bagian gambar yang tidak berguna. Ini memangkas biaya sambil tetap menjaga kualitas tetap tinggi. • Frequency-aware spectral forcing menggunakan lebih sedikit parameter untuk mencapai tingkat detail yang sama. • FastContext menggunakan sub-agen kecil untuk menemukan jalur file. Ini memangkas penggunaan token sebesar 60% dan meningkatkan keberhasilan dalam tugas pengodean. • Peta repositori visual mengubah kode menjadi gambar. Ini mengurangi penggunaan token sebesar 26% untuk tugas pengodean yang panjang.
Stabilitas Kode dan Model
• Model saat ini kesulitan dengan bahasa non-Python. Performa turun sebesar 40% pada beberapa bahasa. • Metode pra-pelatihan (pretraining) 4-bit baru menggunakan kisi (grid) seragam untuk mencegah kesalahan. Ini membuat model besar menjadi lebih andal.
Keamanan dan Risiko
• Sparse autoencoders tidak stabil. Fitur berubah berdasarkan random seed. • Perbaikan terarah pada neuron AI sering kali gagal karena perilaku berbahaya muncul kembali. • Peninjau AI mudah dikelabui. Mengubah tampilan sebuah makalah dapat menipu peninjau otomatis meskipun kontennya tetap sama.
Sumber: https://dev.to/olaughter/aiml-research-digest-jun-20-2026-4neg
Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi