Ringkasan Riset AI/ML — 20 Jun 2026

Riset baru menunjukkan bagaimana agen mengingat sesuatu dan bagaimana model memproses kode dengan lebih efisien.

Memori dan Keadaan (State) untuk Agen

Agen perlu mengingat dunia di sekitar mereka.

Linear-temporal attention membangun model dunia yang berjalan. Ini mencegah agen menghitung ulang segalanya setiap saat. • Memori graf asosiatif menyimpan observasi sebagai simpul (node) yang saling terhubung. Ini membantu agen mengingat kembali informasi setelah jeda yang lama. • Metode-metode ini mengatasi masalah dalam menjaga stabilitas perilaku saat aliran input berhenti dan dimulai kembali.

Reinforcement Learning yang Lebih Baik

Step-level credit assignment memberikan sinyal yang jelas kepada agen. Ini menunjukkan tindakan spesifik mana yang menghasilkan imbalan (reward). • Quality-aware self-distillation membantu model kecil mempertahankan detail halus. Ini meningkatkan penalaran tanpa memerlukan lebih banyak data pelatihan.

Efisiensi dalam Difusi dan Token

• Kompresi token adaptif menghapus bagian gambar yang tidak berguna. Ini memangkas biaya sambil tetap menjaga kualitas tetap tinggi. • Frequency-aware spectral forcing menggunakan lebih sedikit parameter untuk mencapai tingkat detail yang sama. • FastContext menggunakan sub-agen kecil untuk menemukan jalur file. Ini memangkas penggunaan token sebesar 60% dan meningkatkan keberhasilan dalam tugas pengodean. • Peta repositori visual mengubah kode menjadi gambar. Ini mengurangi penggunaan token sebesar 26% untuk tugas pengodean yang panjang.

Stabilitas Kode dan Model

• Model saat ini kesulitan dengan bahasa non-Python. Performa turun sebesar 40% pada beberapa bahasa. • Metode pra-pelatihan (pretraining) 4-bit baru menggunakan kisi (grid) seragam untuk mencegah kesalahan. Ini membuat model besar menjadi lebih andal.

Keamanan dan Risiko

Sparse autoencoders tidak stabil. Fitur berubah berdasarkan random seed. • Perbaikan terarah pada neuron AI sering kali gagal karena perilaku berbahaya muncul kembali. • Peninjau AI mudah dikelabui. Mengubah tampilan sebuah makalah dapat menipu peninjau otomatis meskipun kontennya tetap sama.

Sumber: https://dev.to/olaughter/aiml-research-digest-jun-20-2026-4neg

Komunitas pembelajaran opsional: https://t.me/GyaanSetuAi