Ringkasan Penyelidikan AI/ML — 20 Jun 2026
Penyelidikan baharu menunjukkan bagaimana ejen mengingati sesuatu dan bagaimana model memproses kod dengan lebih cekap.
Memori dan Keadaan untuk Ejen
Ejen perlu mengingati dunia di sekeliling mereka.
• Perhatian linear-temporal membina model dunia yang sedang berjalan. Ini menghalang ejen daripada mengira semula segalanya setiap masa. • Memori graf berasosiasi menyimpan pemerhatian sebagai nod yang saling berkaitan. Ini membantu ejen mengingat kembali maklumat selepas tempoh masa yang lama. • Kaedah-kaedah ini menangani masalah mengekalkan tingkah laku yang stabil apabila aliran input terhenti dan bermula semula.
Pembelajaran Pengukuhan yang Lebih Baik
• Pemberian kredit tahap-langkah memberikan isyarat yang jelas kepada ejen. Ia menunjukkan tindakan khusus mana yang membawa kepada ganjaran. • Penyulingan kendiri sedar-kualiti membantu model kecil mengekalkan perincian halus. Ini meningkatkan penaakulan tanpa memerlukan lebih banyak data latihan.
Kecekapan dalam Difusi dan Token
• Pemampatan token adaptif membuang bahagian imej yang tidak berguna. Ini mengurangkan kos sambil mengekalkan kualiti yang tinggi. • Paksaan spektral sedar-frekuensi menggunakan parameter yang lebih sedikit untuk mencapai tahap perincian yang sama. • FastContext menggunakan sub-ejen kecil untuk mencari laluan fail. Ini mengurangkan penggunaan token sebanyak 60% dan meningkatkan kejayaan dalam tugas pengekodan. • Peta repositori visual menukarkan kod kepada imej. Ini mengurangkan penggunaan token sebanyak 26% untuk tugas kod yang panjang.
Kestabilan Kod dan Model
• Model semasa bergelut dengan bahasa bukan Python. Prestasi merosot sebanyak 40% pada sesetengah bahasa. • Kaedah pra-latihan 4-bit baharu menggunakan grid seragam untuk menghentikan ralat. Ini menjadikan model besar lebih boleh dipercayai.
Keselamatan dan Risiko
• Autoenkoder jarang (sparse autoencoders) adalah tidak stabil. Ciri-ciri berubah berdasarkan benih rawak (random seeds). • Pembaikan bersasaran pada neuron AI sering gagal kerana tingkah laku berbahaya muncul semula. • Penilai AI mudah ditipu. Mengubah rupa bentuk kertas kerja boleh memperdaya penilai automatik walaupun kandungannya kekal sama.
Sumber: https://dev.to/olaughter/aiml-research-digest-jun-20-2026-4neg
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi