𝗔𝗜/𝗠𝗟 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗗𝗶𝗴𝗲𝘀𝘁 — 𝟮𝟬 𝗷𝘂𝗻𝗶 𝟮𝟬𝟮𝟲

Nieuw onderzoek laat zien hoe agents dingen onthouden en hoe modellen code efficiënter verwerken.

Geheugen en status voor agents

Agents moeten de wereld om hen heen kunnen onthouden.

• Linear-temporal attention bouwt een lopend wereldmodel op. Dit voorkomt dat agents telkens alles opnieuw moeten berekenen. • Associatieve grafiekgeheugens slaan observaties op als gekoppelde knooppunten. Dit helpt agents om informatie na lange periodes te herinneren. • Deze methoden pakken het probleem aan om gedrag stabiel te houden wanneer inputstromen stoppen en weer beginnen.

Betere Reinforcement Learning

• Credit assignment op stappenniveau geeft agents duidelijke signalen. Het laat zien welke specifieke acties tot een beloning hebben geleid. • Quality-aware self-distillation helpt kleine modellen om fijne details te behouden. Dit verbetert het redeneervermogen zonder dat er meer trainingsdata nodig is.

Efficiëntie in Diffusion en tokens

• Adaptieve tokencompressie verwijdert nutteloze delen van een afbeelding. Dit verlaagt de kosten terwijl de kwaliteit hoog blijft. • Frequency-aware spectral forcing gebruikt minder parameters om hetzelfde detailniveau te bereiken. • FastContext gebruikt een kleine sub-agent om bestandspaden te vinden. Dit vermindert het tokengebruik met 60% en verbetert het succes bij programmeertaken. • Visual repository maps zetten code om in afbeeldingen. Dit vermindert het tokengebruik met 26% voor langdurige programmeertaken.

Code- en modelstabiliteit

• Huidige modellen hebben moeite met talen die geen Python zijn. De prestaties dalen met 40% bij sommige talen. • Nieuwe 4-bit pretraining-methoden gebruiken een uniform raster om fouten te voorkomen. Dit maakt grote modellen betrouwbaarder.

Veiligheid en risico's

• Sparse autoencoders zijn onstabiel. Kenmerken veranderen op basis van random seeds. • Gerichte aanpassingen aan AI-neuronen mislukken vaak omdat schadelijk gedrag opnieuw naar boven komt. • AI-reviewers zijn gemakkelijk te misleiden. Het veranderen van de lay-out van een paper kan een geautomatiseerde reviewer misleiden, zelfs als de inhoud hetzelfde blijft.

Bron: https://dev.to/olaughter/aiml-research-digest-jun-20-2026-4neg

Optionele leercommunity: https://t.me/GyaanSetuAi