𝗔𝗜/𝗠𝗟 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗗𝗶𝗴𝗲𝘀𝘁 — 𝗝𝘂𝗻 𝟮𝟬, 𝟮𝟬𝟮𝟲
پژوهشهای جدید نشان میدهند که عاملها (agents) چگونه چیزها را به خاطر میسپارند و مدلها چگونه کدها را با کارایی بیشتری پردازش میکنند.
حافظه و وضعیت برای عاملها (Agents)
عاملها نیاز دارند دنیای اطراف خود را به خاطر بسپارند.
• توجه خطی-زمانی (Linear-temporal attention) یک مدل دنیای در حال اجرا میسازد. این کار مانع از آن میشود که عاملها هر بار همه چیز را دوباره محاسبه کنند. • حافظههای گراف انجمنی (Associative graph memories) مشاهدات را به صورت گرههای متصل ذخیره میکنند. این امر به عاملها کمک میکند تا اطلاعات را پس از وقفههای طولانی بازیابی کنند. • این روشها مشکل حفظ ثبات رفتار را در زمان قطع و وصل شدن جریانهای ورودی برطرف میکنند.
یادگیری تقویتی بهتر
• تخصیص اعتبار در سطح گام (Step-level credit assignment) سیگنالهای واضحی به عاملها میدهد. این کار نشان میدهد که کدام اقدامات خاص منجر به پاداش شدهاند. • خود-تقطیر با آگاهی از کیفیت (Quality-aware self-distillation) به مدلهای کوچک کمک میکند تا جزئیات دقیق را حفظ کنند. این کار استدلال را بدون نیاز به دادههای آموزشی بیشتر بهبود میبخشد.
کارایی در Diffusion و توکنها
• فشردهسازی تطبیقی توکن (Adaptive token compression) بخشهای بیفایده تصویر را حذف میکند. این کار هزینهها را کاهش داده و در عین حال کیفیت را بالا نگه میدارد. • اعمال طیفی با آگاهی از فرکانس (Frequency-aware spectral forcing) از پارامترهای کمتری برای رسیدن به همان سطح از جزئیات استفاده میکند. • FastContext از یک زیر-عامل (sub-agent) کوچک برای یافتن مسیر فایلها استفاده میکند. این کار مصرف توکن را تا ۶۰٪ کاهش داده و موفقیت در وظایف کدنویسی را بهبود میبخشد. • نقشههای بصری مخزن (Visual repository maps) کد را به تصویر تبدیل میکنند. این کار مصرف توکن را در وظایف کدنویسی طولانی تا ۲۶٪ کاهش میدهد.
پایداری کد و مدل
• مدلهای فعلی با زبانهای غیر از پایتون مشکل دارند. عملکرد در برخی زبانها تا ۴۰٪ کاهش مییابد. • روشهای جدید پیشآموزش ۴-بیتی از یک شبکه یکنواخت برای جلوگیری از خطاها استفاده میکنند. این کار مدلهای بزرگ را قابلاعتمادتر میکند.
ایمنی و ریسکها
• خودرمزگذارهای پراکنده (Sparse autoencoders) ناپایدار هستند. ویژگیها بر اساس دانههای تصادفی (random seeds) تغییر میکنند. • اصلاحات هدفمند در نورونهای هوش مصنوعی اغلب شکست میخورند، زیرا رفتارهای مضر دوباره ظاهر میشوند. • فریب دادن بازبینهای هوش مصنوعی آسان است. تغییر در ظاهر یک مقاله میتواند یک بازبین خودکار را فریب دهد، حتی اگر محتوا ثابت بماند.
Source: https://dev.to/olaughter/aiml-research-digest-jun-20-2026-4neg
Optional learning community: https://t.me/GyaanSetuAi