𝗔𝗜/𝗠𝗟 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗗𝗶𝗴𝗲𝘀𝘁 — 𝗝𝘂𝗻 𝟮𝟬, 𝟮𝟬𝟮𝟲

پژوهش‌های جدید نشان می‌دهند که عامل‌ها (agents) چگونه چیزها را به خاطر می‌سپارند و مدل‌ها چگونه کدها را با کارایی بیشتری پردازش می‌کنند.

حافظه و وضعیت برای عامل‌ها (Agents)

عامل‌ها نیاز دارند دنیای اطراف خود را به خاطر بسپارند.

• توجه خطی-زمانی (Linear-temporal attention) یک مدل دنیای در حال اجرا می‌سازد. این کار مانع از آن می‌شود که عامل‌ها هر بار همه چیز را دوباره محاسبه کنند. • حافظه‌های گراف انجمنی (Associative graph memories) مشاهدات را به صورت گره‌های متصل ذخیره می‌کنند. این امر به عامل‌ها کمک می‌کند تا اطلاعات را پس از وقفه‌های طولانی بازیابی کنند. • این روش‌ها مشکل حفظ ثبات رفتار را در زمان قطع و وصل شدن جریان‌های ورودی برطرف می‌کنند.

یادگیری تقویتی بهتر

• تخصیص اعتبار در سطح گام (Step-level credit assignment) سیگنال‌های واضحی به عامل‌ها می‌دهد. این کار نشان می‌دهد که کدام اقدامات خاص منجر به پاداش شده‌اند. • خود-تقطیر با آگاهی از کیفیت (Quality-aware self-distillation) به مدل‌های کوچک کمک می‌کند تا جزئیات دقیق را حفظ کنند. این کار استدلال را بدون نیاز به داده‌های آموزشی بیشتر بهبود می‌بخشد.

کارایی در Diffusion و توکن‌ها

• فشرده‌سازی تطبیقی توکن (Adaptive token compression) بخش‌های بی‌فایده تصویر را حذف می‌کند. این کار هزینه‌ها را کاهش داده و در عین حال کیفیت را بالا نگه می‌دارد. • اعمال طیفی با آگاهی از فرکانس (Frequency-aware spectral forcing) از پارامترهای کمتری برای رسیدن به همان سطح از جزئیات استفاده می‌کند. • FastContext از یک زیر-عامل (sub-agent) کوچک برای یافتن مسیر فایل‌ها استفاده می‌کند. این کار مصرف توکن را تا ۶۰٪ کاهش داده و موفقیت در وظایف کدنویسی را بهبود می‌بخشد. • نقشه‌های بصری مخزن (Visual repository maps) کد را به تصویر تبدیل می‌کنند. این کار مصرف توکن را در وظایف کدنویسی طولانی تا ۲۶٪ کاهش می‌دهد.

پایداری کد و مدل

• مدل‌های فعلی با زبان‌های غیر از پایتون مشکل دارند. عملکرد در برخی زبان‌ها تا ۴۰٪ کاهش می‌یابد. • روش‌های جدید پیش‌آموزش ۴-بیتی از یک شبکه یکنواخت برای جلوگیری از خطاها استفاده می‌کنند. این کار مدل‌های بزرگ را قابل‌اعتمادتر می‌کند.

ایمنی و ریسک‌ها

• خودرمزگذار‌های پراکنده (Sparse autoencoders) ناپایدار هستند. ویژگی‌ها بر اساس دانه‌های تصادفی (random seeds) تغییر می‌کنند. • اصلاحات هدفمند در نورون‌های هوش مصنوعی اغلب شکست می‌خورند، زیرا رفتارهای مضر دوباره ظاهر می‌شوند. • فریب دادن بازبین‌های هوش مصنوعی آسان است. تغییر در ظاهر یک مقاله می‌تواند یک بازبین خودکار را فریب دهد، حتی اگر محتوا ثابت بماند.

Source: https://dev.to/olaughter/aiml-research-digest-jun-20-2026-4neg

Optional learning community: https://t.me/GyaanSetuAi