برترین مقالات هوش مصنوعی در Hugging Face
رقابت در حوزه هوش مصنوعی از صرفاً بزرگتر کردن مدلها فراتر رفته است. امروزه تمرکز بر نحوه سرویسدهی، حافظه و ارزیابی آنهاست.
در اینجا ۱۰ مورد از مهمترین مقالات هوش مصنوعی در Hugging Face در حال حاضر آورده شده است:
Program-as-Weights بسیاری از وظایف را میتوان به راحتی با زبان انگلیسی ساده توصیف کرد، اما نوشتن کد برای آنها دشوار است. این روش به جای استفاده مکرر از پرامپت برای یک مدل بزرگ، از یک مدل بزرگ برای کامپایل کردن زبان طبیعی به وزنهای عصبی کوچک استفاده میکند. شما این وزنهای بسیار کوچک را با یک مدل سبک اجرا میکنید. این کار برای وظایفی مانند نظارت بر محتوا یا فیلتر کردن ایمیل، ارزانتر و سریعتر است.
AgenticSTS عاملهای (Agents) بلندمدت اغلب به دلیل بینظم بودن حافظهشان شکست میخورند. این مقاله پیشنهاد میکند که به جای ریختنِ صرفِ تاریخچه چتهای خام، از لایههای حافظه ساختاریافته استفاده شود. این کار به عاملها کمک میکند تا وظایف پیچیدهای مانند بازیهای استراتژیک یا پروژههای تحقیقاتی طولانی را مدیریت کنند.
PerceptionRubrics بنچمارکهای چندوجهی (multimodal) فعلی اغلب امتیازات بالایی نشان میدهند، اما عملکرد آنها در دنیای واقعی ضعیف است. این چارچوب از معیارهای (rubrics) دقیق برای امتیازدهی به نحوه درک مدلها از جهان استفاده میکند. این کار به توسعهدهندگان کمک میکند تا اشتباهات ساده در دستیارهای بصری و ابزارهای OCR را برطرف کنند.
EvoPolicyGym عاملها چگونه میتوانند بدون حدس و گمان، خود را بهبود ببخشند؟ این مقاله بررسی میکند که آیا عاملها میتوانند بازخوردها را بخوانند و رفتار خود را بهروزرسانی کنند یا خیر. این موضوع برای رباتیک و جریانهای کاری خودکار (automated workflows) مفید است.
FlashMorph مکانیزم توجه کامل (Full attention) در ترنسفورمرها برای اسناد طولانی هزینهبر است. FlashMorph با انتخاب لایههایی که به توجه کامل نیاز دارند و لایههایی که میتوانند از توجه خطی (linear attention) ارزانتر استفاده کنند، بهترین تعادل را برقرار میکند. این روش برای دستیارهای حقوقی یا برنامهنویسی ایدهآل است.
TurboServe تولید ویدیو بسیار دشوارتر از تولید متن است، زیرا به منابع عظیم GPU نیاز دارد. TurboServe با بهینهسازی نحوه حرکت قطعات داده در سیستم، استریم ویدیو را مدیریت میکند. این امر برای پلتفرمهای متن-به-ویدیو در مقیاس بزرگ حیاتی است.
ELDR در مدلهای مخلوط متخصصان (Mixture-of-Experts یا MoE)، جابجایی دادهها بین متخصصان باعث ایجاد گلوگاه (bottleneck) میشود. ELDR پیشبینی میکند که یک درخواست به کدام متخصص نیاز دارد و آن را هوشمندانه مسیریابی میکند. این کار تأخیر (latency) را در استنتاج (inference) مدلهای زبانی بزرگ (LLM) در مقیاس وسیع کاهش میدهد.
Asymmetric Mutual Variational Learning مدلهای چندوجهی گاهی اوقات با دیدن پاسخ در فضای نهفته (latent space) خود در طول آموزش، «تقلب» میکنند. این روش استدلال را پایدار میکند تا مدلها در استفاده در دنیای واقعی دقیق باقی بمانند. این روش برای تصویربرداری پزشکی بسیار عالی است.
Seed2.0 اکثر مدلها در بنچمارکها عالی عمل میکنند اما در پیچیدگیهای دنیای واقعی شکست میخورند. Seed2.0 بر استدلال، درک تصویر و جستجو در محیطهای نامنظم و واقعی تمرکز دارد.
MemSyco-Bench حافظه میتواند باعث شود یک عامل «چاپلوس» (sycophantic) شود، به این معنی که فقط برای مفید بودن با شما موافقت کند، حتی اگر اشتباه باشید. این مقاله اندازهگیری میکند که حافظه چگونه میتواند در استدلال یک عامل سوگیری (bias) ایجاد کند. این موضوع برای ساخت همراهان هوش مصنوعی صادق، حیاتی است.
نکته اصلی: معماری سیستم، طراحی حافظه و هزینههای استقرار اکنون به اندازه خود مدلها اهمیت دارند.
منبع: https://dev.to/y_hnhnhan_2f26de65ffcc4/top-ai-papers-on-hugging-face-2026-07-03-2mpn
انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi
