برترین مقالات هوش مصنوعی در Hugging Face

رقابت در حوزه هوش مصنوعی از صرفاً بزرگ‌تر کردن مدل‌ها فراتر رفته است. امروزه تمرکز بر نحوه سرویس‌دهی، حافظه و ارزیابی آن‌هاست.

در اینجا ۱۰ مورد از مهم‌ترین مقالات هوش مصنوعی در Hugging Face در حال حاضر آورده شده است:

  1. Program-as-Weights بسیاری از وظایف را می‌توان به راحتی با زبان انگلیسی ساده توصیف کرد، اما نوشتن کد برای آن‌ها دشوار است. این روش به جای استفاده مکرر از پرامپت برای یک مدل بزرگ، از یک مدل بزرگ برای کامپایل کردن زبان طبیعی به وزن‌های عصبی کوچک استفاده می‌کند. شما این وزن‌های بسیار کوچک را با یک مدل سبک اجرا می‌کنید. این کار برای وظایفی مانند نظارت بر محتوا یا فیلتر کردن ایمیل، ارزان‌تر و سریع‌تر است.

  2. AgenticSTS عامل‌های (Agents) بلندمدت اغلب به دلیل بی‌نظم بودن حافظه‌شان شکست می‌خورند. این مقاله پیشنهاد می‌کند که به جای ریختنِ صرفِ تاریخچه چت‌های خام، از لایه‌های حافظه ساختاریافته استفاده شود. این کار به عامل‌ها کمک می‌کند تا وظایف پیچیده‌ای مانند بازی‌های استراتژیک یا پروژه‌های تحقیقاتی طولانی را مدیریت کنند.

  3. PerceptionRubrics بنچمارک‌های چندوجهی (multimodal) فعلی اغلب امتیازات بالایی نشان می‌دهند، اما عملکرد آن‌ها در دنیای واقعی ضعیف است. این چارچوب از معیارهای (rubrics) دقیق برای امتیازدهی به نحوه درک مدل‌ها از جهان استفاده می‌کند. این کار به توسعه‌دهندگان کمک می‌کند تا اشتباهات ساده در دستیارهای بصری و ابزارهای OCR را برطرف کنند.

  4. EvoPolicyGym عامل‌ها چگونه می‌توانند بدون حدس و گمان، خود را بهبود ببخشند؟ این مقاله بررسی می‌کند که آیا عامل‌ها می‌توانند بازخوردها را بخوانند و رفتار خود را به‌روزرسانی کنند یا خیر. این موضوع برای رباتیک و جریان‌های کاری خودکار (automated workflows) مفید است.

  5. FlashMorph مکانیزم توجه کامل (Full attention) در ترنسفورمرها برای اسناد طولانی هزینه‌بر است. FlashMorph با انتخاب لایه‌هایی که به توجه کامل نیاز دارند و لایه‌هایی که می‌توانند از توجه خطی (linear attention) ارزان‌تر استفاده کنند، بهترین تعادل را برقرار می‌کند. این روش برای دستیارهای حقوقی یا برنامه‌نویسی ایده‌آل است.

  6. TurboServe تولید ویدیو بسیار دشوارتر از تولید متن است، زیرا به منابع عظیم GPU نیاز دارد. TurboServe با بهینه‌سازی نحوه حرکت قطعات داده در سیستم، استریم ویدیو را مدیریت می‌کند. این امر برای پلتفرم‌های متن-به-ویدیو در مقیاس بزرگ حیاتی است.

  7. ELDR در مدل‌های مخلوط متخصصان (Mixture-of-Experts یا MoE)، جابجایی داده‌ها بین متخصصان باعث ایجاد گلوگاه (bottleneck) می‌شود. ELDR پیش‌بینی می‌کند که یک درخواست به کدام متخصص نیاز دارد و آن را هوشمندانه مسیریابی می‌کند. این کار تأخیر (latency) را در استنتاج (inference) مدل‌های زبانی بزرگ (LLM) در مقیاس وسیع کاهش می‌دهد.

  8. Asymmetric Mutual Variational Learning مدل‌های چندوجهی گاهی اوقات با دیدن پاسخ در فضای نهفته (latent space) خود در طول آموزش، «تقلب» می‌کنند. این روش استدلال را پایدار می‌کند تا مدل‌ها در استفاده در دنیای واقعی دقیق باقی بمانند. این روش برای تصویربرداری پزشکی بسیار عالی است.

  9. Seed2.0 اکثر مدل‌ها در بنچمارک‌ها عالی عمل می‌کنند اما در پیچیدگی‌های دنیای واقعی شکست می‌خورند. Seed2.0 بر استدلال، درک تصویر و جستجو در محیط‌های نامنظم و واقعی تمرکز دارد.

  10. MemSyco-Bench حافظه می‌تواند باعث شود یک عامل «چاپلوس» (sycophantic) شود، به این معنی که فقط برای مفید بودن با شما موافقت کند، حتی اگر اشتباه باشید. این مقاله اندازه‌گیری می‌کند که حافظه چگونه می‌تواند در استدلال یک عامل سوگیری (bias) ایجاد کند. این موضوع برای ساخت همراهان هوش مصنوعی صادق، حیاتی است.

نکته اصلی: معماری سیستم، طراحی حافظه و هزینه‌های استقرار اکنون به اندازه خود مدل‌ها اهمیت دارند.

منبع: https://dev.to/y_hnhnhan_2f26de65ffcc4/top-ai-papers-on-hugging-face-2026-07-03-2mpn

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi