Kertas Kerja AI Teratas di Hugging Face

AI sedang beralih daripada model yang menjawab soalan kepada sistem yang mengambil tindakan. Ia kini belajar untuk mengingati, menyesuaikan diri, dan mencipta berdasarkan konteks sebenar.

Berikut adalah 10 kertas kerja AI teratas daripada Hugging Face hari ini, yang dibahagikan kepada 4 bidang utama:

  1. Memori & Penaakulan Ejen

• MemoryData (Paper ID: 2606.24775) Kebanyakan ejen kekurangan memori jangka panjang. Kertas kerja ini menganggap memori sebagai masalah pengurusan data dan bukannya sekadar pangkalan data. Ia memperkenalkan rangka kerja untuk menilai bagaimana ejen menyimpan, mendapatkan semula, dan mengemas kini maklumat tanpa kehilangan ketepatan dari semasa ke semasa. Kes penggunaan: Chatbot peribadi dan pembantu penyelidikan jangka panjang.

• OPID (Paper ID: 2606.26790) Melatih ejen dengan pembelajaran pengukuhan adalah sukar kerana ganjaran jarang berlaku. OPID menggunakan tugasan yang telah selesai untuk mengekstrak kemahiran terperinci. Ini membantu ejen mempelajari langkah-langkah khusus dan bukannya sekadar meneka. Kes penggunaan: Ejen web dan automasi tugasan.

• Qwen-Image-Agent Arahan teks yang ringkas sering kali tidak mencukupi untuk imej yang kompleks. Ejen ini membina konteks penuh melalui perancangan dan penaakulan sebelum menjana imej tersebut. Kes penggunaan: Reka bentuk pemasaran dan fotografi produk profesional.

• The Verification Horizon Dalam ejen pengekodan, isyarat ganjaran boleh mudah dimanipulasi. Kertas kerja ini berhujah bahawa sistem pengesahan mesti berkembang seiring dengan ejen untuk kekal berkesan. Kes penggunaan: Ejen perisian autonomi dan pembantu pengekodan (coding copilots).

  1. Penjanaan Imej & Video

• DanceOPD Banyak model bergelut untuk mengimbangi penjanaan imej dengan penyuntingan imej. DanceOPD menggunakan kaedah penyulingan (distillation) untuk mengajar satu model pelbagai kemahiran kreatif tanpa mengganggu antara satu sama lain. Kes penggunaan: Alatan reka bentuk kreatif serba guna.

• DomainShuttle (Paper ID: 2606.26058) Mencipta video orang atau haiwan tertentu adalah sukar. DomainShuttle membantu mengekalkan identiti subjek walaupun gaya atau latar belakang berubah. Kes penggunaan: Iklan video peribadi dan pempengaruh maya.

• MVTrack4Gen (Paper ID: 2606.26087) Video AI sering kekurangan ketekalan geometri antara sudut yang berbeza. Kertas kerja ini menggunakan penjejakan pelbagai pandangan (multi-view tracking) untuk memastikan pergerakan kelihatan realistik dari setiap perspektif. Kes penggunaan: AR/VR dan produksi filem.

• ViQ (Paper ID: 2606.27313) Token visual sering kehilangan perincian apabila ia cuba menangkap makna. ViQ mencipta cara untuk mengekalkan makna tahap tinggi dan perincian tahap rendah dalam satu rangka kerja. Kes penggunaan: Penaakulan dan pencarian imej resolusi tinggi.

  1. Robotik & Interaksi Dunia Sebenar

• ICWM Robot menghadapi geseran dan berat yang baharu setiap hari. Daripada melakukan latihan semula, ICWM membolehkan robot meneroka persekitaran mereka dan menyesuaikan diri secara serta-merta melalui konteks. Kes penggunaan: Robot industri dan automasi gudang.

  1. AI Berpusatkan Pengguna

• ShutterMuse (Paper ID: 2606.25763) Kebanyakan AI membantu selepas anda mengambil foto. ShutterMuse membantu semasa anda sedang merakam dengan mencadangkan komposisi dan gaya (poses) dalam masa nyata. Kes penggunaan: Aplikasi kamera pintar dan pembantu fotografi mudah alih.

Tiga trend utama:

  • Ejen yang merancang, mengingati, dan menambah baik diri sendiri.
  • Media generatif yang mengekalkan ketekalan subjek dan geometri.
  • Sistem yang menyesuaikan diri dengan konteks dan bukannya memerlukan latihan semula yang berterusan.

Sumber: https://dev.to/y_hnhnhan_2f26de65ffcc4/top-ai-papers-on-hugging-face-2026-06-28-2eg

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi