Top AI Papers on Hugging Face

AI sedang berkembang pesat. Penyelidikan baharu menunjukkan peralihan ke arah ejen dengan memori jangka panjang, pemahaman 3D yang lebih baik, dan penjanaan video yang cekap.

Berikut adalah 10 kertas kerja utama daripada Hugging Face dan mengapa ia penting:

• Act2Answer: Menilai kecerdasan robot melalui tindakan fizikal dan bukannya sekadar teks. Ini membantu membina robot yang benar-benar memahami dunia di sekeliling mereka.

• Scenes as Objects: Mewakili pemandangan 3D sebagai token berstruktur. Ini membolehkan anda berinteraksi dengan objek tertentu dalam AR/VR atau kembar digital (digital twins) dengan mudah.

• GEAR: Melatih tokeniser dan penjana imej secara bersama. Ini menghasilkan imej berkualiti lebih tinggi untuk sistem teks-ke-imej.

• PerceptionRubrics: Cara baharu untuk menguji model multimodal. Ia menggunakan kriteria seperti manusia untuk mencari kesilapan yang terlepas daripada penanda aras standard.

• Multi-block Diffusion LM: Mempercepatkan penjanaan teks dengan menghasilkan beberapa blok token sekaligus. Ini sangat penting untuk AI dengan kependaman (latency) rendah.

• SkillHone: Membantu ejen AI belajar daripada pengalaman lalu. Daripada bermula dari awal setiap kali, ejen membina dan memperhalusi kemahiran melalui banyak sesi.

• TurboServe: Sistem yang direka untuk mengendalikan beban kerja penjanaan video yang berat. Ia memfokuskan pada pengurangan kos dan pengurusan sumber GPU untuk penstriman video.

• Procedural Memory: Menumpukan pada mengajar ejen "bagaimana" untuk mengikuti aliran kerja. Ini adalah kunci untuk automasi perusahaan dan tugas pejabat belakang (back-office).

• DataEvolver: Menggunakan gelung multi-ejen untuk mencipta data latihan yang lebih baik bagi imej dengan teks. Ia belajar daripada kegagalannya sendiri untuk meningkatkan kualiti.

• MemSyco-Bench: Menguji sama ada ejen menjadi terlalu berat sebelah (biased) disebabkan memorinya sendiri. Ia memastikan pembantu peribadi kekal objektif dan tepat.

Trend Utama:

  1. Penanda Aras yang Lebih Baik: Kita sedang beralih daripada skor ringkas kepada pengujian tindakan dunia nyata dan persepsi manusia.

  2. Ejen yang Berevolusi: AI masa hadapan akan bertindak seperti rakan sekerja. Mereka akan mengingati prosedur dan menggunakan semula kemahiran merentasi pelbagai tugas.

  3. Pelaksanaan yang Cekap: Penyelidikan beralih daripada "demo yang hebat" kepada sistem yang berjalan pantas dan murah dalam pengeluaran (production).

Jika anda seorang jurutera atau penyelidik, perhatikan Act2Answer untuk robotik dan TurboServe untuk AI video.

Sumber: https://dev.to/y_hnhnhan_2f26de65ffcc4/top-ai-papers-on-hugging-face-2026-07-02-2hp3

Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi