Kertas Kerja AI Teratas di Hugging Face
Perlumbaan AI kini melangkaui sekadar membesarkan model. Hari ini, fokus beralih kepada cara kita melayan, mengingati, dan menilai model tersebut.
Berikut adalah 10 kertas kerja AI paling penting di Hugging Face sekarang:
Program-as-Weights Banyak tugasan mudah diterangkan dalam bahasa Inggeris biasa tetapi sukar untuk ditulis dalam kod. Daripada memberikan arahan (prompting) kepada model besar setiap kali, kaedah ini menggunakan model besar untuk menyusun bahasa semula jadi menjadi pemberat neural (neural weights) yang kecil. Anda menjalankan pemberat kecil ini dengan model ringan. Ia lebih murah dan pantas untuk tugasan seperti moderasi kandungan atau penapisan e-mel.
AgenticSTS Ejen jangka panjang sering gagal kerana memori mereka yang tidak teratur. Kertas kerja ini mencadangkan penggunaan lapisan memori berstruktur berbanding hanya membuang sejarah sembang mentah. Ia membantu ejen mengendalikan tugasan kompleks seperti permainan strategi atau projek penyelidikan yang panjang.
PerceptionRubrics Penanda aras multimodal semasa sering menunjukkan skor yang tinggi tetapi prestasi dunia nyata yang lemah. Rangka kerja ini menggunakan rubrik terperinci untuk menilai cara model melihat dunia. Ia membantu pembangun membetulkan kesilapan remeh dalam pembantu visual dan alatan OCR.
EvoPolicyGym Bagaimanakah ejen menambah baik diri mereka tanpa sekadar meneka? Kertas kerja ini menguji sama ada ejen boleh membaca maklum balas dan mengemas kini tingkah laku mereka sendiri. Ia berguna untuk robotik dan aliran kerja automatik.
FlashMorph Perhatian penuh (full attention) dalam Transformers adalah mahal untuk dokumen yang panjang. FlashMorph mencari keseimbangan terbaik dengan memilih lapisan mana yang memerlukan perhatian penuh dan mana yang boleh menggunakan perhatian linear yang lebih murah. Ia sangat sesuai untuk pembantu undang-undang atau pengekodan.
TurboServe Menghasilkan video adalah jauh lebih sukar daripada menghasilkan teks kerana ia memerlukan sumber GPU yang besar. TurboServe menguruskan penstriman video dengan mengoptimumkan cara ketulan data (data chunks) bergerak melalui sistem. Ini sangat penting untuk platform teks-ke-video berskala besar.
ELDR Dalam model Mixture-of-Experts (MoE), pemindahan data antara pakar (experts) menyebabkan kesesakan (bottlenecks). ELDR meramalkan pakar mana yang diperlukan oleh sesuatu permintaan dan menyalurkannya secara pintar. Ini mengurangkan kependaman (latency) untuk inferens LLM berskala besar.
Asymmetric Mutual Variational Learning Model multimodal kadangkala "menipu" dengan melihat jawapan dalam ruang laten (latent space) mereka semasa latihan. Kaedah ini menstabilkan penaakulan supaya model kekal tepat semasa penggunaan dunia nyata. Ia sangat bagus untuk pengimejan perubatan.
Seed2.0 Kebanyakan model cemerlang dalam penanda aras tetapi gagal dalam kerumitan dunia nyata. Seed2.0 memberi tumpuan kepada penaakulan, pemahaman imej, dan carian dalam persekitaran dunia nyata yang tidak teratur.
MemSyco-Bench Memori boleh menjadikan ejen bersifat "sycophantic" (penjilat), bermaksud ia bersetuju dengan anda hanya untuk menjadi membantu, walaupun anda salah. Kertas kerja ini mengukur bagaimana memori boleh membiaskan penaakulan ejen. Ia sangat kritikal untuk membina teman AI yang jujur.
Kesimpulan utama: Seni bina sistem, reka bentuk memori, dan kos penggunaan kini sama pentingnya dengan model itu sendiri.
Sumber: https://dev.to/y_hnhnhan_2f26de65ffcc4/top-ai-papers-on-hugging-face-2026-07-03-2mpn
Komuniti pembelajaran pilihan: https://t.me/GyaanSetuAi
