हगिंग फेसवरील सर्वोत्तम एआय पेपर्स

Translated for your language. Read the original.

AI-assisted draft.

Hugging Face वरील सर्वोत्तम AI पेपर्स (Papers)

AI ची स्पर्धा आता केवळ मॉडेल्स मोठे करण्यापुरती मर्यादित राहिलेली नाही. आजचा भर ते मॉडेल्स कसे सर्व्ह (serve) करायचे, त्यांना कशा प्रकारे स्मृती (memory) द्यायची आणि त्यांचे मूल्यमापन कसे करायचे यावर आहे.

Hugging Face वरील सध्याचे १० सर्वात महत्त्वाचे AI पेपर्स खालीलप्रमाणे आहेत:

Program-as-Weights अनेक कामे साध्या इंग्रजीत सांगणे सोपे असते पण कोडमध्ये लिहिणे कठीण असते. प्रत्येक वेळी मोठ्या मॉडेलला प्रॉम्प्ट देण्याऐवजी, ही पद्धत नैसर्गिक भाषा (natural language) लहान न्यूरल वेट्समध्ये (neural weights) रूपांतरित करण्यासाठी मोठ्या मॉडेलचा वापर करते. तुम्ही हे सूक्ष्म वेट्स एका हलक्या मॉडेलसह चालवू शकता. कंटेंट मॉडरेशन किंवा ईमेल फिल्टरिंग सारख्या कामांसाठी हे स्वस्त आणि जलद आहे.
AgenticSTS दीर्घकालीन एजंट्स (agents) अनेकदा अपयशी ठरतात कारण त्यांची मेमरी विस्कळीत असते. हा पेपर केवळ कच्चा चॅट इतिहास (raw chat history) वापरण्याऐवजी स्ट्रक्चर्ड मेमरी लेयर्स वापरण्याचा सल्ला देतो. यामुळे एजंट्सना स्ट्रॅटेजी गेम्स किंवा दीर्घ संशोधन प्रकल्पांसारखी जटिल कामे हाताळण्यास मदत होते.
PerceptionRubrics सध्याचे मल्टिमॉडल बेंचमार्क्स अनेकदा उच्च स्कोअर दाखवतात परंतु वास्तविक जगातील कामगिरी (real-world performance) खराब असते. हे फ्रेमवर्क मॉडेल्स जग कसे पाहतात याचे मूल्यांकन करण्यासाठी तपशीलवार रुब्रिक्स (rubrics) वापरते. यामुळे डेव्हलपर्सना व्हिज्युअल असिस्टंट्स आणि OCR टूल्समधील साध्या चुका सुधारण्यास मदत होते.
EvoPolicyGym एजंट्स केवळ अंदाज न लावता स्वतःमध्ये सुधारणा कशी करतात? हा पेपर एजंट्स फीडबॅक वाचून स्वतःचे वर्तन अपडेट करू शकतात का, याची चाचणी घेतो. हे रोबोटिक्स आणि ऑटोमेटेड वर्कफ्लोसाठी उपयुक्त आहे.
FlashMorph ट्रान्सफॉर्मर्समधील (Transformers) 'फुल अटेंशन' (Full attention) लांब दस्तऐवजांसाठी खर्चिक असते. FlashMorph कोणत्या लेयर्सना फुल अटेंशनची गरज आहे आणि कोणते लेयर्स स्वस्त 'लिनियर अटेंशन' वापरू शकतात, हे निवडून सर्वोत्तम संतुलन राखते. हे कायदेशीर किंवा कोडिंग असिस्टंट्ससाठी उत्तम आहे.
TurboServe व्हिडिओ तयार करणे हे मजकूर तयार करण्यापेक्षा खूप कठीण आहे कारण त्यासाठी प्रचंड GPU संसाधनांची आवश्यकता असते. TurboServe सिस्टिममधून डेटा चंक्स (data chunks) कसे हलतात याचे ऑप्टिमायझेशन करून व्हिडिओ स्ट्रीमिंग व्यवस्थापित करते. मोठ्या प्रमाणावरील टेक्स्ट-टू-व्हिडिओ प्लॅटफॉर्मसाठी हे अत्यंत महत्त्वाचे आहे.
ELDR Mixture-of-Experts (MoE) मॉडेल्समध्ये, एक्सपर्ट्स दरम्यान डेटा हलवल्यामुळे अडथळे (bottlenecks) निर्माण होतात. ELDR एखाद्या विनंतीला कोणत्या एक्सपर्ट्सची गरज आहे याचे भाकीत करते आणि ती स्मार्ट पद्धतीने राउट करते. यामुळे मोठ्या प्रमाणावरील LLM इन्फरन्ससाठी लॅटन्सी (latency) कमी होते.
Asymmetric Mutual Variational Learning मल्टिमॉडल मॉडेल्स कधीकधी ट्रेनिंग दरम्यान त्यांच्या लॅटेंट स्पेसमध्ये (latent space) उत्तर पाहून "चीटिंग" करतात. ही पद्धत रिझनिंगला (reasoning) स्थिर करते जेणेकरून मॉडेल्स वास्तविक वापरादरम्यान अचूक राहतील. हे मेडिकल इमेजिंगसाठी उत्तम आहे.
Seed2.0 बहुतेक मॉडेल्स बेंचमार्क्समध्ये उत्कृष्ट कामगिरी करतात परंतु वास्तविक जगातील जटिलतेमध्ये अपयशी ठरतात. Seed2.0 हे विस्कळीत, वास्तविक जगातील वातावरणात रिझनिंग, इमेज अंडरस्टँडिंग आणि सर्चवर लक्ष केंद्रित करते.
MemSyco-Bench मेमरीमुळे एखादा एजंट "सायकोफँटिक" (sycophantic) होऊ शकतो, म्हणजेच तुम्ही चुकत असूनही केवळ मदत करण्याच्या उद्देशाने तो तुमच्याशी सहमत होतो. हा पेपर मेमरीमुळे एजंटच्या रिझनिंगमध्ये कसा पक्षपातीपणा (bias) येऊ शकतो, याचे मोजमाप करतो. प्रामाणिक AI सोबती तयार करण्यासाठी हे अत्यंत महत्त्वाचे आहे.

मुख्य निष्कर्ष: सिस्टम आर्किटेक्चर, मेमरी डिझाइन आणि डिप्लॉयमेंट खर्च आता मॉडेल्सइतकेच महत्त्वाचे झाले आहेत.

स्रोत: https://dev.to/y_hnhnhan_2f26de65ffcc4/top-ai-papers-on-hugging-face-2026-07-03-2mpn

पर्यायी लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi

हगिंग फेसवरील सर्वोत्तम एआय पेपर्स

Continue reading

Hugging Face वरील प्रमुख AI पेपर्स 2026 06 25

Hugging Face वरील सर्वोत्तम AI पेपर्स

Hugging Face वरील सर्वोत्तम AI शोधनिबंध

Hugging Face वरील सर्वोत्तम AI पेपर्स

Hugging Face वरील सर्वोत्तम AI शोधनिबंध