Hugging Face தளத்தில் உள்ள சிறந்த AI ஆய்வுக் கட்டுரைகள்

Translated for your language. Read the original.

AI-assisted draft.

Hugging Face தளத்தில் உள்ள சிறந்த AI ஆய்வுக் கட்டுரைகள்

Hugging Face-இல் உள்ள சிறந்த AI ஆய்வுக் கட்டுரைகள்

AIப் போட்டி என்பது வெறும் மாடல்களைப் பெரிதாக்குவதைத் தாண்டி நகர்ந்து கொண்டிருக்கிறது. இன்று, அவற்றை எவ்வாறு வழங்குவது (serve), நினைவில் கொள்வது மற்றும் மதிப்பீடு செய்வது என்பதிலேயே கவனம் செலுத்தப்படுகிறது.

தற்போது Hugging Face-இல் உள்ள 10 மிக முக்கியமான AI ஆய்வுக் கட்டுரைகள் இதோ:

Program-as-Weights பல பணிகளைச் சாதாரண ஆங்கிலத்தில் விவரிப்பது எளிது, ஆனால் அவற்றை நிரலாக (code) எழுதுவது கடினம். ஒவ்வொரு முறையும் ஒரு பெரிய மாடலுக்குத் தூண்டுதல் (prompting) கொடுப்பதற்குப் பதிலாக, இந்த முறை ஒரு பெரிய மாடலைப் பயன்படுத்தி இயற்கை மொழியைச் சிறிய நரம்பியல் எடைகளாக (neural weights) மாற்றுகிறது. இந்தச் சிறிய எடைகளை ஒரு லேசான மாடலுடன் நீங்கள் இயக்கலாம். உள்ளடக்கக் கட்டுப்பாடு (content moderation) அல்லது மின்னஞ்சல் வடிகட்டுதல் போன்ற பணிகளுக்கு இது செலவு குறைந்ததாகவும் வேகமானதாகவும் இருக்கும்.
AgenticSTS நீண்ட கால ஏஜெண்டுகள் (agents) பெரும்பாலும் அவற்றின் நினைவாற்றல் குழப்பமாக இருப்பதால் தோல்வியடைகின்றன. வெறும் உரையாடல் வரலாற்றை அப்படியே சேமிப்பதற்குப் பதிலாக, கட்டமைக்கப்பட்ட நினைவக அடுக்குகளைப் (structured memory layers) பயன்படுத்துமாறு இந்த ஆய்வுக் கட்டுரை பரிந்துரைக்கிறது. இது வியூக விளையாட்டுகள் அல்லது நீண்ட ஆராய்ச்சித் திட்டங்கள் போன்ற சிக்கலான பணிகளைக் கையாள ஏஜெண்டுகளுக்கு உதவுகிறது.
PerceptionRubrics தற்போதைய மல்டிமோடல் (multimodal) அளவுகோல்கள் பெரும்பாலும் அதிக மதிப்பெண்களைக் காட்டினாலும், நிஜ உலகச் செயல்பாட்டில் மோசமாக உள்ளன. இந்த கட்டமைப்பானது, மாடல்கள் உலகைப் பார்க்கும் விதத்தைப்評ிக்க விரிவான அளவுகோல்களைப் (rubrics) பயன்படுத்துகிறது. இது விஷுவல் அசிஸ்டெண்ட்கள் மற்றும் OCR கருவிகளில் உள்ள சிறு தவறுகளைச் சரிசெய்ய டெவலப்பர்களுக்கு உதவுகிறது.
EvoPolicyGym ஏஜெண்டுகள் வெறும் யூகங்களை மட்டும் செய்யாமல் எவ்வாறு தங்களை மேம்படுத்திக் கொள்கின்றன? ஏஜெண்டுகள் பின்னூட்டங்களைப் (feedback) படித்து, அவற்றின் சொந்த நடத்தையை மாற்றியமைக்க முடியுமா என்பதை இந்த ஆய்வுக் கட்டுரை சோதிக்கிறது. இது ரோபாட்டிக்ஸ் மற்றும் தானியங்கி பணிப்பாய்வுகளுக்கு (automated workflows) பயனுள்ளதாக இருக்கும்.
FlashMorph நீண்ட ஆவணங்களுக்கு Transformers-இல் முழுமையான கவனம் (full attention) செலுத்துவது அதிகச் செலவு பிடிக்கும் செயலாகும். எந்த அடுக்குகளுக்கு முழுமையான கவனம் தேவை மற்றும் எவை மலிவான லீனியர் அட்டென்ஷனைப் (linear attention) பயன்படுத்தலாம் என்பதைத் தேர்ந்தெடுப்பதன் மூலம் FlashMorph சிறந்த சமநிலையைக் கண்டறிகிறது. இது சட்ட அல்லது கோடிங் உதவியாளர்களுக்குப் பொருத்தமானது.
TurboServe வீடியோவை உருவாக்குவது உரையை உருவாக்குவதை விட மிகவும் கடினமானது, ஏனெனில் இதற்குப் பிரம்மாண்டமான GPU வளங்கள் தேவைப்படுகின்றன. தரவுத் துண்டுகள் (data chunks) அமைப்பின் வழியாக எவ்வாறு நகர்கின்றன என்பதை மேம்படுத்துவதன் மூலம் TurboServe வீடியோ ஸ்ட்ரீமிங்கை நிர்வகிக்கிறது. இது பெரிய அளவிலான text-to-video தளங்களுக்கு மிக முக்கியமானது.
ELDR Mixture-of-Experts (MoE) மாடல்களில், நிபுணர்களுக்கு (experts) இடையே தரவை நகர்த்துவது தடைகளை (bottlenecks) ஏற்படுத்துகிறது. ஒரு கோரிக்கை எந்த நிபுணர்களைத் தேவைப்படுத்துகிறது என்பதை ELDR கணித்து, அதைச் புத்திசாலித்தனமாக வழிநடத்துகிறது. இது பெரிய அளவிலான LLM இன்ஃபரன்ஸிற்கான (inference) தாமதத்தைக் (latency) குறைக்கிறது.
Asymmetric Mutual Variational Learning மல்டிமோடல் மாடல்கள் சில நேரங்களில் பயிற்சியின் போது அவற்றின் லேட்டன்ட் ஸ்பேஸில் (latent space) விடையைப் பார்ப்பதன் மூலம் "ஏமாற்றுகின்றன". இந்த முறை தர்க்கரீதியான சிந்தனையை (reasoning) நிலைப்படுத்துகிறது, இதனால் மாடல்கள் நிஜ உலகப் பயன்பாட்டின் போது துல்லியமாக இருக்கும். இது மருத்துவ இமேஜிங்கிற்கு (medical imaging) சிறந்தது.
Seed2.0 பெரும்பாலான மாடல்கள் அளவுகோல்களில் (benchmarks) சிறந்து விளங்கினாலும், நிஜ உலகச் சிக்கல்களில் தோல்வியடைகின்றன. Seed2.0 குழப்பமான, நிஜ உலகச் சூழல்களில் தர்க்கம் செய்தல், படத்தைப் புரிந்துகொள்ளுதல் மற்றும் தேடுதல் ஆகியவற்றில் கவனம் செலுத்துகிறது.
MemSyco-Bench நினைவாற்றல் ஒரு ஏஜெண்ட்டை "sycophantic" ஆக்கக்கூடும், அதாவது நீங்கள் தவறாக இருந்தாலும் உங்களுக்கு உதவ வேண்டும் என்பதற்காக அது உங்களுடன் உடன்படும். நினைவாற்றல் ஒரு ஏஜெண்ட்டின் தர்க்கரீதியான சிந்தனையில் எவ்வாறு சார்புநிலையை (bias) ஏற்படுத்துகிறது என்பதை இந்த ஆய்வுக் கட்டுரை அளவிடுகிறது. நேர்மையான AIத் துணைகளை உருவாக்குவதற்கு இது மிகவும் முக்கியமானது.

முக்கியக் கருத்து: சிஸ்டம் ஆர்க்கிடெக்சர் (System architecture), நினைவக வடிவமைப்பு மற்றும் பயன்பாட்டுச் செலவுகள் (deployment costs) இப்போது மாடல்களைப் போலவே முக்கியமானவை.

ஆதாரம்: https://dev.to/y_hnhnhan_2f26de65ffcc4/top-ai-papers-on-hugging-face-2026-07-03-2mpn

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi

Hugging Face தளத்தில் உள்ள சிறந்த AI ஆய்வுக் கட்டுரைகள்

Hugging Face-இல் உள்ள சிறந்த AI ஆய்வுக் கட்டுரைகள்

Continue reading

Hugging Face தளத்தின் சிறந்த AI ஆய்வுக் கட்டுரைகள் 2026 06 25

Hugging Face-இல் உள்ள சிறந்த AI ஆய்வுக் கட்டுரைகள்

Top AI Papers on Hugging Face

Hugging Face-இல் உள்ள சிறந்த AI ஆய்வுக் கட்டுரைகள்