Top AI Papers on Hugging Face

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialಕಳೆದ ವಾರ2min read

Hugging Face ನಲ್ಲಿನ ಪ್ರಮುಖ AI ಸಂಶೋಧನಾ ಪ್ರಬಂಧಗಳು

AI ಮೂರು ದಿಕ್ಕುಗಳಲ್ಲಿ ವೇಗವಾಗಿ ಸಾಗುತ್ತಿದೆ. ಏಜೆಂಟ್‌ಗಳು (Agents) ಹೆಚ್ಚು ಬುದ್ಧಿವಂತವಾಗುತ್ತಿವೆ. ವಿಡಿಯೋ ಜನರೇಷನ್ (Video generation) ಹೆಚ್ಚು ನಮ್ಯತೆಯನ್ನು ಪಡೆಯುತ್ತಿದೆ. ಮಲ್ಟಿಮೋಡಲ್ ಮಾಡೆಲ್‌ಗಳು (Multimodal models) ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿಯಾಗುತ್ತಿವೆ.

ಇಂದು Hugging Face ನಿಂದ ಬಂದಿರುವ 10 ಅತ್ಯಂತ ಪ್ರಮುಖ AI ಸಂಶೋಧನಾ ಪ್ರಬಂಧಗಳು ಇಲ್ಲಿವೆ.

ಏಜೆಂಟ್ ಮೆಮೊರಿ ಸಿಸ್ಟಮ್ಸ್ (Agent Memory Systems) ಹೆಚ್ಚಿನ ಏಜೆಂಟ್‌ಗಳು ಬಳಕೆದಾರರ ಇತಿಹಾಸ ಅಥವಾ ಕಾರ್ಯ ಯೋಜನೆಗಳನ್ನು ನೆನಪಿಟ್ಟುಕೊಳ್ಳಲು ನೈಜ ಮಾರ್ಗವನ್ನು ಹೊಂದಿಲ್ಲ. ಈ ಪ್ರಬಂಧವು ಮೆಮೊರಿಯನ್ನು ಡೇಟಾ ನಿರ್ವಹಣಾ ವ್ಯವಸ್ಥೆಯಂತೆ ಪರಿಗಣಿಸುತ್ತದೆ. ಇದು ಸಂಗ್ರಹಣೆ (storage), ಮರುಪಡೆಯುವಿಕೆ (retrieval) ಮತ್ತು ಅಪ್‌ಡೇಟ್‌ಗಳಿಗಾಗಿ ಮಾಡ್ಯೂಲ್‌ಗಳನ್ನು ಬಳಸುತ್ತದೆ. ದೀರ್ಘಕಾಲದ AI ಸಹಾಯಕರು ಮತ್ತು ವೈಯಕ್ತಿಕ ಟ್ಯೂಟರ್‌ಗಳಿಗೆ ಇದು ಅತ್ಯಗತ್ಯ.
DomainShuttle: ಸ್ಥಿರವಾದ ವಿಡಿಯೋ ಜನರೇಷನ್ (Consistent Video Generation) ಒಂದೇ ಪಾತ್ರದೊಂದಿಗೆ ವಿಡಿಯೋಗಳನ್ನು ರಚಿಸುವುದು ಕಷ್ಟಕರವಾಗಿದೆ. ವಿವಿಧ ದೃಶ್ಯಗಳಲ್ಲಿ ವಿಷಯಗಳನ್ನು ಸ್ಥಿರವಾಗಿಡಲು ಈ ಪ್ರಬಂಧವು ಡೊಮೇನ್-ಅವೇರ್ ಮಾಡೆಲಿಂಗ್ ಅನ್ನು ಬಳಸುತ್ತದೆ. ಇದು ಮಾರ್ಕೆಟಿಂಗ್ ಮತ್ತು ಚಲನಚಿತ್ರ ನಿರ್ಮಾಣದಲ್ಲಿ ಸಹಾಯ ಮಾಡುತ್ತದೆ.
DanceOPD: ಆಲ್-ಇನ್-ಒನ್ ಇಮೇಜ್ ಜನರೇಷನ್ (All-in-One Image Generation) ವಿವಿಧ ಕಾರ್ಯಗಳಿಗಾಗಿ ಅನೇಕ ಮಾಡೆಲ್‌ಗಳನ್ನು ಹೊಂದುವ ಬದಲು, ಈ ಪ್ರಬಂಧವು ಅನೇಕ ತಜ್ಞ ಕೌಶಲಗಳನ್ನು ಒಂದೇ ಸ್ಟೂಡೆಂಟ್ ಮಾಡೆಲ್‌ಗೆ ಸಂಕ್ಷೇಪಿಸುತ್ತದೆ. ಹಿನ್ನೆಲೆಯನ್ನು ಬದಲಾಯಿಸುವುದು ಅಥವಾ ವಸ್ತುಗಳನ್ನು ಸೇರಿಸುವಂತಹ ಏಕಕಾಲದ ಇಮೇಜ್ ಎಡಿಟಿಂಗ್‌ಗಾಗಿ ನೀವು ಇದನ್ನು ಬಳಸಬಹುದು.
ShutterMuse: ರಿಯಲ್-ಟೈಮ್ ಫೋಟೋಗ್ರಫಿ ಗೈಡ್ (Real-Time Photography Guide) ಹೆಚ್ಚಿನ AI ಫೋಟೋ ತೆಗೆದ ನಂತರದ ಎಡಿಟಿಂಗ್ ಮೇಲೆ ಗಮನ ಹರಿಸುತ್ತದೆ. ಆದರೆ ಈ ಪ್ರಬಂಧವು ಫೋಟೋ ಸೆರೆಹಿಡಿಯುವ ಕ್ಷಣದ ಮೇಲೆ ಗಮನ ಹರಿಸುತ್ತದೆ. ಇದು ರಿಯಲ್ ಟೈಮ್‌ನಲ್ಲಿ ಉತ್ತಮ ಸಂಯೋಜನೆ (composition) ಮತ್ತು ಪೋಸ್‌ಗಳನ್ನು ಸೂಚಿಸುತ್ತದೆ. ಇದು ಸ್ಮಾರ್ಟ್‌ಫೋನ್ ಕ್ಯಾಮೆರಾ ಆಪ್‌ಗಳಲ್ಲಿ ಕೆಲಸ ಮಾಡಬಹುದು.
ViQ: ಪರಿಣಾಮಕಾರಿ ದೃಶ್ಯ ಪ್ರಾತಿನಿಧ್ಯ (Efficient Visual Representation) ಮಲ್ಟಿಮೋಡಲ್ ಮಾಡೆಲ್‌ಗಳು ಚಿತ್ರಗಳಿಗಾಗಿ ಹೆಚ್ಚಾಗಿ ಅತಿಯಾದ ಮೆಮೊರಿಯನ್ನು ಬಳಸುತ್ತವೆ. ಮಾಡೆಲ್‌ಗಳನ್ನು ಲಘು ಮತ್ತು ವೇಗವಾಗಿರಿಸಲು ViQ ಕ್ವಾಂಟೈಸ್ಡ್ ವಿಶುವಲ್ ಟೋಕನ್‌ಗಳನ್ನು (quantized visual tokens) ಬಳಸುತ್ತದೆ. ಇದು ಸಣ್ಣ ಸಾಧನಗಳ ಮೇಲೆ ಹೆಚ್ಚಿನ ರೆಸಲ್ಯೂಶನ್ ಪ್ರೊಸೆಸಿಂಗ್ ಮಾಡಲು ಅನುವು ಮಾಡಿಕೊಡುತ್ತದೆ.
ಡಿಫ್ಯೂಷನ್ ಲ್ಯಾಂಗ್ವೇಜ್ ಮಾಡೆಲ್‌ಗಳು (Diffusion Language Models) ಹೆಚ್ಚಿನ LLMಗಳು ಎಡದಿಂದ ಬಲಕ್ಕೆ ಓದುತ್ತವೆ. ಈ ಪ್ರಬಂಧವು ಮಾಸ್ಕ್ ಮಾಡಿದ ಟೋಕನ್‌ಗಳನ್ನು ಡಿನಾಯ್ಸ್ ಮಾಡುವ ಮೂಲಕ ಪಠ್ಯವನ್ನು ರಚಿಸಲು ಡಿಫ್ಯೂಷನ್ ಅನ್ನು ಬಳಸುತ್ತದೆ. ಇದು ಸಂಕೀರ್ಣ ತರ್ಕದ ಕಾರ್ಯಗಳಲ್ಲಿ ಉತ್ತಮವಾಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ ಮತ್ತು ಕೋಡ್ ಎಡಿಟಿಂಗ್‌ಗೆ ಅದ್ಭುತವಾಗಿದೆ.
ಮಲ್ಟಿಮೋಡಲ್ ಕೋಡ್ ಇಂಟೆಲಿಜೆನ್ಸ್ (Multimodal Code Intelligence) AI ಈಗ GUI ಅಥವಾ ಚಾರ್ಟ್‌ಗಳಂತಹ ಚಿತ್ರಗಳನ್ನು ನೋಡಿ ಕೋಡ್ ಬರೆಯಬಲ್ಲದು. ಈ ಸಮೀಕ್ಷೆಯು ರಚಿಸಲಾದ ಕೋಡ್ ನಿಜವಾಗಿಯೂ ಕೆಲಸ ಮಾಡುತ್ತದೆಯೇ ಎಂದು ಪರಿಶೀಲಿಸುವುದರ ಮೇಲೆ ಗಮನ ಹರಿಸುತ್ತದೆ. ಇದು ಸ್ವಯಂಚಾಲಿತ ವೆಬ್ ಅಭಿವೃದ್ಧಿಗೆ ಒಂದು ದೊಡ್ಡ ಹೆಜ್ಜೆಯಾಗಿದೆ.
Qwen-Image-Agent ಉತ್ತಮ ಚಿತ್ರಗಳಿಗಾಗಿ ಪಠ್ಯ ಪ್ರಾಂಪ್ಟ್‌ಗಳು (Text prompts) ಹೆಚ್ಚಾಗಿ ತುಂಬಾ ಚಿಕ್ಕದಾಗಿರುತ್ತವೆ. ಈ ವ್ಯವಸ್ಥೆಯು ಏಜೆಂಟ್ ಆಗಿ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತದೆ. ಇದು ಚಿತ್ರ ಬಿಡಿಸುವ ಮೊದಲು ಸಂದರ್ಭವನ್ನು (context) ನಿರ್ಮಿಸಲು ಯೋಜನೆ ರೂಪಿಸುತ್ತದೆ, ಹುಡುಕುತ್ತದೆ ಮತ್ತು ಮೆಮೊರಿಯನ್ನು ಬಳಸುತ್ತದೆ. ಇದು ನಮ್ಮನ್ನು 'ಟೆಕ್ಸ್ಟ್-ಟು-ಇಮೇಜ್' ನಿಂದ 'ಇಮೇಜ್-ಜನರೇಷನ್ ಏಜೆಂಟ್‌ಗಳ' ಕಡೆಗೆ ಕೊಂಡೊಯ್ಯುತ್ತದೆ.
MVTrack4Gen: ಜ್ಯಾಮಿತೀಯ ವಿಡಿಯೋ ಸ್ಥಿರತೆ (Geometric Video Consistency) ಕ್ಯಾಮೆರಾ ಚಲಿಸಿದಾಗ ವಿಡಿಯೋಗಳಲ್ಲಿ ಆಕಾರಗಳು ವಿರೂಪಗೊಳ್ಳುತ್ತವೆ. ಜ್ಯಾಮಿತೀಯ ಸ್ಥಿರತೆಯನ್ನು ಖಚಿತಪಡಿಸಿಕೊಳ್ಳಲು ಈ ಪ್ರಬಂಧವು ಮಲ್ಟಿ-ವ್ಯೂ ಟ್ರ್ಯಾಕಿಂಗ್ ಅನ್ನು ಬಳಸುತ್ತದೆ. ಇದು AR, VR ಮತ್ತು 3D ಕಂಟೆಂಟ್‌ಗೆ ಅತ್ಯಗತ್ಯ.
OPID: ಪರಿಣಾಮಕಾರಿ ಏಜೆಂಟ್ ತರಬೇತಿ (Efficient Agent Training) ರಿಇನ್‌ಫೋರ್ಸ್‌ಮೆಂಟ್ ಲರ್ನಿಂಗ್ (reinforcement learning) ಮೂಲಕ ಏಜೆಂಟ್‌ಗಳಿಗೆ ತರಬೇತಿ ನೀಡುವುದು ನಿಧಾನಗತಿಯ ಪ್ರಕ್ರಿಯೆ. OPID ಪೂರ್ಣಗೊಂಡ ಕಾರ್ಯಗಳನ್ನು ಬಳಸಿಕೊಂಡು ಏಜೆಂಟ್‌ಗೆ ಮಧ್ಯಂತರ ಕೌಶಲಗಳನ್ನು ಕಲಿಸುತ್ತದೆ. ಇದು ಕೋಡಿಂಗ್ ಮತ್ತು ವೆಬ್ ಏಜೆಂಟ್‌ಗಳ ಕಲಿಕೆಯನ್ನು ಹೆಚ್ಚು ವೇಗಗೊಳಿಸುತ್ತದೆ.

ಪ್ರವೃತ್ತಿಗಳ ಸಾರಾಂಶ (Summary of Trends):

ಏಜೆಂಟ್‌ಗಳು ಮೆಮೊರಿ ಮತ್ತು ಯೋಜನೆಯೊಂದಿಗೆ ಸಂಪೂರ್ಣ ವ್ಯವಸ್ಥೆಗಳಾಗುತ್ತಿವೆ.
ಜನರೇಷನ್ ಉತ್ತಮ ಸಂದರ್ಭ ಮತ್ತು ಸ್ಥಿರತೆಯತ್ತ ಸಾಗುತ್ತಿದೆ.
ದೊಡ್ಡ ಪ್ರಮಾಣದ AI ಗೆ ಪರಿಣಾಮಕಾರಿ ಡೇಟಾ ಪ್ರಾತಿನಿಧ್ಯವು ಪ್ರಮುಖವಾಗಿದೆ.
ಡಿಫ್ಯೂಷನ್ ಚಿತ್ರಗಳಿಂದ ಭಾಷಾ ಮಾಡೆಲ್‌ಗಳತ್ತ ವಿಸ್ತರಿಸುತ್ತಿದೆ.

ಮೂಲ (Source): https://dev.to/y_hnhnhan_2f26de65ffcc4/top-ai-papers-on-hugging-face-2026-06-26-197k

ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ (Optional learning community): https://t.me/GyaanSetuAi

Top AI Papers on Hugging Face

Continue reading

Top AI Papers on Hugging Face 2026 06 25

Top AI Papers on Hugging Face

Top AI Papers on Hugging Face

Top AI Papers on Hugging Face

Hugging Face ನಲ್ಲಿನ ಪ್ರಮುಖ AI ಸಂಶೋಧನಾ ಪ್ರಬಂಧಗಳು