𝗔𝗜/𝗠𝗟 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗗𝗶𝗴𝗲𝘀𝘁 — 𝗝𝘂𝗻 𝟮𝟬, 𝟮𝟬𝟮𝟲

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorial5 ಗಂಟೆಗಳ ಹಿಂದೆ1min read

ಏಜೆಂಟ್‌ಗಳು ವಿಷಯಗಳನ್ನು ಹೇಗೆ ನೆನಪಿಟ್ಟುಕೊಳ್ಳುತ್ತವೆ ಮತ್ತು ಮಾಡೆಲ್‌ಗಳು ಕೋಡ್ ಅನ್ನು ಹೇಗೆ ಹೆಚ್ಚು ಪರಿಣಾಮಕಾರಿಯಾಗಿ ಪ್ರಕ್ರಿಯೆಗೊಳಿಸುತ್ತವೆ ಎಂಬುದನ್ನು ಹೊಸ ಸಂಶೋಧನೆಯು ತೋರಿಸುತ್ತದೆ.

ಏಜೆಂಟ್‌ಗಳಿಗಾಗಿ ಮೆಮೊರಿ ಮತ್ತು ಸ್ಟೇಟ್ (Memory and State for Agents)

ಏಜೆಂಟ್‌ಗಳು ತಮ್ಮ ಸುತ್ತಲಿನ ಪ್ರಪಂಚವನ್ನು ನೆನಪಿಟ್ಟುಕೊಳ್ಳುವ ಅಗತ್ಯವಿದೆ.

• ಲೀನಿಯರ್-ಟೆಂಪೊರಲ್ ಅಟೆನ್ಷನ್ (Linear-temporal attention) ಒಂದು ಚಾಲನೆಯಲ್ಲಿರುವ ವರ್ಲ್ಡ್ ಮಾಡೆಲ್ ಅನ್ನು ನಿರ್ಮಿಸುತ್ತದೆ. ಇದು ಏಜೆಂಟ್‌ಗಳು ಪ್ರತಿ ಬಾರಿಯೂ ಎಲ್ಲವನ್ನೂ ಮರು-ಲೆಕ್ಕಾಚಾರ ಮಾಡುವುದನ್ನು ತಡೆಯುತ್ತದೆ. • ಅಸೋಸಿಯೇಟಿವ್ ಗ್ರಾಫ್ ಮೆಮೊರಿಗಳು (Associative graph memories) ವೀಕ್ಷಣೆಗಳನ್ನು ಲಿಂಕ್ ಮಾಡಲಾದ ನೋಡ್‌ಗಳಾಗಿ ಸಂಗ್ರಹಿಸುತ್ತವೆ. ಇದು ದೀರ್ಘ ಅವಧಿಯ ನಂತರವೂ ಏಜೆಂಟ್‌ಗಳು ಮಾಹಿತಿಯನ್ನು ನೆನಪಿಸಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. • ಇನ್‌ಪುಟ್ ಸ್ಟ್ರೀಮ್‌ಗಳು ನಿಂತು ಮತ್ತು ಪ್ರಾರಂಭವಾಗುವಾಗ ವರ್ತನೆಯನ್ನು ಸ್ಥಿರವಾಗಿಡುವ ಸಮಸ್ಯೆಯನ್ನು ಈ ವಿಧಾನಗಳು ಪರಿಹರಿಸುತ್ತವೆ.

ಉತ್ತಮ ರಿಇನ್‌ಫೋರ್ಸ್‌ಮೆಂಟ್ ಲರ್ನಿಂಗ್ (Better Reinforcement Learning)

• ಸ್ಟೆಪ್-ಲೆವೆಲ್ ಕ್ರೆಡಿಟ್ ಅಸೈನ್‌ಮೆಂಟ್ ಏಜೆಂಟ್‌ಗಳಿಗೆ ಸ್ಪಷ್ಟ ಸಂಕೇತಗಳನ್ನು ನೀಡುತ್ತದೆ. ಯಾವ ನಿರ್ದಿಷ್ಟ ಕ್ರಮಗಳು ಬಹುಮಾನಕ್ಕೆ ಕಾರಣವಾದವು ಎಂಬುದನ್ನು ಇದು ತೋರಿಸುತ್ತದೆ. • ಕ್ವಾಲಿಟಿ-ಅವೇರ್ ಸೆಲ್ಫ್-ಡಿಸ್ಟಿಲೇಷನ್ (Quality-aware self-distillation) ಸಣ್ಣ ಮಾಡೆಲ್‌ಗಳು ಸೂಕ್ಷ್ಮ ವಿವರಗಳನ್ನು ಉಳಿಸಿಕೊಳ್ಳಲು ಸಹಾಯ ಮಾಡುತ್ತದೆ. ಇದು ಹೆಚ್ಚಿನ ತರಬೇತಿ ಡೇಟಾದ ಅಗತ್ಯವಿಲ್ಲದೆ ತರ್ಕಬದ್ಧತೆಯನ್ನು ಸುಧಾರಿಸುತ್ತದೆ.

ಡಿಫ್ಯೂಷನ್ ಮತ್ತು ಟೋಕನ್‌ಗಳಲ್ಲಿನ ದಕ್ಷತೆ (Efficiency in Diffusion and Tokens)

• ಅಡಾಪ್ಟಿವ್ ಟೋಕನ್ ಕಂಪ್ರೆಷನ್ ಚಿತ್ರದ ಅನಗತ್ಯ ಭಾಗಗಳನ್ನು ತೆಗೆದುಹಾಕುತ್ತದೆ. ಇದು ಗುಣಮಟ್ಟವನ್ನು ಎತ್ತಿ ಹಿಡಿಯುತ್ತಲೇ ವೆಚ್ಚವನ್ನು ಕಡಿಮೆ ಮಾಡುತ್ತದೆ. • ಫ್ರೀಕ್ವೆನ್ಸಿ-ಅವೇರ್ ಸ್ಪೆಕ್ಟ್ರಲ್ ಫೋರ್ಸಿಂಗ್ ಒಂದೇ ಮಟ್ಟದ ವಿವರವನ್ನು ತಲುಪಲು ಕಡಿಮೆ ಪ್ಯಾರಾಮೀಟರ್‌ಗಳನ್ನು ಬಳಸುತ್ತದೆ. • FastContext ಫೈಲ್ ಪಾತ್‌ಗಳನ್ನು ಹುಡುಕಲು ಸಣ್ಣ ಸಬ್-ಏಜೆಂಟ್ ಅನ್ನು ಬಳಸುತ್ತದೆ. ಇದು ಟೋಕನ್ ಬಳಕೆಯನ್ನು 60% ಕಡಿಮೆ ಮಾಡುತ್ತದೆ ಮತ್ತು ಕೋಡಿಂಗ್ ಕಾರ್ಯಗಳಲ್ಲಿ ಯಶಸ್ಸನ್ನು ಸುಧಾರಿಸುತ್ತದೆ. • ವಿಶುವಲ್ ರೆಪೊಸಿಟರಿ ಮ್ಯಾಪ್‌ಗಳು ಕೋಡ್ ಅನ್ನು ಚಿತ್ರಗಳಾಗಿ ಪರಿವರ್ತಿಸುತ್ತವೆ. ಇದು ದೀರ್ಘ ಕೋಡ್ ಕಾರ್ಯಗಳಿಗಾಗಿ ಟೋಕನ್ ಬಳಕೆಯನ್ನು 26% ಕಡಿಮೆ ಮಾಡುತ್ತದೆ.

ಕೋಡ್ ಮತ್ತು ಮಾಡೆಲ್ ಸ್ಥಿರತೆ (Code and Model Stability)

• ಪ್ರಸ್ತುತ ಮಾಡೆಲ್‌ಗಳು ನಾನ್-ಪೈಥಾನ್ (non-Python) ಭಾಷೆಗಳೊಂದಿಗೆ ಹೆಣಗಾಡುತ್ತಿವೆ. ಕೆಲವು ಭಾಷೆಗಳಲ್ಲಿ ಕಾರ್ಯಕ್ಷಮತೆಯು 40% ರಷ್ಟು ಕುಸಿಯುತ್ತದೆ. • ಹೊಸ 4-ಬಿಟ್ ಪ್ರಿ-ಟ್ರೈನಿಂಗ್ ವಿಧಾನಗಳು ದೋಷಗಳನ್ನು ತಡೆಯಲು ಸಮಾನವಾದ ಗ್ರಿಡ್ ಅನ್ನು ಬಳಸುತ್ತವೆ. ಇದು ದೊಡ್ಡ ಮಾಡೆಲ್‌ಗಳನ್ನು ಹೆಚ್ಚು ವಿಶ್ವಾಸಾರ್ಹವಾಗಿಸುತ್ತದೆ.

ಸುರಕ್ಷತೆ ಮತ್ತು ಅಪಾಯಗಳು (Safety and Risks)

• ಸ್ಪಾರ್ಸ್ ಆಟೋಎನ್‌ಕೋಡರ್‌ಗಳು (Sparse autoencoders) ಅಸ್ಥಿರವಾಗಿವೆ. ರ್ಯಾಂಡಮ್ ಸೀಡ್‌ಗಳ ಆಧಾರದ ಮೇಲೆ ಫೀಚರ್‌ಗಳು ಬದಲಾಗುತ್ತವೆ. • AI ನ್ಯೂರಾನ್‌ಗಳಿಗೆ ಉದ್ದೇಶಿತ ಸರಿಪಡಿಸುವಿಕೆಗಳು (Targeted fixes) ಹೆಚ್ಚಾಗಿ ವಿಫಲವಾಗುತ್ತವೆ ಏಕೆಂದರೆ ಹಾನಿಕಾರಕ ವರ್ತನೆಗಳು ಮತ್ತೆ ಕಾಣಿಸಿಕೊಳ್ಳುತ್ತವೆ. • AI ವಿಮರ್ಶಕರನ್ನು (AI reviewers) ವಂಚಿಸುವುದು ಸುಲಭ. ವಿಷಯವು ಒಂದೇ ಆಗಿದ್ದರೂ, ಪೇಪರ್‌ನ ನೋಟವನ್ನು ಬದಲಾಯಿಸುವುದರಿಂದ ಸ್ವಯಂಚಾಲಿತ ವಿಮರ್ಶಕನನ್ನು ಮರುಳು ಮಾಡಬಹುದು.

Source: https://dev.to/olaughter/aiml-research-digest-jun-20-2026-4neg

Optional learning community: https://t.me/GyaanSetuAi

𝗔𝗜/𝗠𝗟 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗗𝗶𝗴𝗲𝘀𝘁 — 𝗝𝘂𝗻 𝟮𝟬, 𝟮𝟬𝟮𝟲

Continue reading

𝗪𝗼𝗿𝗹𝗱 𝗠𝗼𝗱𝗲𝗹𝘀 𝗔𝗻𝗱 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗶𝗻 𝟮𝟬𝟮𝟲

𝗔𝗱𝗱𝗶𝗻𝗴 𝗠𝗲𝗺𝗼𝗿𝘆 𝘁𝗼 𝘁𝗵𝗲 𝗔𝗴𝗲𝗻𝘁

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗗𝗼𝗻'𝘁 𝗡𝗲𝗲𝗱 𝗠𝗼𝗿𝗲 𝗠𝗲𝗺𝗼𝗿𝘆. 𝗧𝗵𝗲𝘆 𝗡𝗲𝗲𝗱 𝗚𝗼𝘃𝗲𝗿𝗻𝗲𝗱 𝗥𝗲𝗰𝗮𝗹𝗹.

𝗥𝗡𝗡𝗦, 𝗧𝗿𝗮𝗻𝘀𝗳𝗼𝗿𝗺𝗲𝗿𝘀, 𝗮𝗻𝗱 𝗦𝘁𝗮𝘁𝗲 𝗦𝗽𝗮𝗰𝗲 𝗠𝗼𝗱𝗲𝗹𝘀

ಎಐ ಏಜೆಂಟ್‌ಗಳಿಗೆ ಶಾಶ್ವತ ನೆನಪನ್ನು ನೀಡುವುದು