𝗔𝗜/𝗠𝗟 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗗𝗶𝗴𝗲𝘀𝘁 — 𝗝𝘂𝗻 𝟮𝟬, 𝟮𝟬𝟮𝟲

Translated for your language. Read the original.

AI-assisted draft.

𝗔𝗜/𝗠𝗟 ਰਿਸਰਚ ਡਾਇਜੈਸਟ — 20 ਜੂਨ, 2026

ਨਵੀਂ ਖੋਜ ਦਰਸਾਉਂਦੀ ਹੈ ਕਿ ਏਜੰਟ ਚੀਜ਼ਾਂ ਨੂੰ ਕਿਵੇਂ ਯਾਦ ਰੱਖਦੇ ਹਨ ਅਤੇ ਮਾਡਲ ਕੋਡ ਨੂੰ ਵਧੇਰੇ ਕੁਸ਼ਲਤਾ ਨਾਲ ਕਿਵੇਂ ਪ੍ਰੋਸੈਸ ਕਰਦੇ ਹਨ।

ਏਜੰਟਾਂ ਲਈ ਮੈਮੋਰੀ ਅਤੇ ਸਟੇਟ (Memory and State for Agents)

ਏਜੰਟਾਂ ਨੂੰ ਆਪਣੇ ਆਲੇ-ਦੁਆਲੇ ਦੀ ਦੁਨੀਆ ਨੂੰ ਯਾਦ ਰੱਖਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।

• ਲੀਨੀਅਰ-ਟੈਂਪੋਰਲ ਅਟੈਂਸ਼ਨ (Linear-temporal attention) ਇੱਕ ਚਲਦੇ ਹੋਏ ਵਿਸ਼ਵ ਮਾਡਲ ਦਾ ਨਿਰਮਾਣ ਕਰਦੀ ਹੈ। ਇਹ ਏਜੰਟਾਂ ਨੂੰ ਹਰ ਵਾਰ ਸਭ ਕੁਝ ਦੁਬਾਰਾ ਗਣਨਾ ਕਰਨ ਤੋਂ ਰੋਕਦੀ ਹੈ। • ਐਸੋਸੀਏਟਿਵ ਗ੍ਰਾਫ ਮੈਮੋਰੀਜ਼ (Associative graph memories) ਨਿਰੀਖਣਾਂ ਨੂੰ ਲਿੰਕ ਕੀਤੇ ਨੋਡਾਂ ਵਜੋਂ ਸਟੋਰ ਕਰਦੀਆਂ ਹਨ। ਇਹ ਏਜੰਟਾਂ ਨੂੰ ਲੰਬੇ ਸਮੇਂ ਦੇ ਅੰਤਰਾਂ ਤੋਂ ਬਾਅਦ ਜਾਣਕਾਰੀ ਯਾਦ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ। • ਇਹ ਤਰੀਕੇ ਇਨਪੁਟ ਸਟ੍ਰੀਮਾਂ ਦੇ ਰੁਕਣ ਅਤੇ ਸ਼ੁਰੂ ਹੋਣ ਵੇਲੇ ਵਿਵਹਾਰ ਨੂੰ ਸਥਿਰ ਰੱਖਣ ਦੀ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਦੇ ਹਨ।

ਬਿਹਤਰ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ (Better Reinforcement Learning)

• ਸਟੈਪ-ਲੇਵਲ ਕ੍ਰੈਡਿਟ ਅਸਾਈਨਮੈਂਟ (Step-level credit assignment) ਏਜੰਟਾਂ ਨੂੰ ਸਪੱਸ਼ਟ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ। ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਕਿਹੜੀਆਂ ਖਾਸ ਕਾਰਵਾਈਆਂ ਇਨਾਮ (reward) ਵੱਲ ਲੈ ਕੇ ਗਈਆਂ। • ਕੁਆਲਿਟੀ-ਅਵੇਅਰ ਸੈਲਫ-ਡਿਸਟੀਲੇਸ਼ਨ (Quality-aware self-distillation) ਛੋਟੇ ਮਾਡਲਾਂ ਨੂੰ ਬਾਰੀਕ ਵੇਰਵੇ ਬਣਾਈ ਰੱਖਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਇਹ ਵਧੇਰੇ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ ਤਰਕ ਸ਼ਕਤੀ (reasoning) ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ।

ਡਿਫਿਊਜ਼ਨ ਅਤੇ ਟੋਕਨਾਂ ਵਿੱਚ ਕੁਸ਼ਲਤਾ (Efficiency in Diffusion and Tokens)

• ਅਡੈਪਟਿਵ ਟੋਕਨ ਕੰਪਰੈਸ਼ਨ (Adaptive token compression) ਇੱਕ ਤਸਵੀਰ ਦੇ ਬੇਕਾਰ ਹਿੱਸਿਆਂ ਨੂੰ ਹਟਾ ਦਿੰਦਾ ਹੈ। ਇਹ ਗੁਣਵੱਤਾ ਨੂੰ ਉੱਚਾ ਰੱਖਦੇ ਹੋਏ ਲਾਗਤ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ। • ਫ੍ਰੀਕੁਐਂਸੀ-ਅਵੇਅਰ ਸਪੈਕਟ੍ਰਲ ਫੋਰਸਿੰਗ (Frequency-aware spectral forcing) ਉਹੀ ਵੇਰਵੇ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਘੱਟ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। • FastContext ਫਾਈਲ ਪਾਥ ਲੱਭਣ ਲਈ ਇੱਕ ਛੋਟੇ ਸਬ-ਏਜੰਟ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਹ ਟੋਕਨ ਦੀ ਵਰਤੋਂ ਨੂੰ 60% ਤੱਕ ਘਟਾਉਂਦਾ ਹੈ ਅਤੇ ਕੋਡਿੰਗ ਕ

𝗔𝗜/𝗠𝗟 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗗𝗶𝗴𝗲𝘀𝘁 — 𝗝𝘂𝗻 𝟮𝟬, 𝟮𝟬𝟮𝟲

Continue reading

𝗪𝗼𝗿𝗹𝗱 𝗠𝗼𝗱𝗲𝗹𝘀 𝗔𝗻𝗱 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗶𝗻 𝟮𝟬𝟮𝟲

𝗔𝗱𝗱𝗶𝗻𝗴 𝗠𝗲𝗺𝗼𝗿𝘆 𝘁𝗼 𝘁𝗵𝗲 𝗔𝗴𝗲𝗻𝘁

𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗗𝗼𝗻'𝘁 𝗡𝗲𝗲𝗱 𝗠𝗼𝗿𝗲 𝗠𝗲𝗺𝗼𝗿𝘆. 𝗧𝗵𝗲𝘆 𝗡𝗲𝗲𝗱 𝗚𝗼𝘃𝗲𝗿𝗻𝗲𝗱 𝗥𝗲𝗰𝗮𝗹𝗹.

𝗥𝗡𝗡𝗦, 𝗧𝗿𝗮𝗻𝘀𝗳𝗼𝗿𝗺𝗲𝗿𝘀, 𝗮𝗻𝗱 𝗦𝘁𝗮𝘁𝗲 𝗦𝗽𝗮𝗰𝗲 𝗠𝗼𝗱𝗲𝗹𝘀

𝗚𝗶𝘃𝗶𝗻𝗴 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔 𝗣𝗲𝗿𝗺𝗮𝗻𝗲𝗻𝘁 𝗠𝗲𝗺𝗼𝗿𝘆