𝗔𝗜/𝗠𝗟 ਰਿਸਰਚ ਡਾਇਜੈਸਟ — 20 ਜੂਨ, 2026
ਨਵੀਂ ਖੋਜ ਦਰਸਾਉਂਦੀ ਹੈ ਕਿ ਏਜੰਟ ਚੀਜ਼ਾਂ ਨੂੰ ਕਿਵੇਂ ਯਾਦ ਰੱਖਦੇ ਹਨ ਅਤੇ ਮਾਡਲ ਕੋਡ ਨੂੰ ਵਧੇਰੇ ਕੁਸ਼ਲਤਾ ਨਾਲ ਕਿਵੇਂ ਪ੍ਰੋਸੈਸ ਕਰਦੇ ਹਨ।
ਏਜੰਟਾਂ ਲਈ ਮੈਮੋਰੀ ਅਤੇ ਸਟੇਟ (Memory and State for Agents)
ਏਜੰਟਾਂ ਨੂੰ ਆਪਣੇ ਆਲੇ-ਦੁਆਲੇ ਦੀ ਦੁਨੀਆ ਨੂੰ ਯਾਦ ਰੱਖਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ।
• ਲੀਨੀਅਰ-ਟੈਂਪੋਰਲ ਅਟੈਂਸ਼ਨ (Linear-temporal attention) ਇੱਕ ਚਲਦੇ ਹੋਏ ਵਿਸ਼ਵ ਮਾਡਲ ਦਾ ਨਿਰਮਾਣ ਕਰਦੀ ਹੈ। ਇਹ ਏਜੰਟਾਂ ਨੂੰ ਹਰ ਵਾਰ ਸਭ ਕੁਝ ਦੁਬਾਰਾ ਗਣਨਾ ਕਰਨ ਤੋਂ ਰੋਕਦੀ ਹੈ। • ਐਸੋਸੀਏਟਿਵ ਗ੍ਰਾਫ ਮੈਮੋਰੀਜ਼ (Associative graph memories) ਨਿਰੀਖਣਾਂ ਨੂੰ ਲਿੰਕ ਕੀਤੇ ਨੋਡਾਂ ਵਜੋਂ ਸਟੋਰ ਕਰਦੀਆਂ ਹਨ। ਇਹ ਏਜੰਟਾਂ ਨੂੰ ਲੰਬੇ ਸਮੇਂ ਦੇ ਅੰਤਰਾਂ ਤੋਂ ਬਾਅਦ ਜਾਣਕਾਰੀ ਯਾਦ ਕਰਨ ਵਿੱਚ ਮਦਦ ਕਰਦੀ ਹੈ। • ਇਹ ਤਰੀਕੇ ਇਨਪੁਟ ਸਟ੍ਰੀਮਾਂ ਦੇ ਰੁਕਣ ਅਤੇ ਸ਼ੁਰੂ ਹੋਣ ਵੇਲੇ ਵਿਵਹਾਰ ਨੂੰ ਸਥਿਰ ਰੱਖਣ ਦੀ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਦੇ ਹਨ।
ਬਿਹਤਰ ਰੀਇਨਫੋਰਸਮੈਂਟ ਲਰਨਿੰਗ (Better Reinforcement Learning)
• ਸਟੈਪ-ਲੇਵਲ ਕ੍ਰੈਡਿਟ ਅਸਾਈਨਮੈਂਟ (Step-level credit assignment) ਏਜੰਟਾਂ ਨੂੰ ਸਪੱਸ਼ਟ ਸੰਕੇਤ ਦਿੰਦਾ ਹੈ। ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਕਿਹੜੀਆਂ ਖਾਸ ਕਾਰਵਾਈਆਂ ਇਨਾਮ (reward) ਵੱਲ ਲੈ ਕੇ ਗਈਆਂ। • ਕੁਆਲਿਟੀ-ਅਵੇਅਰ ਸੈਲਫ-ਡਿਸਟੀਲੇਸ਼ਨ (Quality-aware self-distillation) ਛੋਟੇ ਮਾਡਲਾਂ ਨੂੰ ਬਾਰੀਕ ਵੇਰਵੇ ਬਣਾਈ ਰੱਖਣ ਵਿੱਚ ਮਦਦ ਕਰਦਾ ਹੈ। ਇਹ ਵਧੇਰੇ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਦੀ ਲੋੜ ਤੋਂ ਬਿਨਾਂ ਤਰਕ ਸ਼ਕਤੀ (reasoning) ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ।
ਡਿਫਿਊਜ਼ਨ ਅਤੇ ਟੋਕਨਾਂ ਵਿੱਚ ਕੁਸ਼ਲਤਾ (Efficiency in Diffusion and Tokens)
• ਅਡੈਪਟਿਵ ਟੋਕਨ ਕੰਪਰੈਸ਼ਨ (Adaptive token compression) ਇੱਕ ਤਸਵੀਰ ਦੇ ਬੇਕਾਰ ਹਿੱਸਿਆਂ ਨੂੰ ਹਟਾ ਦਿੰਦਾ ਹੈ। ਇਹ ਗੁਣਵੱਤਾ ਨੂੰ ਉੱਚਾ ਰੱਖਦੇ ਹੋਏ ਲਾਗਤ ਨੂੰ ਘਟਾਉਂਦਾ ਹੈ। • ਫ੍ਰੀਕੁਐਂਸੀ-ਅਵੇਅਰ ਸਪੈਕਟ੍ਰਲ ਫੋਰਸਿੰਗ (Frequency-aware spectral forcing) ਉਹੀ ਵੇਰਵੇ ਪ੍ਰਾਪਤ ਕਰਨ ਲਈ ਘੱਟ ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। • FastContext ਫਾਈਲ ਪਾਥ ਲੱਭਣ ਲਈ ਇੱਕ ਛੋਟੇ ਸਬ-ਏਜੰਟ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। ਇਹ ਟੋਕਨ ਦੀ ਵਰਤੋਂ ਨੂੰ 60% ਤੱਕ ਘਟਾਉਂਦਾ ਹੈ ਅਤੇ ਕੋਡਿੰਗ ਕ