𝗔𝗜/𝗠𝗟 𝗥𝗲𝘀𝗲𝗮𝗿𝗰𝗵 𝗗𝗶𝗴𝗲𝘀𝘁 — 𝟮𝟬 𝗝𝘂𝗻, 𝟮𝟬𝟮𝟲

নতুন গবেষণা দেখায় কীভাবে এজেন্টরা তথ্য মনে রাখে এবং কীভাবে মডেলগুলো আরও দক্ষতার সাথে কোড প্রসেস করে।

এজেন্টদের জন্য মেমরি এবং স্টেট (Memory and State for Agents)

এজেন্টদের তাদের চারপাশের জগতকে মনে রাখা প্রয়োজন।

• লিনিয়ার-টেম্পোরাল অ্যাটেনশন (Linear-temporal attention) একটি চলমান ওয়ার্ল্ড মডেল তৈরি করে। এটি এজেন্টদের প্রতিবার সবকিছু পুনরায় গণনা করা থেকে বিরত রাখে। • অ্যাসোসিয়েটিভ গ্রাফ মেমরি (Associative graph memories) পর্যবেক্ষণগুলোকে লিঙ্কযুক্ত নোড হিসেবে সংরক্ষণ করে। এটি দীর্ঘ বিরতির পর এজেন্টদের তথ্য মনে করতে সাহায্য করে। • এই পদ্ধতিগুলো ইনপুট স্ট্রিম বন্ধ এবং শুরু হওয়ার সময় আচরণ স্থিতিশীল রাখার সমস্যাটি সমাধান করে।

উন্নত রিইনফোর্সমেন্ট লার্নিং (Better Reinforcement Learning)

• স্টেপ-লেভেল ক্রেডিট অ্যাসাইনমেন্ট (Step-level credit assignment) এজেন্টদের স্পষ্ট সংকেত দেয়। এটি দেখায় কোন নির্দিষ্ট পদক্ষেপগুলো পুরস্কারের দিকে নিয়ে গেছে। • কোয়ালিটি-অ্যাওয়ার সেলফ-ডিস্টিলেশন (Quality-aware self-distillation) ছোট মডেলগুলোকে সূক্ষ্ম বিবরণ ধরে রাখতে সাহায্য করে। এটি অতিরিক্ত ট্রেনিং ডেটা ছাড়াই রিজনিং বা যুক্তি প্রদানের ক্ষমতা উন্নত করে।

ডিফিউশন এবং টোকেনে দক্ষতা (Efficiency in Diffusion and Tokens)

• অ্যাডাপ্টিভ টোকেন কমপ্রেশন (Adaptive token compression) একটি ছবির অপ্রয়োজনীয় অংশগুলো সরিয়ে ফেলে। এটি মান বজায় রেখে খরচ কমায়। • ফ্রিকোয়েন্সি-অ্যাওয়ার স্পেকট্রাল ফোর্সিং (Frequency-aware spectral forcing) একই স্তরের ডিটেইল পেতে কম প্যারামিটার ব্যবহার করে। • FastContext ফাইল পাথ খুঁজে পেতে একটি ছোট সাব-এজেন্ট ব্যবহার করে। এটি টোকেনের ব্যবহার ৬০% কমায় এবং কোডিং টাস্কে সাফল্যের হার বাড়ায়। • ভিজ্যুয়াল রিপোজিটরি ম্যাপ (Visual repository maps) কোডকে ছবিতে রূপান্তর করে। এটি দীর্ঘ কোডিং কাজের ক্ষেত্রে টোকেনের ব্যবহার ২৬% কমিয়ে দেয়।

কোড এবং মডেলের স্থিতিশীলতা (Code and Model Stability)

• বর্তমান মডেলগুলো নন-পাইথন (non-Python) ভাষার ক্ষেত্রে হিমশিম খায়। কিছু ভাষায় পারফরম্যান্স ৪০% কমে যায়। • নতুন ৪-বিট প্রিট্রেনিং পদ্ধতি ত্রুটি রোধ করতে একটি ইউনিফর্ম গ্রিড ব্যবহার করে। এটি বড় মডেলগুলোকে আরও নির্ভরযোগ্য করে তোলে।

নিরাপত্তা এবং ঝুঁকি (Safety and Risks)

• স্পার্স অটোএনকোডার (Sparse autoencoders) অস্থিতিশীল। র‍্যান্ডম সিডের (random seeds) ওপর ভিত্তি করে ফিচারগুলো পরিবর্তিত হয়। • এআই নিউরনের লক্ষ্যযুক্ত সংশোধনগুলো প্রায়শই ব্যর্থ হয় কারণ ক্ষতিকারক আচরণগুলো পুনরায় দেখা দেয়। • এআই রিভিউয়ারদের ঠকানো সহজ। একটি পেপার দেখতে কেমন তা পরিবর্তন করলে স্বয়ংক্রিয় রিভিউয়ারকে বিভ্রান্ত করা সম্ভব, এমনকি বিষয়বস্তু একই থাকলেও।

Source: https://dev.to/olaughter/aiml-research-digest-jun-20-2026-4neg

Optional learning community: https://t.me/GyaanSetuAi