এজেন্টিক এআই মেমরি সিস্টেমের ভবিষ্যৎ

এআই মেমরি পরিবর্তিত হচ্ছে।

বছরের পর বছর ধরে, মেমরি মানে ছিল চ্যাট হিস্ট্রিকে একটি কনটেক্সট উইন্ডোর (context window) মধ্যে ঠাসা। সেই পদ্ধতিটি এখন মৃত। ২০২৬ সালে, মেমরি হলো এজেন্ট ডিজাইনের একটি মূল অংশ। এর নিজস্ব গবেষণা, বেঞ্চমার্ক এবং নিরাপত্তা ঝুঁকি রয়েছে।

আপনি যদি এজেন্ট তৈরি করেন, তবে মেমরি নির্ধারণ করে যে আপনার টুলটি প্রথম সেশনের পরেও কার্যকর হবে কি না।

পুরানো পদ্ধতিটি সহজ ছিল কিন্তু ব্যর্থ হয়েছে। ডেভেলপাররা সাম্প্রতিক মেসেজগুলো বাফার করতেন এবং বাকিগুলো সারসংক্ষেপ (summarize) করতেন। এটি চ্যাটবটের জন্য কাজ করত। কিন্তু কোড রিভিউ বা গবেষণার মতো বাস্তব ওয়ার্কফ্লো পরিচালনাকারী এজেন্টদের ক্ষেত্রে এটি ব্যর্থ হয়েছে। সেই এজেন্টদের কেবল পাঁচ মিনিট আগের নয়, বরং গতকাল তারা কী করেছিল তাও মনে রাখা প্রয়োজন।

কার্যকর দীর্ঘমেয়াদী মেমরির তিনটি ধরন রয়েছে:

  • এপিসোডিক মেমরি (Episodic memory): নির্দিষ্ট অতীত অভিজ্ঞতা এবং ফলাফল।
  • সিম্যান্টিক মেমরি (Semantic memory): সাধারণ তথ্য এবং সম্পর্ক।
  • প্রসিডিউরাল মেমরি (Procedural memory): শেখা দক্ষতা এবং পুনরায় ব্যবহারযোগ্য কাজের ধারা (action sequences)।

বর্তমান সময়ের বেশিরভাগ সিস্টেমের প্রসিডিউরাল মেমরির অভাব রয়েছে। তারা ভেক্টর সার্চের মাধ্যমে তথ্যের ওপর গুরুত্ব দেয়। কিন্তু একটি এজেন্ট তখনই সময়ের সাথে সাথে উন্নত হয় যদি সে প্রসিডিউরাল মেমরিতে দক্ষতা অর্জন করে।

আর্কিটেকচারগুলোও এখন দুটি ভাগে বিভক্ত হচ্ছে:

১. কথোপকথনের কনটেক্সট (Conversation context): একটি একক মিথস্ক্রিয়াকে সুসংগত রাখা। ২. অপারেশনাল নলেজ (Operational knowledge): অনেকগুলো সেশনের মধ্যে স্থায়ী জ্ঞান সংরক্ষণ করা।

এই সিস্টেমগুলোর মধ্যে আপনাকে ভেক্টর সিমিলারিটি (vector similarity) এবং গ্রাফ-অগমেন্টেড রিট্রিভাল (graph-augmented retrieval)-এর মধ্যে একটি বেছে নিতে হবে। ভেক্টর মেমরি একই ধরণের তথ্য খুঁজে পায় কিন্তু সম্পর্কগুলো মিস করে। গ্রাফ পদ্ধতিগুলো এনটিটি (entities) এবং সংযোগের মাধ্যমে তথ্য খুঁজে পায়। সেরা সিস্টেমগুলো এখন মাল্টি-সিগন্যাল রিট্রিভাল (multi-signal retrieval) ব্যবহার করে। এটি সিম্যান্টিক সিমিলারিটি, কিওয়ার্ড এবং এনটিটি লিঙ্কিং-এর সমন্বয় ঘটায়।

Letta-এর মতো নতুন মডেলগুলো মেমরিকে একটি অপারেটিং সিস্টেমের মতো বিবেচনা করে। তারা একটি স্তরভিত্তিক (tiered) পদ্ধতি ব্যবহার করে যেখানে কোর মেমরি র‍্যামের (RAM) মতো কাজ করে। এটি কেবল একটি এজেন্টের সাথে একটি ডেটাবেস যুক্ত করার চেয়ে অনেক উন্নত।

আপনাকে একটি নতুন নিরাপত্তা হুমকির বিষয়েও সতর্ক থাকতে হবে: মেমরি পয়জনিং (Memory Poisoning)।

প্রম্পট ইনজেকশন (Prompt injection) চ্যাট শেষ হলে রিসেট হয়ে যায়। কিন্তু মেমরি পয়জনিং হয় না। একজন আক্রমণকারী একবার একটি এজেন্টের লং-টার্ম স্টোরে ভুল তথ্য ঢুকিয়ে দিতে পারে। এরপর এটি প্রতিটি ভবিষ্যৎ মিথস্ক্রিয়াকে নষ্ট করে দেয়। এটি কয়েক দিন পরেও ঘটতে পারে। OWASP এখন মেমরি এবং কনটেক্সট পয়জনিং-কে একটি শীর্ষ ঝুঁকি হিসেবে তালিকাভুক্ত করেছে।

আপনার সিস্টেম রক্ষা করতে এই চারটি স্তর ব্যবহার করুন:

  • ইনজেশনের (ingestion) আগে ডেটা স্যানিটাইজ করুন।
  • প্রতিটি এন্ট্রির উৎস ট্র্যাক করার জন্য তার প্রোভেন্যান্স (provenance) যুক্ত করুন।
  • রিট্রিভালের সময় ট্রাস্ট-অ্যাওয়ার ওয়েটিং (trust-aware weighting) ব্যবহার করুন।
  • বিহেভিয়ারাল ড্রিফট (behavioral drift) মনিটর করুন।

ভবিষ্যতের দিকে তাকালে, তিনটি প্রবণতা এই ক্ষেত্রটিকে রূপ দেবে:

  • মাল্টি-এজেন্ট মেমরি (Multi-agent memory): এজেন্টদের একে অপরের মেমরি শেয়ার করা এবং বিশ্বাস করার প্রয়োজন হবে।
  • স্ট্যান্ডার্ডাইজেশন (Standardization): এজেন্টরা কী জানে তা বর্ণনা করার জন্য আমরা বিভিন্ন প্রোটোকল দেখতে পাব।
  • প্রুনিং (Pruning): ভালো সিস্টেমগুলো সিদ্ধান্ত নিতে পারবে কী ভুলে যেতে হবে। সীমাহীন মেমরি নয়েজ এবং উচ্চ খরচ তৈরি করে।

মেমরি এখন আর ছোট কনটেক্সট উইন্ডোর জন্য কোনো বিকল্প সমাধান নয়। এটিই একটি ডেমো এবং একটি বাস্তব সিস্টেমের মধ্যে পার্থক্য তৈরি করে। মেমরিকে একটি afterthought বা afterthought হিসেবে নয়, বরং মূল আর্কিটেকচার হিসেবে বিবেচনা করুন।

Source: https://dev.to/xenocoregiger31/the-future-of-agentic-ai-memory-systems-5fdp

Optional learning community: https://t.me/GyaanSetuAi