آینده سیستمهای حافظه در هوش مصنوعی عاملمحور (Agentic AI)
حافظه هوش مصنوعی در حال تغییر است.
سالها بود که حافظه به معنای چپاندن تاریخچه چت در یک پنجره بافت (context window) بود. آن رویکرد دیگر منسوخ شده است. در سال ۲۰۲۶، حافظه بخش اصلی طراحی عاملها (agents) است. این حوزه دارای تحقیقات، بنچمارکها و ریسکهای امنیتی خاص خود است.
اگر عامل میسازید، حافظه تعیین میکند که آیا ابزار شما پس از اولین جلسه کاربردی خواهد بود یا خیر.
روش قدیمی ساده بود اما شکست خورد. توسعهدهندگان پیامهای اخیر را ذخیره (buffer) میکردند و بقیه را خلاصه میکردند. این روش برای چتباتها جواب میداد، اما برای عاملهایی که جریانهای کاری واقعی مانند بازبینی کد یا تحقیق را اجرا میکنند، شکست خورد. آن عاملها نیاز دارند آنچه را که دیروز انجام دادهاند به یاد بیاورند، نه فقط آنچه را که پنج دقیقه پیش اتفاق افتاده است.
حافظه بلندمدتِ مؤثر دارای سه نوع است:
- حافظه اپیزودیک (Episodic memory): تجربیات و نتایج خاص گذشته.
- حافظه معنایی (Semantic memory): حقایق و روابط عمومی.
- حافظه رویهای (Procedural memory): مهارتهای آموختهشده و توالیهای عملیاتی قابل استفاده مجدد.
اکثر سیستمهای امروزی فاقد حافظه رویهای هستند. آنها از طریق جستجوی برداری (vector search) بر حقایق تمرکز میکنند. اما یک عامل تنها زمانی در طول زمان بهتر میشود که بر حافظه رویهای مسلط شود.
معماریها نیز به دو دسته تقسیم میشوند:
- بافت گفتگو (Conversation context): حفظ انسجام در یک تعامل واحد.
- دانش عملیاتی (Operational knowledge): ذخیره دانش پایدار در طول جلسات متعدد.
در این سیستمها، باید بین شباهت برداری (vector similarity) و بازیابی تقویتشده با گراف (graph-augmented retrieval) یکی را انتخاب کنید. حافظه برداری حقایق مشابه را پیدا میکند اما روابط را از دست میدهد. رویکردهای گرافی حقایق را از طریق موجودیتها (entities) و اتصالات پیدا میکنند. بهترین سیستمها اکنون از بازیابی چند-سیگنالی (multi-signal retrieval) استفاده میکنند. این روش شباهت معنایی، کلمات کلیدی و پیوند موجودیتها را با هم ترکیب میکند.
مدلهای جدید مانند Letta با حافظه مانند یک سیستمعامل رفتار میکنند. آنها از یک رویکرد لایهبندی شده استفاده میکنند که در آن حافظه اصلی مانند RAM عمل میکند. این روش بهتر از صرفاً متصل کردن یک پایگاه داده به یک عامل است.
همچنین باید مراقب یک تهدید امنیتی جدید باشید: مسمومسازی حافظه (Memory Poisoning).
تزریق دستور (Prompt injection) با پایان یافتن چت، بازنشانی میشود. اما مسمومسازی حافظه اینگونه نیست. یک مهاجم میتواند تنها یک بار دادههای مخرب را در حافظه بلندمدت یک عامل قرار دهد. سپس این دادهها تمام تعاملات آینده را فاسد میکنند. این اتفاق میتواند روزها بعد رخ دهد. OWASP اکنون مسمومسازی حافظه و بافت (Memory and Context Poisoning) را به عنوان یکی از ریسکهای اصلی فهرست کرده است.
برای دفاع از سیستمهای خود، از این چهار لایه استفاده کنید:
- دادهها را قبل از ورود به سیستم (ingestion) پاکسازی کنید.
- برای هر ورودی، منشأ (provenance) آن را پیوست کنید تا بتوانید منبع آن را ردیابی کنید.
- در طول بازیابی، از وزندهی آگاه از اعتماد (trust-aware weighting) استفاده کنید.
- تغییرات رفتاری (behavioral drift) را نظارت کنید.
با نگاه به آینده، سه روند این حوزه را شکل خواهند داد:
- حافظه چند-عاملی (Multi-agent memory): عاملها نیاز خواهند داشت که حافظه یکدیگر را به اشتراک گذاشته و به آن اعتماد کنند.
- استانداردسازی (Standardization): شاهد پروتکلهایی برای نحوه توصیف آنچه عاملها میدانند خواهیم بود.
- هرس کردن (Pruning): سیستمهای خوب تصمیم میگیرند چه چیزی را فراموش کنند. حافظه نامحدود باعث ایجاد نویز و هزینههای بالا میشود.
حافظه دیگر راه حلی موقت برای پنجرههای بافت کوچک نیست. حافظه همان چیزی است که یک نسخه نمایشی (demo) را از یک سیستم واقعی متمایز میکند. با حافظه به عنوان یک معماری اصلی برخورد کنید، نه به عنوان یک موضوع فرعی.
Source: https://dev.to/xenocoregiger31/the-future-of-agentic-ai-memory-systems-5fdp
Optional learning community: https://t.me/GyaanSetuAi
