آینده سیستم‌های حافظه در هوش مصنوعی عامل‌محور (Agentic AI)

حافظه هوش مصنوعی در حال تغییر است.

سال‌ها بود که حافظه به معنای چپاندن تاریخچه چت در یک پنجره بافت (context window) بود. آن رویکرد دیگر منسوخ شده است. در سال ۲۰۲۶، حافظه بخش اصلی طراحی عامل‌ها (agents) است. این حوزه دارای تحقیقات، بنچمارک‌ها و ریسک‌های امنیتی خاص خود است.

اگر عامل می‌سازید، حافظه تعیین می‌کند که آیا ابزار شما پس از اولین جلسه کاربردی خواهد بود یا خیر.

روش قدیمی ساده بود اما شکست خورد. توسعه‌دهندگان پیام‌های اخیر را ذخیره (buffer) می‌کردند و بقیه را خلاصه می‌کردند. این روش برای چت‌بات‌ها جواب می‌داد، اما برای عامل‌هایی که جریان‌های کاری واقعی مانند بازبینی کد یا تحقیق را اجرا می‌کنند، شکست خورد. آن عامل‌ها نیاز دارند آنچه را که دیروز انجام داده‌اند به یاد بیاورند، نه فقط آنچه را که پنج دقیقه پیش اتفاق افتاده است.

حافظه بلندمدتِ مؤثر دارای سه نوع است:

  • حافظه اپیزودیک (Episodic memory): تجربیات و نتایج خاص گذشته.
  • حافظه معنایی (Semantic memory): حقایق و روابط عمومی.
  • حافظه رویه‌ای (Procedural memory): مهارت‌های آموخته‌شده و توالی‌های عملیاتی قابل استفاده مجدد.

اکثر سیستم‌های امروزی فاقد حافظه رویه‌ای هستند. آن‌ها از طریق جستجوی برداری (vector search) بر حقایق تمرکز می‌کنند. اما یک عامل تنها زمانی در طول زمان بهتر می‌شود که بر حافظه رویه‌ای مسلط شود.

معماری‌ها نیز به دو دسته تقسیم می‌شوند:

  1. بافت گفتگو (Conversation context): حفظ انسجام در یک تعامل واحد.
  2. دانش عملیاتی (Operational knowledge): ذخیره دانش پایدار در طول جلسات متعدد.

در این سیستم‌ها، باید بین شباهت برداری (vector similarity) و بازیابی تقویت‌شده با گراف (graph-augmented retrieval) یکی را انتخاب کنید. حافظه برداری حقایق مشابه را پیدا می‌کند اما روابط را از دست می‌دهد. رویکردهای گرافی حقایق را از طریق موجودیت‌ها (entities) و اتصالات پیدا می‌کنند. بهترین سیستم‌ها اکنون از بازیابی چند-سیگنالی (multi-signal retrieval) استفاده می‌کنند. این روش شباهت معنایی، کلمات کلیدی و پیوند موجودیت‌ها را با هم ترکیب می‌کند.

مدل‌های جدید مانند Letta با حافظه مانند یک سیستم‌عامل رفتار می‌کنند. آن‌ها از یک رویکرد لایه‌بندی شده استفاده می‌کنند که در آن حافظه اصلی مانند RAM عمل می‌کند. این روش بهتر از صرفاً متصل کردن یک پایگاه داده به یک عامل است.

همچنین باید مراقب یک تهدید امنیتی جدید باشید: مسموم‌سازی حافظه (Memory Poisoning).

تزریق دستور (Prompt injection) با پایان یافتن چت، بازنشانی می‌شود. اما مسموم‌سازی حافظه اینگونه نیست. یک مهاجم می‌تواند تنها یک بار داده‌های مخرب را در حافظه بلندمدت یک عامل قرار دهد. سپس این داده‌ها تمام تعاملات آینده را فاسد می‌کنند. این اتفاق می‌تواند روزها بعد رخ دهد. OWASP اکنون مسموم‌سازی حافظه و بافت (Memory and Context Poisoning) را به عنوان یکی از ریسک‌های اصلی فهرست کرده است.

برای دفاع از سیستم‌های خود، از این چهار لایه استفاده کنید:

  • داده‌ها را قبل از ورود به سیستم (ingestion) پاکسازی کنید.
  • برای هر ورودی، منشأ (provenance) آن را پیوست کنید تا بتوانید منبع آن را ردیابی کنید.
  • در طول بازیابی، از وزن‌دهی آگاه از اعتماد (trust-aware weighting) استفاده کنید.
  • تغییرات رفتاری (behavioral drift) را نظارت کنید.

با نگاه به آینده، سه روند این حوزه را شکل خواهند داد:

  • حافظه چند-عاملی (Multi-agent memory): عامل‌ها نیاز خواهند داشت که حافظه یکدیگر را به اشتراک گذاشته و به آن اعتماد کنند.
  • استانداردسازی (Standardization): شاهد پروتکل‌هایی برای نحوه توصیف آنچه عامل‌ها می‌دانند خواهیم بود.
  • هرس کردن (Pruning): سیستم‌های خوب تصمیم می‌گیرند چه چیزی را فراموش کنند. حافظه نامحدود باعث ایجاد نویز و هزینه‌های بالا می‌شود.

حافظه دیگر راه حلی موقت برای پنجره‌های بافت کوچک نیست. حافظه همان چیزی است که یک نسخه نمایشی (demo) را از یک سیستم واقعی متمایز می‌کند. با حافظه به عنوان یک معماری اصلی برخورد کنید، نه به عنوان یک موضوع فرعی.

Source: https://dev.to/xenocoregiger31/the-future-of-agentic-ai-memory-systems-5fdp

Optional learning community: https://t.me/GyaanSetuAi