𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗚𝘂𝗶𝗱𝗲 𝟮𝟬𝟮𝟲

RAG ایستا (Static RAG) در حال تبدیل شدن به یک نقطه ضعف برای عامل‌های هوش مصنوعی است.

اگر عامل شما تنها به یک vector store متکی باشد، با «تله انجماد دانش» (Knowledge Freeze Trap) مواجه می‌شود. داده‌های شما ۶ تا ۱۸ ماه از واقعیت عقب می‌مانند. عامل شما با اعتماد به نفس بالا، به سوالات با استفاده از داده‌های قدیمی پاسخ خواهد داد.

قابلیت جستجوی وب در Amazon Bedrock AgentCore این وضعیت را تغییر می‌دهد. این قابلیت به عامل‌های شما اجازه می‌دهد داده‌های زنده وب را جستجو کرده و قطعات اطلاعاتی (snippets) ساختاریافته و دارای ارجاع دریافت کنند.

در اینجا نحوه استفاده از آن برای محیط عملیاتی (production) آمده است:

ابزار مناسب برای وظیفه مناسب

جستجوی وب (Web Search) را با ابزار مرورگر (Browser Tool) اشتباه نگیرید.

  • از Web Search برای حقایق استفاده کنید. این ابزار قطعات اطلاعاتی (snippets) را برمی‌گرداند. سریع (380ms p50) و ارزان است.
  • از Browser Tool برای انجام اقدامات استفاده کنید. از آن برای کلیک کردن، پر کردن فرم‌ها یا پیمایش در سایت‌های سنگین استفاده کنید. این ابزار کند است و ۴ تا ۶ برابر توکن بیشتری مصرف می‌کند.

دستاوردهای پیاده‌سازی

ما از این الگو برای یک مشتری در حوزه فین‌تک استفاده کردیم. این نتایج را مشاهده کردیم:

  • تأخیر (Latency) از ۴.۲ ثانیه به ۱.۱ ثانیه کاهش یافت.
  • ما ۳۴۰ دلار در ماه از هزینه‌های محاسباتی بازسازی ایندکس (re-indexing) صرفه‌جویی کردیم.

نکات راه‌اندازی

  1. مجوزهای IAM خود را اصلاح کنید. شما به اکشن agentcore:UseTool نیاز دارید. نبود این مجوز باعث می‌شود ابزار بدون اعلام خطا از کار بیفتد.
  2. نسخه‌ها را ثابت (Pin) نگه دارید. از Boto3 نسخه 1.34.0 یا بالاتر استفاده کنید تا از خطاهای پنهان جلوگیری شود.
  3. هزینه‌های خود را کنترل کنید. مقدار max_results را به جای ۱۰، روی ۳ تنظیم کنید. این کار حجم توکن‌های ورودی را تا ۶۵٪ کاهش می‌دهد.
  4. حلقه‌های خود را محدود کنید. برای جلوگیری از اتمام زمان (timeout)، بیش از ۳ جستجوی وب را پشت سر هم زنجیره نکنید.

استراتژی ترکیبی

بهترین معماری، انتخاب بین Web Search یا RAG نیست؛ بلکه استفاده از هر دو است.

  • از Web Search برای داده‌های عمومی و حساس به زمان استفاده کنید.
  • از RAG برای اسناد اختصاصی و داخلی خود استفاده کنید.

بنچمارک‌های AWS نشان می‌دهند که این رویکرد ترکیبی، توهمات (hallucinations) را تا ۴۰٪ کاهش می‌دهد.

امنیت و اعتماد

دسترسی به وب خطراتی مانند تزریق دستور (prompt injection) را به همراه دارد. AgentCore نتایج را قبل از اینکه مدل آن‌ها را ببیند، پاکسازی (sanitize) می‌کند. همچنین برای محافظت بیشتر، باید از Bedrock Guardrails روی خروجی استفاده کنید.

این تغییر در حال وقوع است. در سال ۲۰۲۶، جستجوی وب لایه اصلی زمینه‌سازی (grounding layer) خواهد بود و RAG ابزاری تخصصی برای داده‌های خصوصی است.

Source: https://dev.to/aarhamforensics_eb3c024eb/amazon-bedrock-agentcore-web-search-production-guide-2026-3cb0

Optional learning community: https://t.me/GyaanSetuAi