𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗴𝗲𝗻𝘁𝘀

आपका AI एजेंट मतिभ्रम (hallucinating) नहीं कर रहा है। वह पुराने तथ्यों को दोहरा रहा है।

अधिकांश टीमें ऐसे एजेंट बनाती हैं जो डेमो में तो काम करते हैं लेकिन प्रोडक्शन में विफल हो जाते हैं। वे पुराने ट्रेनिंग डेटा या तीसरे पक्ष (third-party) के सर्च API पर निर्भर होते हैं जो निजी डेटा लीक कर सकते हैं।

Amazon Bedrock AgentCore Web Search वेब रिट्रीवल (web retrieval) को आपके AWS बाउंड्री के भीतर रखकर इस समस्या का समाधान करता है। यह केवल एक टूल नहीं, बल्कि एक इंफ्रास्ट्रक्चर है।

अपने एजेंट्स को सटीक और सुरक्षित रखने के लिए इन 7 डिप्लॉयमेंट गलतियों से बचें:

    1. वेक्टर डेटाबेस को बदलना (Replacing Vector Databases) वेब सर्च आपके निजी डेटा को नहीं खोज सकता। यह केवल सार्वजनिक जानकारी ही खोज पाता है। आंतरिक ज्ञान (internal knowledge) के लिए वेक्टर डेटाबेस का उपयोग करें और रियल-टाइम समाचारों के लिए AgentCore का उपयोग करें।
    1. स्टैटिक सोर्स सिलेक्शन (Static Source Selection) हर क्वेरी के लिए वेब सर्च चालू न करें। इससे पैसा बर्बाद होता है और लेटेंसी (latency) बढ़ती है। क्वेरी को रूट करने के लिए Claude Haiku जैसे लाइटवेट क्लासिफायर का उपयोग करें। वेब का उपयोग तभी करें जब आपको ताज़ा डेटा की आवश्यकता हो।
    1. ढीली IAM अनुमतियाँ (Loose IAM Permissions) मैनेज्ड होने का मतलब सुरक्षित होना नहीं है। वाइल्डकार्ड अनुमतियों (wildcard permissions) का उपयोग न करें। अनियंत्रित लागत को रोकने के लिए अपने IAM रोल्स को विशिष्ट एजेंट ARNs तक सीमित रखें।
    1. सोर्स अथॉरिटी की अनदेखी करना (Ignoring Source Authority) वेब सर्च किसी आधिकारिक दस्तावेज़ के बजाय एक रैंडम ब्लॉग खोज सकता है। डोमेन अलालिस्ट (allowlist) बनाने के लिए Bedrock Guardrails का उपयोग करें। अपने एजेंट को साइटेशन (citations) प्रदान करने के लिए बाध्य करें।
    1. अनुक्रमिक रिट्रीवल (Sequential Retrieval) वेब सर्च से 800ms से 1.4s तक की लेटेंसी बढ़ जाती है। यदि आप रीजनिंग (reasoning) करने से पहले सर्च पूरा होने का इंतज़ार करते हैं, तो आपका एजेंट धीमा महसूस होगा। डेटा को समानांतर (parallel) रूप से प्राप्त करने के लिए async पैटर्न का उपयोग करें।
    1. ड्रिफ्ट (Drift) की निगरानी करने में विफलता दुनिया बदलने के साथ सटीकता कम हो जाती है। CloudWatch में अपने रिट्रीवल सोर्स और साइटेशन डोमेन को ट्रैक करें। ग्राहकों के अनुभव करने से पहले गुणवत्ता में गिरावट को पकड़ने के लिए अपने मॉडल्स का मासिक परीक्षण करें।
    1. अनबाउंडेड सर्च लूप्स (Unbounded Search Loops) मल्टी-एजेंट लूप्स अंतहीन वेब कॉल्स ट्रिगर कर सकते हैं। इसी वजह से एक स्टार्टअप ने एक महीने में $11,000 खर्च कर दिए। Lambda बजट का उपयोग करके प्रति सत्र (session) वेब कॉल्स पर एक सख्त सीमा निर्धारित करें।

लक्ष्य एक हाइब्रिड स्टैक है: • Intent Classifier • Internal Vector DB • AgentCore Web Search • Bedrock Guardrails • Drift Monitoring

केवल डेमो के लिए नहीं, बल्कि छठे महीने के लिए निर्माण करें।

Source: https://dev.to/aarhamforensics_eb3c024eb/amazon-bedrock-agentcore-web-search-7-deployment-mistakes-that-break-production-agents-821

Optional learning community: https://t.me/GyaanSetuAi