𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗕𝘂𝗶𝗹𝗱 𝗚𝘂𝗶𝗱𝗲
आपका AI एजेंट संभवतः आपके उपयोगकर्ताओं से झूठ बोल रहा है।
ऐसा इसलिए होता है क्योंकि जैसे ही आप इसे शिप करते हैं, इसका ज्ञान पुराना (stale) हो जाता है। स्टैटिक RAG पाइपलाइन जल्दी खराब हो जाती हैं। उद्यमों (Enterprises) को तैनाती के 90 दिनों के भीतर सटीकता में 23% की गिरावट देखने को मिलती है।
Amazon Bedrock AgentCore web search इसका समाधान करता है। यह एजेंटों को इन्फरेंस (inference) के समय लाइव URLs को क्वेरी करने की अनुमति देता है। आपको Lambda functions या Tavily या SerpAPI जैसी थर्ड-पार्टी API keys की आवश्यकता नहीं है।
प्रोडक्शन के लिए आपको क्या जानने की आवश्यकता है:
- आर्किटेक्चर (Architecture): मॉडल तय करता है कि टूल को कब कॉल करना है। यह लाइव टेक्स्ट के अंश (excerpts) प्राप्त करता है और उन्हें रीजनिंग लूप (reasoning loop) में वापस भेज देता है।
- सुरक्षा (Security): अपनी खोज को सीमित करने के लिए IAM का उपयोग करें। आप एजेंटों को अविश्वसनीय स्रोतों तक पहुँचने से रोकने के लिए भरोसेमंद डोमेन की एक allowlist बना सकते हैं।
- प्रदर्शन (Performance): 1.2 से 2.8 सेकंड की राउंड-ट्रिप लेटेंसी (latency) की अपेक्षा करें। इसका उपयोग तथ्यों के लिए करें, न कि सब-सेकंड चैट के लिए।
- लागत रणनीति (Cost Strategy): पहले क्वेरीज़ को वर्गीकृत करने के लिए Claude Haiku का उपयोग करें। यदि किसी क्वेरी के लिए लाइव डेटा की आवश्यकता है, तो उसे Claude 3.5 Sonnet पर रूट करें। यह प्रति-सेशन लागत को 35% से 45% तक कम कर देता है।
'नॉलेज डिके क्लफ' (Knowledge Decay Cliff) वास्तविक है। फाइनेंस या लीगल जैसे तेजी से बदलते क्षेत्रों में, स्टैटिक डेटा का उपयोग करने के 60 दिनों के बाद सटीकता गिर जाती है।
अपने वेक्टर डेटाबेस को पूरी तरह से न बदलें। एक हाइब्रिड दृष्टिकोण (hybrid approach) अपनाएं: • अपने निजी, आंतरिक ज्ञान के लिए वेक्टर RAG का उपयोग करें। • बाहरी, रियल-टाइम ताज़गी के लिए AgentCore web search का उपयोग करें।
यह सेटअप सिंगल-टर्न प्रश्न उत्तर (single-turn question answering) के लिए प्रोडक्शन-रेडी है। यदि आपको जटिल मल्टी-हॉप रिसर्च की आवश्यकता है, तो इसे प्रयोगात्मक (experimental) मानें।
पुराने डेटा पर एजेंट बनाना बंद करें। वास्तविक दुनिया के लिए निर्माण करें।
वैकल्पिक लर्निंग कम्युनिटी: https://t.me/GyaanSetuAi