𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗧𝗵𝗲 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗕𝘂𝗶𝗹𝗱 𝗚𝘂𝗶𝗱𝗲

ਤੁਹਾਡਾ AI agent ਸ਼ਾਇਦ ਤੁਹਾਡੇ ਯੂਜ਼ਰਸ ਨੂੰ ਗਲਤ ਜਾਣਕਾਰੀ ਦੇ ਰਿਹਾ ਹੈ।

ਅਜਿਹਾ ਇਸ ਲਈ ਹੁੰਦਾ ਹੈ ਕਿਉਂਕਿ ਜਿਵੇਂ ਹੀ ਤੁਸੀਂ ਇਸਨੂੰ ਲਾਂਚ ਕਰਦੇ ਹੋ, ਇਸਦਾ ਗਿਆਨ ਪੁਰਾਣਾ ਹੋ ਜਾਂਦਾ ਹੈ। Static RAG pipelines ਜਲਦੀ ਖ਼ਤਮ ਹੋ ਜਾਂਦੀਆਂ ਹਨ। ਐਂਟਰਪ੍ਰਾਈਜ਼ਸ ਨੂੰ ਡਿਪਲਾਈਮੈਂਟ ਦੇ 90 ਦਿਨਾਂ ਦੇ ਅੰਦਰ accuracy ਵਿੱਚ 23% ਦੀ ਗਿਰਾਵਟ ਦੇਖਣ ਨੂੰ ਮਿਲਦੀ ਹੈ।

Amazon Bedrock AgentCore web search ਇਸ ਸਮੱਸਿਆ ਦਾ ਹੱਲ ਕਰਦਾ ਹੈ। ਇਹ agents ਨੂੰ inference time 'ਤੇ live URLs ਨੂੰ query ਕਰਨ ਦੀ ਇਜਾਜ਼ਤ ਦਿੰਦਾ ਹੈ। ਤੁਹਾਨੂੰ Lambda functions ਜਾਂ Tavily ਜਾਂ SerpAPI ਵਰਗੀਆਂ third-party API keys ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ।

Production ਲਈ ਤੁਹਾਨੂੰ ਕੀ ਜਾਣਨ ਦੀ ਲੋੜ ਹੈ:

  • Architecture: ਮਾਡਲ ਇਹ ਫੈਸਲਾ ਕਰਦਾ ਹੈ ਕਿ ਟੂਲ ਨੂੰ ਕਦੋਂ ਕਾਲ ਕਰਨਾ ਹੈ। ਇਹ live text excerpts ਪ੍ਰਾਪਤ ਕਰਦਾ ਹੈ ਅਤੇ ਉਹਨਾਂ ਨੂੰ reasoning loop ਵਿੱਚ ਵਾਪਸ ਭੇਜਦਾ ਹੈ।
  • Security: ਆਪਣੀ ਸਰਚ ਨੂੰ ਸੀਮਤ ਕਰਨ ਲਈ IAM ਦੀ ਵਰਤੋਂ ਕਰੋ। ਤੁਸੀਂ agents ਨੂੰ ਅਭਰੋਸੇਯੋਗ ਸਰੋਤਾਂ ਤੱਕ ਪਹੁੰਚ ਕਰਨ ਤੋਂ ਰੋਕਣ ਲਈ ਭਰੋਸੇਯੋਗ domains ਦੀ ਇੱਕ allowlist ਬਣਾ ਸਕਦੇ ਹੋ।
  • Performance: 1.2 ਤੋਂ 2.8 ਸੈਕਿੰਡ ਦੀ round-trip latency ਦੀ ਉਮੀਦ ਰੱਖੋ। ਇਸਦੀ ਵਰਤੋਂ ਤੱਥਾਂ (facts) ਲਈ ਕਰੋ, ਨਾ ਕਿ ਸਬ-ਸੈਕਿੰਡ ਚੈਟ ਲਈ।
  • Cost Strategy: ਪਹਿਲਾਂ queries ਨੂੰ classify ਕਰਨ ਲਈ Claude Haiku ਦੀ ਵਰਤੋਂ ਕਰੋ। ਜੇਕਰ ਕਿਸੇ query ਲਈ live data ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਇਸਨੂੰ Claude 3.5 Sonnet ਵੱਲ ਰੁਟ (route) ਕਰੋ। ਇਹ per-session ਲਾਗਤ ਨੂੰ 35% ਤੋਂ 45% ਤੱਕ ਘਟਾਉਂਦਾ ਹੈ।

Knowledge Decay Cliff ਅਸਲੀਅਤ ਹੈ। ਫਾਈਨੈਂਸ ਜਾਂ ਕਾਨੂੰਨੀ ਵਰਗੇ ਤੇਜ਼ੀ ਨਾਲ ਬਦਲਦੇ ਖੇਤਰਾਂ ਵਿੱਚ, static data ਦੀ ਵਰਤੋਂ ਕਰਨ ਤੋਂ 60 ਦਿਨਾਂ ਬਾਅਦ accuracy ਬੁਰੀ ਤਰ੍ਹਾਂ ਡਿੱਗ ਜਾਂਦੀ ਹੈ।

ਆਪਣੇ vector database ਨੂੰ ਪੂਰੀ ਤਰ੍ਹਾਂ ਬਦਲੋ ਨਾ। ਇੱਕ hybrid approach ਦੀ ਵਰਤੋਂ ਕਰੋ: • ਆਪਣੇ ਨਿੱਜੀ, ਅੰਦਰੂਨੀ ਗਿਆਨ ਲਈ vector RAG ਦੀ ਵਰਤੋਂ ਕਰੋ। • ਬਾਹਰੀ, real-time ਤਾਜ਼ਗੀ ਲਈ AgentCore web search ਦੀ ਵਰਤੋਂ ਕਰੋ।

ਇਹ setup single-turn question answering ਲਈ production-ready ਹੈ। ਜੇਕਰ ਤੁਹਾਨੂੰ ਗੁੰਝਲਦਾਰ multi-hop research ਦੀ ਲੋੜ ਹੈ, ਤਾਂ ਇਸਨੂੰ ਇੱਕ ਪ੍ਰਯੋਗ (experimental) ਵਜੋਂ ਲਓ।

ਪੁਰਾਣੇ (stale) ਡੇਟਾ 'ਤੇ agents ਬਣਾਉਣਾ ਬੰਦ ਕਰੋ। ਅਸਲੀ ਦੁਨੀਆ ਲਈ ਬਣਾਓ।

Source: https://dev.to/aarhamforensics_eb3c024eb/amazon-bedrock-agentcore-web-search-the-production-build-guide-41ad

Optional learning community: https://t.me/GyaanSetuAi