Amazon Bedrock AgentCore Web Search: ਪ੍ਰੋਡਕਸ਼ਨ ਗਾਈਡ
ਤੁਹਾਡਾ AI agent ਇਸ ਲਈ ਗਲਤ ਜਾਣਕਾਰੀ (hallucinating) ਨਹੀਂ ਦੇ ਰਿਹਾ ਕਿਉਂਕਿ ਤੁਹਾਡਾ ਮਾਡਲ ਖਰਾਬ ਹੈ। ਇਹ ਇਸ ਲਈ ਗਲਤ ਜਾਣਕਾਰੀ ਦੇ ਰਿਹਾ ਹੈ ਕਿਉਂਕਿ ਤੁਹਾਡਾ ਆਰਕੀਟੈਕਚਰ ਸਮੇਂ ਵਿੱਚ ਰੁਕਿਆ ਹੋਇਆ ਹੈ।
ਜ਼ਿਆਦਾਤਰ RAG pipelines ਪੁਰਾਣੇ ਡੇਟਾ ਲਈ ਮਹਿੰਗੇ ਤਰ੍ਹਾਂ ਦੇ ਅਸਥਾਈ ਹੱਲ ਹਨ। AWS ਹੁਣ ਇੱਕ ਹੱਲ ਪੇਸ਼ ਕਰਦਾ ਹੈ: Amazon Bedrock AgentCore 'ਤੇ Web Search। ਇਹ ਇੱਕ ਮੈਨੇਜਡ ਟੂਲ ਹੈ ਜੋ ਤੁਹਾਡੇ agents ਨੂੰ ਲਾਈਵ ਵੈੱਬ ਐਕਸੈਸ ਦਿੰਦਾ ਹੈ।
ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ:
ਇੱਕ LLM ਜੋ ਜਾਣਦਾ ਹੈ ਅਤੇ ਉਪਭੋਗਤਾ ਜੋ ਪੁੱਛਦੇ ਹਨ, ਉਸ ਵਿਚਕਾਰ ਦਾ ਪਾੜਾ ਹਰ ਰੋਜ਼ ਵਧ ਰਿਹਾ ਹੈ। ਇਹ ਪਾੜਾ agents ਨੂੰ ਇੱਕ ਦੇਣਦਾਰੀ (liability) ਮਸ਼ੀਨ ਵਿੱਚ ਬਦਲ ਦਿੰਦਾ ਹੈ।
AgentCore Web Search ਨਾਲ ਤੁਹਾਨੂੰ ਕੀ ਮਿਲਦਾ ਹੈ:
- ਲਾਈਵ ਵੈੱਬ ਨਤੀਜਿਆਂ ਤੱਕ ਸਟ੍ਰਕਚਰਡ ਪਹੁੰਚ।
- ਕਿਸੇ ਕਸਟਮ ਕਰੌਲਰ (crawler) ਦੀ ਲੋੜ ਨਹੀਂ।
- ਕਿਸੇ ਤੀਜੀ-ਪਾਰਟੀ ਸਰਚ API ਦੇ ਇਕਰਾਰਨਾਮਿਆਂ ਦੀ ਲੋੜ ਨਹੀਂ।
- ਕੋਈ ਵੱਖਰੀ ਬਿਲਿੰਗ ਨਹੀਂ।
- ਕਰੌਲਿੰਗ, ਰੈਂਕਿੰਗ ਅਤੇ ਬਿਲਿੰਗ ਲਈ ਇੱਕ ਸਿੰਗਲ SDK ਕਾਲ।
Knowledge Freeze Tax ਦੇਣਾ ਬੰਦ ਕਰੋ। ਇਹ ਪੁਰਾਣੇ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਨ ਦੀ ਕੀਮਤ ਹੈ। ਇਹ ਗਲਤ ਜਵਾਬਾਂ, ਬਰਬਾਦ ਹੋਏ ਇੰਜੀਨੀਅਰਿੰਗ ਘੰਟਿਆਂ ਅਤੇ ਉੱਚ ਲੇਟੈਂਸੀ (latency) ਵਜੋਂ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ।
ਪ੍ਰੋਡਕਸ਼ਨ-ਗ੍ਰੇਡ ਪਾਈਪਲਾਈਨ ਕਿਵੇਂ ਬਣਾਈਏ:
Intent Classification: ਇਹ ਫੈਸਲਾ ਕਰਨ ਲਈ ਇੱਕ ਰਾਊਟਰ (router) ਦੀ ਵਰਤੋਂ ਕਰੋ ਕਿ ਕੀ ਕਿਸੇ ਕੁਐਰੀ (query) ਲਈ ਲਾਈਵ ਵੈੱਬ, ਅੰਦਰੂਨੀ RAG, ਜਾਂ ਸਟ੍ਰਕਚਰਡ ਡੇਟਾ ਦੀ ਲੋੜ ਹੈ। ਹਰ ਕੁਐਰੀ 'ਤੇ ਵੈੱਬ ਸਰਚ ਨਾ ਚਲਾਓ, ਨਹੀਂ ਤਾਂ ਤੁਹਾਡਾ ਬਜਟ ਖ਼ਤਮ ਹੋ ਜਾਵੇਗਾ।
Web Search Invocation: ਟੂਲ ਟਾਈਟਲ, URLs, ਸਨੀਪੇਟਸ (snippets) ਅਤੇ ਟਾਈਮਸਟੈਂਪਸ ਵਾਪਸ ਕਰਦਾ ਹੈ।
Result Synthesis: ਮਾਡਲ ਵਿੱਚ ਸਨੀਪੇਟਸ ਅਤੇ ਟਾਈਮਸਟੈਂਪਸ ਨੂੰ ਸ਼ਾਮਲ ਕਰੋ। ਤੁਹਾਨੂੰ ਟਾਈਮਸਟੈਂਪਸ ਸ਼ਾਮਲ ਕਰਨੇ ਚਾਹੀਦੇ ਹਨ ਤਾਂ ਜੋ ਮਾਡਲ ਨੂੰ ਪਤਾ ਲੱਗ ਸਕੇ ਕਿ ਕੋਈ ਸਰੋਤ ਪੁਰਾਣਾ ਹੈ ਜਾਂ ਨਹੀਂ।
Observability: ਇਹ ਦੇਖਣ ਲਈ ਕਿ ਕਿਹੜੇ ਵੈੱਬ ਨਤੀਜਿਆਂ ਨੇ ਤੁਹਾਡੇ ਜਵਾਬਾਂ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕੀਤਾ, Langfuse ਦੀ ਵਰਤੋਂ ਕਰੋ। ਇਹ ਐਂਟਰਪ੍ਰਾਈਜ਼ ਕੰਪਲਾਇੰਸ (compliance) ਲਈ ਬਹੁਤ ਜ਼ਰੂਰੀ ਹੈ।
ਮੁੱਖ ਤਕਨੀਕੀ ਸੁਝਾਅ:
- ਜਲਦੀ ਤੱਥਾਂ (facts) ਲਈ Web Search ਦੀ ਵਰਤੋਂ ਕਰੋ।
- Browser Tool ਦੀ ਵਰਤੋਂ ਸਿਰਫ਼ ਗੁੰਝਲਦਾਰ JavaScript ਪੇਜਾਂ ਜਾਂ ਲੌਗਇਨ ਵਾਲਾਂ ਲਈ ਕਰੋ। ਸਧਾਰਨ ਲੁੱਕਅੱਪ ਲਈ Browser Tool ਦੀ ਵਰਤੋਂ ਕਰਨ ਨਾਲ 3 ਤੋਂ 8 ਸੈਕਿੰਡ ਦੀ ਲੇਟੈਂਸੀ ਵਧ ਜਾਂਦੀ ਹੈ।
- ਆਪਣੀਆਂ IAM ਪਰਮਿਸ਼ਨਾਂ ਦੀ ਜਾਂਚ ਕਰੋ। ਯਕੀਨੀ ਬਣਾਓ ਕਿ ਤੁਹਾਡੇ ਕੋਲ bedrock-agentcore:InvokeWebSearch ਦੀ ਪਰਮਿਸ਼ਨ ਹੈ।
- ਇੱਕ ਹਾਈਬ੍ਰਿਡ ਪਹੁੰਚ ਦੀ ਵਰਤੋਂ ਕਰੋ। ਬਾਹਰੀ ਡੇਟਾ ਲਈ Web Search ਅਤੇ ਆਪਣੇ ਅੰਦਰੂਨੀ, ਨਿੱਜੀ ਦਸਤਾਵੇਜ਼ਾਂ ਲਈ RAG ਦੀ ਵਰਤੋਂ ਕਰੋ।
ਟੀਚਾ ਸਭ ਤੋਂ ਵੱਧ ਵੈੱਬ ਸਰਚ ਦੀ ਵਰਤੋਂ ਕਰਨਾ ਨਹੀਂ ਹੈ। ਟੀਚਾ ਇੱਕ ਅਜਿਹਾ ਸਮਾਰਟ ਰਾਊਟਰ ਬਣਾਉਣਾ ਹੈ ਜੋ ਇਸਦੀ ਵਰਤੋਂ ਸਿਰਫ਼ ਲੋੜ ਪੈਣ 'ਤੇ ਹੀ ਕਰੇ।
ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi