𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗔 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗚𝘂𝗶𝗱𝗲
ਤੁਹਾਡਾ AI ਏਜੰਟ ਤੁਹਾਡੇ ਯੂਜ਼ਰਸ ਨੂੰ ਝੂਠ ਬੋਲ ਰਿਹਾ ਹੈ।
ਸਟੈਟਿਕ ਟ੍ਰੇਨਿੰਗ ਡੇਟਾ ਅਤੇ ਪੁਰਾਣੇ ਵੈਕਟਰ ਸਟੋਰਜ਼ ਕਾਰਨ ਏਜੰਟ ਫੇਲ ਹੋ ਜਾਂਦੇ ਹਨ। ਇਹ 'Knowledge Rot Trap' ਹੈ। ਫਿਕਸਡ ਡੇਟਾ 'ਤੇ ਬਣਿਆ ਇੱਕ ਏਜੰਟ ਹਰ ਮਹੀਨੇ 3% ਤੋਂ 7% ਤੱਕ ਆਪਣੀ ਤੱਥਕਤਮਕ ਸ਼ੁੱਧਤਾ (factual accuracy) ਗੁਆ ਲੈਂਦਾ ਹੈ। ਤੁਹਾਡੇ ਇਵੈਲੂਏਸ਼ਨ ਮੈਟ੍ਰਿਕਸ ਹਰੇ (green) ਦਿਖਾਈ ਦਿੰਦੇ ਹਨ, ਪਰ ਤੁਹਾਡੇ ਯੂਜ਼ਰਸ ਟੂਲ 'ਤੇ ਭਰੋਸਾ ਕਰਨਾ ਬੰਦ ਕਰ ਦਿੰਦੇ ਹਨ।
Amazon Bedrock AgentCore web search ਇਸ ਸਮੱਸਿਆ ਨੂੰ ਸੁਲਝਾਉਂਦਾ ਹੈ। ਇਹ ਇੱਕ ਮੈਨੇਜਡ, IAM-native ਟੂਲ ਹੈ ਜੋ ਤੁਹਾਡੀ AWS trust boundary ਦੇ ਅੰਦਰ ਲਾਈਵ ਵੈੱਬ ਰਿਟ੍ਰੀਵਲ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ।
ਪ੍ਰੋਡਕਸ਼ਨ ਲਈ ਇਹ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ:
- ਕੋਈ Third-party keys ਨਹੀਂ: ਤੁਹਾਨੂੰ Tavily ਜਾਂ SerpAPI ਦੀ ਲੋੜ ਨਹੀਂ ਹੈ।
- ਡੇਟਾ ਸੁਰੱਖਿਆ: ਕੋਈ ਵੀ ਡੇਟਾ ਤੁਹਾਡੇ VPC ਤੋਂ ਬਾਹਰ ਨਹੀਂ ਜਾਂਦਾ। ਸਭ ਕੁਝ AWS ਨੈੱਟਵਰਕ ਦੇ ਅੰਦਰ ਰਹਿੰਦਾ ਹੈ।
- ਮੈਨੇਜਡ ਇਨਫਰਾਸਟ੍ਰਕਚਰ: ਸਰਚ ਟੂਲਜ਼ ਲਈ Lambda ਫੰਕਸ਼ਨ ਲਿਖਣ ਅਤੇ ਉਹਨਾਂ ਨੂੰ ਬਣਾਈ ਰੱਖਣ ਦੀ ਹੁਣ ਕੋਈ ਲੋੜ ਨਹੀਂ।
- ਸਟ੍ਰਕਚਰਡ ਸਿਟੇਸ਼ਨਜ਼: ਇਹ ਟੂਲ ਮੈਟਾਡਾਟਾ ਵਾਪਸ ਕਰਦਾ ਹੈ ਤਾਂ ਜੋ ਤੁਸੀਂ ਹਰ ਉੱਤਰ ਦੀ ਪੁਸ਼ਟੀ ਕਰ ਸਕੋ।
ਇੱਕ ਭਰੋਸੇਯੋਗ ਏਜੰਟ ਦਾ ਆਰਕੀਟੈਕਚਰ ਕਿਵੇਂ ਬਣਾਇਆ ਜਾਵੇ:
ਸਪੀਡ ਅਤੇ ਤਾਜ਼ਗੀ (freshness) ਦੇ ਸੰਤੁਲਨ ਲਈ Grounded RAG Fallback Chain ਦੀ ਵਰਤੋਂ ਕਰੋ।
- ਪਹਿਲਾਂ ਆਪਣੇ ਅੰਦਰੂਨੀ ਵੈਕਟਰ ਡੇਟਾਬੇਸ ਨੂੰ ਕੁਐਰੀ ਕਰੋ।
- ਇੱਕ ਕਾਨਫੀਡੈਂਸ ਥ੍ਰੈਸ਼ਹੋਲਡ ਸੈੱਟ ਕਰੋ (ਉਦਾਹਰਨ ਲਈ, 0.75 cosine similarity)।
- ਜੇਕਰ ਕਾਨਫੀਡੈਂਸ ਘੱਟ ਹੈ, ਤਾਂ ਫਾਲਬੈਕ ਵਜੋਂ AgentCore web search ਨੂੰ ਟ੍ਰਿਗਰ ਕਰੋ।
- ਪ੍ਰੋਵੇਨੈਂਸ ਲੇਬਲਜ਼ (provenance labels) ਦੇ ਨਾਲ ਅੰਤਿਮ ਉੱਤਰ ਤਿਆਰ ਕਰੋ।
ਇਹ ਪਹੁੰਚ ਪ੍ਰਾਈਵੇਟ ਦਸਤਾਵੇਜ਼ਾਂ ਲਈ ਅੰਦਰੂਨੀ RAG ਅਤੇ ਮੌਜੂਦਾ ਘਟਨਾਵਾਂ ਜਾਂ ਖ਼ਬਰਾਂ ਲਈ ਵੈੱਬ ਸਰਚ ਦੀ ਵਰਤੋਂ ਕਰਦੀ ਹੈ।
ਇਹਨਾਂ ਆਮ ਗਲਤੀਆਂ ਤੋਂ ਬਚੋ:
- ਅਨਬਾਊਂਡਡ ਲੂਪਸ (Unbounded loops): ਰੀਜ਼ਨਿੰਗ ਲੂਪ ਵਿੱਚ ਫਸਿਆ ਇੱਕ ਏਜੰਟ ਤੁਹਾਡਾ ਬਜਟ ਖਤਮ ਕਰ ਸਕਦਾ ਹੈ।
max_iterationsਨੂੰ 10 'ਤੇ ਸੈੱਟ ਕਰੋ। - ਸਿਟੇਸ਼ਨਜ਼ ਦੀ ਘਾਟ: ਸਰੋਤ ਤੋਂ ਬਿਨਾਂ ਦਿੱਤਾ ਗਿਆ ਉੱਤਰ 'ਹੈਲੂਸੀਨੇਸ਼ਨ' (hallucination) ਵਾਂਗ ਲੱਗਦਾ ਹੈ। ਆਪਣੇ ਮਾਡਲ ਨੂੰ ਸਰੋਤ URL ਸ਼ਾਮਲ ਕਰਨ ਲਈ ਮਜਬੂਰ ਕਰੋ।
- ਵੈੱਬ ਸਰਚ 'ਤੇ ਬਹੁਤ ਜ਼ਿਆਦਾ ਨਿਰਭਰਤਾ: ਉਹਨਾਂ ਤੱਥਾਂ ਲਈ ਵੈੱਬ ਸਰਚ ਦੀ ਵਰਤੋਂ ਕਰੋ ਜਿਨ੍ਹਾਂ ਦੀ ਮਿਆਦ (shelf life) 30 ਦਿਨਾਂ ਤੋਂ ਘੱਟ ਹੈ। ਬਾਕੀ ਸਭ ਕੁਝ ਲਈ RAG ਦੀ ਵਰਤੋਂ ਕਰੋ।
ਲਾਗਤਾਂ ਨੂੰ ਕੰਟਰੋਲ ਕਰਨ ਲਈ, semantic caching ਦੀ ਵਰਤੋਂ ਕਰੋ। ਲਾਈਵ ਵੈੱਬ 'ਤੇ ਜਾਣ ਤੋਂ ਬਿਨਾਂ ਵਾਰ-ਵਾਰ ਹੋਣ ਵਾਲੀਆਂ ਕੁਐਰੀਆਂ ਨੂੰ ਪੂਰਾ ਕਰਨ ਲਈ ElastiCache ਵਿੱਚ embeddings ਸਟੋਰ ਕਰੋ। ਇਹ ਸਰਚ ਕਾਲਜ਼ ਨੂੰ 40% ਤੋਂ 60% ਤੱਕ ਘਟਾ ਸਕਦਾ ਹੈ।
ਅਜਿਹੇ ਏਜੰਟ ਬਣਾਉਣਾ ਬੰਦ ਕਰੋ ਜੋ ਸਮੇਂ ਦੇ ਨਾਲ ਖ਼ਰਾਬ ਹੋ ਜਾਂਦੇ ਹਨ। ਲਾਈਵ ਰਿਟ੍ਰੀਵਲ ਨਾਲ ਬਣਾਓ ਤਾਂ ਜੋ ਇਹ ਯਕੀਨੀ ਬਣਾਇਆ ਜਾ ਸਕੇ ਕਿ ਤੁਹਾਡਾ AI ਹਕੀਕਤ ਨਾਲ ਜੁੜਿਆ ਰਹੇ।
ਵਿਕਲਪਿਕ ਲਰਨਿੰਗ ਕਮਿਊਨਿਟੀ: https://t.me/GyaanSetuAi