𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗔 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗚𝘂𝗶𝗱𝗲
ನಿಮ್ಮ AI ಏಜೆಂಟ್ ನಿಮ್ಮ ಬಳಕೆದಾರರಿಗೆ ಸುಳ್ಳು ಹೇಳುತ್ತಿದೆ.
ಸ್ಥಿರವಾದ (Static) ತರಬೇತಿ ಡೇಟಾ ಮತ್ತು ಹಳೆಯದಾದ (stale) ವೆಕ್ಟರ್ ಸ್ಟೋರ್ಗಳು ಏಜೆಂಟ್ಗಳು ವಿಫಲವಾಗಲು ಕಾರಣವಾಗುತ್ತವೆ. ಇದು 'Knowledge Rot Trap' ಆಗಿದೆ. ಸ್ಥಿರ ಡೇಟಾದ ಮೇಲೆ ನಿರ್ಮಿಸಲಾದ ಏಜೆಂಟ್ ಪ್ರತಿ ತಿಂಗಳು 3% ರಿಂದ 7% ರಷ್ಟು ವಾಸ್ತವಿಕ ನಿಖರತೆಯನ್ನು ಕಳೆದುಕೊಳ್ಳುತ್ತದೆ. ನಿಮ್ಮ ಮೌಲ್ಯಮಾಪನ ಮೆಟ್ರಿಕ್ಗಳು (evaluation metrics) ಸರಿಯಾಗಿ ಕಂಡರೂ, ನಿಮ್ಮ ಬಳಕೆದಾರರು ಆ ಸಾಧನದ ಮೇಲಿನ ನಂಬಿಕೆಯನ್ನು ಕಳೆದುಕೊಳ್ಳುತ್ತಾರೆ.
Amazon Bedrock AgentCore web search ಇದನ್ನು ಸರಿಪಡಿಸುತ್ತದೆ. ಇದು ಒಂದು ಮ್ಯಾನೇಜ್ಡ್ (managed), IAM-native ಟೂಲ್ ಆಗಿದ್ದು, ನಿಮ್ಮ AWS ನಂಬಿಕಾ ವ್ಯಾಪ್ತಿಯೊಳಗೆ (trust boundary) ಲೈವ್ ವೆಬ್ ರಿಟ್ರಿವಲ್ ಅನ್ನು ಒದಗಿಸುತ್ತದೆ.
ಪ್ರೊಡಕ್ಷನ್ಗೆ ಇದು ಏಕೆ ಮುಖ್ಯ:
- ಯಾವುದೇ ಥರ್ಡ್-ಪಾರ್ಟಿ ಕೀಗಳು ಬೇಕಾಗಿಲ್ಲ: ನಿಮಗೆ Tavily ಅಥವಾ SerpAPI ಅಗತ್ಯವಿಲ್ಲ.
- ಡೇಟಾ ಸುರಕ್ಷತೆ: ಯಾವುದೇ ಡೇಟಾ ನಿಮ್ಮ VPC ಯಿಂದ ಹೊರಗೆ ಹೋಗುವುದಿಲ್ಲ. ಎಲ್ಲವೂ AWS ನೆಟ್ವರ್ಕ್ನಲ್ಲೇ ಇರುತ್ತದೆ.
- ಮ್ಯಾನೇಜ್ಡ್ ಇನ್ಫ್ರಾಸ್ಟ್ರಕ್ಚರ್: ಸರ್ಚ್ ಟೂಲ್ಗಳಿಗಾಗಿ ಇನ್ನು ಮುಂದೆ Lambda ಫಂಕ್ಷನ್ಗಳನ್ನು ಬರೆಯುವ ಅಥವಾ ನಿರ್ವಹಿಸುವ ಅಗತ್ಯವಿಲ್ಲ.
- ರಚನಾತ್ಮಕ ಉಲ್ಲೇಖಗಳು (Structured citations): ಈ ಟೂಲ್ ಮೆಟಾಡೇಟಾವನ್ನು ಹಿಂತಿರುಗಿಸುತ್ತದೆ, ಇದರಿಂದ ನೀವು ಪ್ರತಿಯೊಂದು ಉತ್ತರವನ್ನು ಪರಿಶೀಲಿಸಬಹುದು.
ವಿಶ್ವಾಸಾರ್ಹ ಏಜೆಂಟ್ ಅನ್ನು ಹೇಗೆ ವಿನ್ಯಾಸಗೊಳಿಸುವುದು (architect):
ವೇಗ ಮತ್ತು ತಾಜಾತನವನ್ನು (freshness) ಸಮತೋಲನಗೊಳಿಸಲು Grounded RAG Fallback Chain ಅನ್ನು ಬಳಸಿ.
- ಮೊದಲು ನಿಮ್ಮ ಆಂತರಿಕ ವೆಕ್ಟರ್ ಡೇಟಾಬೇಸ್ ಅನ್ನು ಕ್ವೆರಿ ಮಾಡಿ.
- ಕಾನ್ಫಿಡೆನ್ಸ್ ಥ್ರೆಶೋಲ್ಡ್ ಅನ್ನು ನಿಗದಿಪಡಿಸಿ (ಉದಾಹರಣೆಗೆ, 0.75 cosine similarity).
- ಕಾನ್ಫಿಡೆನ್ಸ್ ಕಡಿಮೆ ಇದ್ದರೆ, ಫಾಲ್ಬ್ಯಾಕ್ ಆಗಿ AgentCore web search ಅನ್ನು ಚಾಲನೆ ಮಾಡಿ.
- ಪ್ರೊವಿನೆನ್ಸ್ ಲೇಬಲ್ಗಳೊಂದಿಗೆ (provenance labels) ಅಂತಿಮ ಉತ್ತರವನ್ನು ಸಂಶ್ಲೇಷಿಸಿ (synthesize).
ಈ ವಿಧಾನವು ಖಾಸಗಿ ದಾಖಲೆಗಳಿಗಾಗಿ ಆಂತರಿಕ RAG ಅನ್ನು ಮತ್ತು ಪ್ರಚಲಿತ ಘಟನೆಗಳು ಅಥವಾ ಸುದ್ದಿಗಾಗಿ ವೆಬ್ ಸರ್ಚ್ ಅನ್ನು ಬಳಸುತ್ತದೆ.
ಈ ಸಾಮಾನ್ಯ ತಪ್ಪುಗಳನ್ನು ತಪ್ಪಿಸಿ:
- ಅನಿರ್ಬಂಧಿತ ಲೂಪ್ಗಳು (Unbounded loops): ರೀಸನಿಂಗ್ ಲೂಪ್ನಲ್ಲಿರುವ ಏಜೆಂಟ್ ನಿಮ್ಮ ಬಜೆಟ್ ಅನ್ನು ಖಾಲಿ ಮಾಡಬಹುದು. max_iterations ಅನ್ನು 10 ಕ್ಕೆ ನಿಗದಿಪಡಿಸಿ.
- ಉಲ್ಲೇಖಗಳ ಕೊರತೆ: ಮೂಲವಿಲ್ಲದ ಉತ್ತರವು ಹ್ಯಾಲ್ಯುಸಿನೇಶನ್ (hallucination) ತರಹ ಕಾಣುತ್ತದೆ. ನಿಮ್ಮ ಮಾಡೆಲ್ ಮೂಲ URLಗಳನ್ನು ಸೇರಿಸುವಂತೆ ಮಾಡಿ.
- ವೆಬ್ ಸರ್ಚ್ ಮೇಲೆ ಅತಿಯಾದ ಅವಲಂಬನೆ: 30 ದಿನಗಳಿಗಿಂತ ಕಡಿಮೆ ಅವಧಿಯ ಮಾಹಿತಿಗಳಿಗೆ ವೆಬ್ ಸರ್ಚ್ ಬಳಸಿ. ಉಳಿದ ಎಲ್ಲದಕ್ಕೂ RAG ಬಳಸಿ.
ವೆಚ್ಚವನ್ನು ನಿಯಂತ್ರಿಸಲು, semantic caching ಬಳಸಿ. ಲೈವ್ ವೆಬ್ ಅನ್ನು ಸಂಪರ್ಕಿಸದೆ ಪದೇ ಪದೇ ಬರುವ ಕ್ವೆರಿಗಳನ್ನು ನೀಡಲು ElastiCache ನಲ್ಲಿ ಎಂಬೆಡ್ಡಿಂಗ್ಗಳನ್ನು (embeddings) ಸಂಗ್ರಹಿಸಿ. ಇದು ಸರ್ಚ್ ಕಾಲ್ಗಳನ್ನು 40% ರಿಂದ 60% ರಷ್ಟು ಕಡಿಮೆ ಮಾಡಬಹುದು.
ಕ್ಷೀಣಿಸುವ ಏಜೆಂಟ್ಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವುದನ್ನು ನಿಲ್ಲಿಸಿ. ನಿಮ್ಮ AI ವಾಸ್ತವಕ್ಕೆ ಹತ್ತಿರವಾಗಿರಲು (grounded) ಲೈವ್ ರಿಟ್ರಿವಲ್ ಬಳಸಿ ನಿರ್ಮಿಸಿ.
ಐಚ್ಛಿಕ ಕಲಿಕಾ ಸಮುದಾಯ: https://t.me/GyaanSetuAi