𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: 𝗔 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗚𝘂𝗶𝗱𝗲

మీ AI ఏజెంట్ మీ వినియోగదారులకు అబద్ధాలు చెబుతోంది.

స్టాటిక్ ట్రైనింగ్ డేటా మరియు పాతబడిన (stale) వెక్టర్ స్టోర్‌లు ఏజెంట్లు విఫలం కావడానికి కారణమవుతాయి. దీనినే 'Knowledge Rot Trap' అంటారు. స్థిరమైన డేటాపై నిర్మించబడిన ఏజెంట్ ప్రతి నెలా 3% నుండి 7% వరకు వాస్తవిక ఖచ్చితత్వాన్ని కోల్పోతుంది. మీ ఎవాల్యుయేషన్ మెట్రిక్స్ (evaluation metrics) అంతా బాగున్నట్లు కనిపిస్తాయి, కానీ మీ వినియోగదారులు ఆ టూల్‌పై నమ్మకాన్ని కోల్పోతారు.

Amazon Bedrock AgentCore web search దీనిని పరిష్కరిస్తుంది. ఇది ఒక మేనేజ్డ్, IAM-నేటివ్ టూల్, ఇది మీ AWS ట్రస్ట్ బౌండరీలోనే లైవ్ వెబ్ రిట్రీవల్‌ను అందిస్తుంది.

ప్రొడక్షన్ కోసం ఇది ఎందుకు ముఖ్యమైనది:

  • థర్డ్-పార్టీ కీలు అవసరం లేదు: మీకు Tavily లేదా SerpAPI అవసరం లేదు.
  • డేటా భద్రత: మీ VPC నుండి ఎటువంటి డేటా బయటకు వెళ్లదు. అంతా AWS నెట్‌వర్క్‌లోనే ఉంటుంది.
  • మేనేజ్డ్ ఇన్‌ఫ్రాస్ట్రక్చర్: సెర్చ్ టూల్స్ కోసం ఇకపై Lambda ఫంక్షన్‌లను రాయడం లేదా నిర్వహించడం అవసరం లేదు.
  • స్ట్రక్చర్డ్ సైటేషన్స్ (Structured citations): ఈ టూల్ మెటాడేటాను అందిస్తుంది, తద్వారా మీరు ప్రతి సమాధానాన్ని ధృవీకరించవచ్చు.

నమ్మదగిన ఏజెంట్‌ను ఎలా రూపొందించాలి (architect):

వేగం మరియు తాజాదనాన్ని (freshness) సమతుల్యం చేయడానికి Grounded RAG Fallback Chainని ఉపయోగించండి.

  1. మొదట మీ అంతర్గత వెక్టర్ డేటాబేస్‌ను క్వెరీ చేయండి.
  2. కాన్ఫిడెన్స్ త్రెషోల్డ్‌ను సెట్ చేయండి (ఉదాహరణకు, 0.75 cosine similarity).
  3. ఒకవేళ కాన్ఫిడెన్స్ తక్కువగా ఉంటే, ఫాల్‌బ్యాక్‌గా AgentCore web searchని ట్రిగ్గర్ చేయండి.
  4. ప్రావెనెన్స్ లేబుల్స్‌తో (provenance labels) తుది సమాధానాన్ని రూపొందించండి.

ఈ విధానం ప్రైవేట్ డాక్యుమెంట్ల కోసం అంతర్గత RAGని మరియు ప్రస్తుత సంఘటనలు లేదా వార్తల కోసం వెబ్ సెర్చ్‌ను ఉపయోగిస్తుంది.

ఈ సాధారణ తప్పులను నివారించండి:

  • అపరిమిత లూప్‌లు (Unbounded loops): రీజనింగ్ లూప్‌లో ఉన్న ఏజెంట్ మీ బడ్జెట్‌ను ఖర్చు చేయవచ్చు. max_iterationsని 10కి సెట్ చేయండి.
  • సైటేషన్స్ లేకపోవడం: మూలం (source) లేని సమాధానం హాలూసినేషన్ (hallucination) లాగా కనిపిస్తుంది. మీ మోడల్ సోర్స్ URLలను తప్పనిసరిగా చేర్చేలా చేయండి.
  • వెబ్ సెర్చ్‌పై అతిగా ఆధారపడటం: 30 రోజుల కంటే తక్కువ కాలపరిమితి ఉన్న వాస్తవాల కోసం వెబ్ సెర్చ్‌ను ఉపయోగించండి. మిగిలినవన్నీ కోసం RAGని ఉపయోగించండి.

ఖర్చులను నియంత్రించడానికి, సెమాంటిక్ క్యాషింగ్ (semantic caching) ఉపయోగించండి. లైవ్ వెబ్‌ను సంప్రదించకుండా తరచుగా వచ్చే క్వెరీలను అందించడానికి ElastiCacheలో ఎంబెడ్డింగ్‌లను (embeddings) నిల్వ చేయండి. ఇది సెర్చ్ కాల్స్‌ను 40% నుండి 60% వరకు తగ్గించగలదు.

క్షీణించే (decay) ఏజెంట్లను పంపడం ఆపండి. మీ AI వాస్తవానికి అనుగుణంగా ఉండేలా చూడటానికి లైవ్ రిట్రీవల్‌తో నిర్మించండి.

Source: https://dev.to/aarhamforensics_eb3c024eb/amazon-bedrock-agentcore-web-search-the-complete-production-guide-to-grounded-ai-agents-8l2

Optional learning community: https://t.me/GyaanSetuAi