Amazon Bedrock AgentCore Web Search: ஒரு தயாரிப்பு வழிகாட்டி
உங்கள் AI ஏஜென்ட் உங்கள் பயனர்களிடம் பொய் சொல்கிறது.
நிலையான பயிற்சித் தரவு (Static training data) மற்றும் காலாவதியான வெக்டர் ஸ்டோர்கள் (stale vector stores) ஏஜென்ட்கள் தோல்வியடையக் காரணமாகின்றன. இதுதான் 'அறிவுச் சிதைவுப் பொறி' (Knowledge Rot Trap). நிலையான தரவை அடிப்படையாகக் கொண்டு உருவாக்கப்பட்ட ஒரு ஏஜென்ட், ஒவ்வொரு மாதமும் 3% முதல் 7% வரை அதன் உண்மைத் துல்லியத்தை இழக்கிறது. உங்கள் மதிப்பீட்டு அளவீடுகள் (evaluation metrics) சரியாகத் தெரிந்தாலும், உங்கள் பயனர்கள் அந்த கருவியின் மீதான நம்பிக்கையை இழப்பார்கள்.
Amazon Bedrock AgentCore web search இதைச் சரிசெய்கிறது. இது ஒரு managed, IAM-native கருவியாகும், இது உங்கள் AWS trust boundary-க்குள் நேரடி இணையத் தேடலை (live web retrieval) வழங்குகிறது.
தயாரிப்பு நிலைக்கு (production) இது ஏன் முக்கியமானது:
- மூன்றாம் தரப்பு சாவிகள் (third-party keys) தேவையில்லை: உங்களுக்கு Tavily அல்லது SerpAPI தேவையில்லை.
- தரவுப் பாதுகாப்பு: உங்கள் VPC-யிலிருந்து எந்தத் தரவும் வெளியேறாது. அனைத்தும் AWS நெட்வொர்க்கிற்குள்ளேயே இருக்கும்.
- Managed உள்கட்டமைப்பு: தேடல் கருவிகளுக்காக இனி Lambda functions-களை எழுதவோ அல்லது பராமரிக்கவோ தேவையில்லை.
- கட்டமைக்கப்பட்ட மேற்கோள்கள் (Structured citations): ஒவ்வொரு பதிலையும் நீங்கள் சரிபார்க்க ஏதுவாக, இந்த கருவி metadata-வை வழங்குகிறது.
நம்பகமான ஏஜென்ட்டை எவ்வாறு வடிவமைப்பது (architect):
வேகம் மற்றும் புதுமையைப் (freshness) பேண Grounded RAG Fallback Chain-ஐப் பயன்படுத்தவும்.
- முதலில் உங்கள் உள் வெக்டர் தரவுத்தளத்தில் (internal vector database) தேடுங்கள்.
- ஒரு நம்பிக்கைத் அளவை (confidence threshold) நிர்ணயிக்கவும் (உதாரணமாக, 0.75 cosine similarity).
- நம்பிக்கை குறைவாக இருந்தால், ஒரு மாற்றுத் தீர்வாக (fallback) AgentCore web search-ஐத் தூண்டவும்.
- ஆதாரக் குறிகளுடன் (provenance labels) இறுதிப் பதிலைத் தொகுக்கவும்.
இந்த அணுகுமுறை தனிப்பட்ட ஆவணங்களுக்கு உள் RAG-ஐயும், தற்போதைய நிகழ்வுகள் அல்லது செய்திகளுக்கு இணையத் தேடலையும் பயன்படுத்துகிறது.
இந்த பொதுவான தவறுகளைத் தவிர்க்கவும்:
- எல்லையற்ற சுழற்சிகள் (Unbounded loops): ஒரு reasoning loop-ல் இருக்கும் ஏஜென்ட் உங்கள் பட்ஜெட்டைத் தீர்த்துவிடும்.
max_iterations-ஐ 10 என அமைக்கவும். - விடுபட்ட மேற்கோள்கள்: ஆதாரம் இல்லாத பதில் ஒரு மாயத்தோற்றமாக (hallucination)த் தோன்றும். உங்கள் மாடல் மூல ஆதார URL-களைச் சேர்ப்பதை உறுதிசெய்யவும்.
- இணையத் தேடலை அதிகம் சார்ந்திருத்தல்: 30 நாட்களுக்குக் குறைவான காலாவதித் தன்மை கொண்ட உண்மைகளுக்கு மட்டும் இணையத் தேடலைப் பயன்படுத்தவும். மற்ற அனைத்திற்கும் RAG-ஐப் பயன்படுத்தவும்.
செலவைக் கட்டுப்படுத்த, semantic caching-ஐப் பயன்படுத்தவும். நேரடி இணையத்தைத் தேடாமல் அடிக்கடி கேட்கப்படும் கேள்விகளுக்குப் பதிலளிக்க, ElastiCache-ல் embeddings-களைச் சேமிக்கவும். இது தேடல் அழைப்புகளை (search calls) 40% முதல் 60% வரை குறைக்கலாம்.
காலாவதியாகும் ஏஜென்ட்களை உருவாக்குவதை நிறுத்துங்கள். உங்கள் AI யதார்த்தத்துடன் இணைந்து இருப்பதை உறுதி செய்ய, நேரடித் தேடல் (live retrieval) வசதியுடன் உருவாக்குங்கள்.
Optional learning community: https://t.me/GyaanSetuAi