𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵: தயாரிப்புக்கான வழிகாட்டி

உங்கள் AI ஏஜென்ட் உங்கள் பயனர்களுக்குப் பொய் சொல்ல வாய்ப்புள்ளது.

நீங்கள் அதை வெளியிட்ட அடுத்த கணமே அதன் அறிவு காலாவதியாகிவிடுவதால் இது நிகழ்கிறது. நிலையான (Static) RAG పైప్‌லைன்கள் விரைவாகச் சிதைந்துவிடும். நிறுவனங்கள் பயன்பாட்டிற்கு வந்த 90 நாட்களுக்குள்ளேயே துல்லியத்தன்மை 23% குறைவதைக் காண்கின்றன.

Amazon Bedrock AgentCore web search இதைத் தீர்க்கிறது. இது ஏஜென்ட்கள் இன்ஃபரன்ஸ் (inference) நேரத்தில் நேரடி URL-களைத் தேட அனுமதிக்கிறது. உங்களுக்கு Lambda செயல்பாடுகளோ அல்லது Tavily அல்லது SerpAPI போன்ற மூன்றாம் தரப்பு API சாவிகளோ தேவையில்லை.

தயாரிப்பிற்கு (production) நீங்கள் தெரிந்து கொள்ள வேண்டியவை:

  • கட்டமைப்பு (Architecture): கருவியைப் (tool) பயன்படுத்த வேண்டிய நேரத்தை மாடல் தீர்மானிக்கிறது. இது நேரடி உரைத் துணுக்குகளைப் பெற்று அவற்றை reasoning loop-க்குத் திருப்பி அனுப்புகிறது.
  • பாதுகாப்பு (Security): உங்கள் தேடலை வரையறுக்க IAM-ஐப் பயன்படுத்தவும். நம்பகமற்ற ஆதாரங்களை ஏஜென்ட்கள் அணுகுவதைத் தடுக்க, நீங்கள் நம்பகமான டொமைன்களின் (domains) அனுமதிக்கப்பட்ட பட்டியலை (allowlist) உருவாக்கலாம்.
  • செயல்திறன் (Performance): 1.2 முதல் 2.8 வினாடிகள் வரையிலான காலதாமதத்தை (latency) எதிர்பார்க்கலாம். இதைத் தகவல்களைப் பெறப் பயன்படுத்தவும், நொடிக்கும் குறைவான நேரத்தில் பதிலளிக்க வேண்டிய உரையாடல்களுக்குப் பயன்படுத்த வேண்டாம்.
  • செலவு உத்தி (Cost Strategy): முதலில் வினவல்களை வகைப்படுத்த Claude Haiku-வைப் பயன்படுத்தவும். ஒரு வினவலுக்கு நேரடித் தரவு தேவைப்பட்டால், அதை Claude 3.5 Sonnet-க்கு அனுப்பவும். இது ஒரு அமர்விற்கான (per-session) செலவை 35% முதல் 45% வரை குறைக்கிறது.

அறிவுச் சிதைவுத் தாழ்வு (Knowledge Decay Cliff) என்பது நிஜமானது. நிதி அல்லது சட்டத் துறைகள் போன்ற வேகமாக நகரும் துறைகளில், நிலையான தரவைப் பயன்படுத்துவதன் மூலம் 60 நாட்களுக்குப் பிறகு துல்லியத்தன்மை சரிந்துவிடுகிறது.

உங்கள் வெக்டர் தரவுத்தளத்தை (vector database) முழுமையாக மாற்ற வேண்டாம். ஒரு கலப்பு அணுகுமுறையைப் (hybrid approach) பயன்படுத்தவும்: • உங்கள் தனிப்பட்ட, உள்நாட்டு அறிவிற்கு (internal knowledge) vector RAG-ஐப் பயன்படுத்தவும். • வெளிப்புற, நிகழ்நேரத் தகவல்களுக்கு (real-time freshness) AgentCore web search-ஐப் பயன்படுத்தவும்.

இந்த அமைப்பு ஒற்றை-சுற்று (single-turn) கேள்வி பதில்களுக்குத் தயாரிப்பு நிலைக்குத் தயாராக உள்ளது. உங்களுக்கு சிக்கலான பல-படிநிலை (multi-hop) ஆராய்ச்சி தேவைப்பட்டால், அதை ஒரு சோதனை முயற்சியாகக் கருதவும்.

காலாவதியான தரவுகளில் ஏஜென்ட்களை உருவாக்குவதை நிறுத்துங்கள். நிஜ உலகத்திற்காக உருவாக்குங்கள்.

ஆதாரம்: https://dev.to/aarhamforensics_eb3c024eb/amazon-bedrock-agentcore-web-search-the-production-build-guide-41ad

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi