𝗔𝗺𝗮𝘇𝗼𝗻 𝗕𝗲𝗱𝗿𝗼𝗰𝗸 𝗔𝗴𝗲𝗻𝘁𝗖𝗼𝗿𝗲 𝗪𝗲𝗯 𝗦𝗲𝗮𝗿𝗰𝗵 𝘃𝘀 𝗥𝗔𝗚

உங்கள் RAG pipeline உங்கள் பயனர்களுக்குப் பொய் சொல்லக்கூடும்.

பெரும்பாலான RAG அமைப்புகள் நிலையான (static) vector databases-ஐயே நம்பியுள்ளன. இந்தத் தரவுத்தளங்கள் கடந்த காலத்தின் ஒரு பிம்பம் (snapshot) மட்டுமே. நீங்கள் உங்கள் தரவை index செய்த அடுத்த கணமே, அது காலாவதியாகத் தொடங்கும். இது Freshness Debt எனப்படும் காலாவதியாகும் சிக்கலை உருவாக்குகிறது.

நீங்கள் நிலையான RAG-ஐப் பயன்படுத்தி நிதிச் செய்திகள் அல்லது தயாரிப்பு விலைகளுக்கான ஒரு agent-ஐ உருவாக்கினால், உங்கள் agent பழைய அல்லது காலாவதியான தகவல்களையே வழங்கும்.

Amazon Bedrock AgentCore web search இதை மாற்றுகிறது. இது வெறும் ஒரு அம்சம் (feature) மட்டுமல்ல; இது ஒரு managed grounding tool ஆகும்.

இது பாரம்பரிய RAG-லிருந்து எவ்வாறு வேறுபடுகிறது என்பது இதோ:

  • மெதுவாக மாறும் நிறுவனத்தின் உள் ஆவணங்களுக்கு (proprietary internal docs) RAG சிறந்தது. இது 100ms-க்கும் குறைவான நேரத்தில் விரைவான தரவு மீட்டெடுப்பை (retrieval) வழங்குகிறது.
  • செய்திகள் அல்லது விதிமுறைகள் போன்ற அடிக்கடி மாறும் பொதுத் தகவல்களுக்கு AgentCore web search சிறந்தது. இது தேடும் நேரத்திலேயே (query time) நேரடித் தரவுகளைப் பெறுகிறது.

உருவாக்குபவர்களுக்கு (builders) இது ஏன் முக்கியமானது:

  • Less Glue: API retries மற்றும் parsing-க்காக 150 வரிகள் தனிப்பயன் குறியீடுகளை (custom code) எழுதுவதற்குப் பதிலாக, நீங்கள் ஒரே ஒரு managed call மூலம் இதைச் செய்துவிடலாம்.
  • Security: இது உங்கள் AWS trust boundary-க்குள் இயங்குகிறது. இது IAM-ஐப் பயன்படுத்துகிறது மற்றும் CloudTrail-இல் பதிவுகளை (logs) உருவாக்குகிறது.
  • Model Agnostic: நீங்கள் இதை Claude, Llama, Mistral அல்லது Titan ஆகியவற்றுடன் பயன்படுத்தலாம். நீங்கள் ஒரு குறிப்பிட்ட வழங்குநருடன் (provider) மட்டும் பிணைக்கப்படவில்லை.
  • Reduced Errors: மேற்கோள்களை (citation) உறுதிப்படுத்தும் நேரடி grounding மூலம், உண்மைத் தகவல்களில் ஏற்படும் பிழைகளைக் 40% முதல் 60% வரை குறைக்க முடியும்.

The Winning Pattern:

இரண்டில் ஒன்றை மட்டும் தேர்ந்தெடுக்காதீர்கள். ஒரு கலப்பு அணுகுமுறையை (hybrid approach) பயன்படுத்துங்கள்.

  • உங்கள் நிறுவனத்தின் தனிப்பட்ட, உள் ஆவணங்களுக்கு RAG-ஐப் பயன்படுத்துங்கள்.
  • அடிக்கடி மாறும் பொதுத் தகவல்களுக்கு AgentCore web search-ஐப் பயன்படுத்துங்கள்.

A warning for production:

உங்கள் செலவுகளைக் கவனியுங்கள். Multi-agent அமைப்புகளில் வரம்பற்ற தேடல் ஆழம் (unbounded search depth), செலவுகள் கட்டுப்பாடின்றி அதிகரிக்க வழிவகுக்கும். தொடர்ச்சியான தேடல் அழைப்புகளால் (recursive search calls), சோதனை ஓட்டங்களின் செலவு $30-லிருந்து $900 ஆக உயர்ந்ததை நாங்கள் கண்டோம். ஒவ்வொரு தேடலுக்கும் (query) எத்தனை முறை தேடல் அழைப்புகள் செய்யப்பட வேண்டும் என்பதில் எப்போதும் ஒரு வரம்பை (hard limit) நிர்ணயிக்கவும்.

தகவலின் புதுமையைத் (freshness) தற்செயலான ஒன்றாகக் கருதாதீர்கள். அது நம்பகத்தன்மைக்கான ஒரு கட்டாயத் தேவையாகும்.

Source: https://dev.to/aarhamforensics_eb3c024eb/amazon-bedrock-agentcore-web-search-vs-rag-the-real-time-grounding-guide-4p2o

விருப்பமான கற்றல் சமூகம்: https://t.me/GyaanSetuAi