ஜப்பானிய ஆய்வகங்கள் எவ்வாறு சிறந்த RAG அமைப்புகளை உருவாக்குகின்றன

Translated for your language. Read the original.

AI-assisted draft.

GyaanSetu Editorialநேற்று முன் தினம்2min read

ஜப்பானிய ஆய்வகங்கள் எவ்வாறு சிறந்த RAG அமைப்புகளை உருவாக்குகின்றன

உங்கள் வெக்டர் தரவுத்தளம் (vector database) பொருத்தமான துண்டுகளை (chunks) வழங்குகிறது. உங்கள் எம்பெடிங் மாடல் (embedding model) பெஞ்ச்மார்க்குகளில் அதிக மதிப்பெண்களைப் பெறுகிறது. ஆனால் ஒரு பயனர் சிக்கலான கேள்வியைக் கேட்கும்போது, அந்த அமைப்பு பயனற்ற பதிலையே வழங்குகிறது.

இது ஒரு மீட்டெடுப்பு கட்டமைப்புத் தோல்வி (retrieval architecture failure). உங்கள் LLM-ஐச் சரிசெய்வது (tuning) இதைச் சரிசெய்யாது.

ஒரு ஜப்பானிய ஆராய்ச்சி குழு இதற்குத் தீர்வுகாணும் வழியைக் கண்டறிந்துள்ளது. அவர்கள் ஒரு அறிவு வரைபட (knowledge graph) RAG அமைப்பை உருவாக்கினர். இந்த அணுகுமுறை அறிவியல் சார்ந்த பணிகளில் துல்லியத்தை 90% வரை மேம்படுத்தியது.

வழக்கமான RAG-இல் உள்ள சிக்கல் பொருண்மை ஒற்றுமை (semantic similarity) ஆகும். புரத மடிப்பு (protein folding) பற்றிய ஒரு துண்டு, CRISPR பற்றிய வினாவைப் போலவே தோன்றலாம். ஆனால் ஒற்றுமை என்பது பொருத்தம் (relevance) என்று பொருளல்ல.

ஜப்பானிய குழு வெறும் உரைத் துண்டுகளுக்குப் பதிலாகப் பொருண்மை உறவுகளைப் (entity relationships) பயன்படுத்துகிறது. அவர்கள் இதைப் பிரித்தெடுக்கிறார்கள்:

புரதங்கள் அல்லது ஆராய்ச்சியாளர்கள் போன்ற பொருள்கள் (Entities)
தடுக்கிறது அல்லது மேற்கோள் காட்டுகிறது போன்ற உறவுகள் (Relationships)
நம்பிக்கை மதிப்பெண்கள் (confidence scores) போன்ற பண்புகள் (Attributes)

அவர்கள் இரண்டு கட்ட செயல்முறையைப் பயன்படுத்துகிறார்கள். முதலில், அவர்கள் பொருத்தமான துணை வரைபடங்களை (subgraphs) அடையாளம் காண்கிறார்கள். இரண்டாவதாக, அந்தப் பொருள்களுடன் இணைக்கப்பட்ட உரையை மீட்டெடுக்கிறார்கள். இது பொருண்மை விலகலைத் (semantic drift) தடுக்கிறது. நீங்கள் வெறும் ஒத்த சொற்களை மட்டும் மீட்டெடுக்காமல், சூழலையும் (context) மீட்டெடுக்கிறீர்கள்.

வழக்கமான RAG-ஐ விட GraphRAG-ஐ உருவாக்குவது கடினம். உங்களுக்குத் தேவை:

Entity extraction pipelines
Relationship classification
Graph storage infrastructure
Hybrid query engines

இதில் மிகப்பெரிய ஆபத்து பராமரிப்பு (maintenance) ஆகும். வரைபடங்களை நீங்கள் புதுப்பிக்கவில்லை என்றால் அவை காலாவதியாகிவிடும். 2023-இல் நான் இதிலிருந்து கசப்பான அனுபவத்தைப் பெற்றேன். நான் மிகத் துல்லியமான ஒரு சட்ட ரீதியான RAG அமைப்பை உருவாக்கினேன். ஆனால் ஒரு புதுப்பித்தல் முறையை (update mechanism) உருவாக்கத் தவறிவிட்டேன். ஆறு மாதங்களுக்குப் பிறகு, தரவுகள் காலாவதியாகிவிட்டன. துல்லியம் 94%-லிருந்து 71%-ஆகக் குறைந்தது.

இதைச் சரியாக எவ்வாறு உருவாக்குவது:

ஒரு Entity taxonomy-உடன் தொடங்குங்கள். 20 முதல் 30 முக்கியமான வகைகளைத் தேர்ந்தெடுங்கள்.
முதல் நாளிலிருந்தே hybrid retrieval முறையைப் பயன்படுத்துங்கள். உறவுகளுக்கு வரைபடங்களையும் (graphs), தலைப்புகளுக்கு வெக்டர்களையும் (vectors) பயன்படுத்துங்கள்.
முதலில் உங்கள் பராமரிப்புப் பாதையை (maintenance pipeline) உருவாக்குங்கள். புதிய ஆவணங்கள் வரைபடத்தைப் புதுப்பிக்கும் முறையைத் திட்டமிடுங்கள்.
தர்க்கச் சங்கிலிகளை (reasoning chains) அளவிடுங்கள். ஒரு கேள்விக்குப் பதிலளிக்க அமைப்பு எத்தனை படிகளை எடுக்கிறது என்பதைக் கண்காணியுங்கள்.

நீங்கள் அறிவியல், சட்டம் அல்லது மருத்துவத் துறையில் பணிபுரிந்தால், இந்த பராமரிப்புச் செலவு தகுதியானது. எளிய அடிக்கடி கேட்கப்படும் கேள்விகளுக்கு (FAQs), வழக்கமான RAG போதுமானது.

உங்களிடமே இதைக் கேட்டுக்கொள்ளுங்கள்: உங்கள் வினாக்களில் எத்தனை சதவீதம் உறவுகளைப் பற்றியது? உங்கள் பயனர்களில் 40%-க்கும் அதிகமானோர் விஷயங்கள் எவ்வாறு ஒன்றோடொன்று தொடர்புடையவை என்று கேட்டால், உங்களுக்கு ஒரு வரைபடம் (graph) தேவை.

Source: https://dev.to/xu_xu_b2179aa8fc958d531d1/how-japans-research-labs-are-building-rag-systems-that-actually-work-and-what-western-teams-keep-21b2

Optional learning community: https://t.me/GyaanSetuAi

ஜப்பானிய ஆய்வகங்கள் எவ்வாறு சிறந்த RAG அமைப்புகளை உருவாக்குகின்றன

Continue reading

RAG மூலம் சிறந்த AI-ஐ உருவாக்குதல்

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

𝗞𝗻𝗼𝘄𝗹𝗲𝗱𝗴𝗲 𝗚𝗿𝗮𝗽𝗵𝘀: 𝗧𝗵𝗲 𝗠𝗶𝘀𝘀𝗶𝗻𝗴 𝗣𝗶𝗲𝗰𝗲 𝗶𝗻 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗪𝗵𝘆 𝗬𝗼𝘂𝗿 𝗥𝗔𝗚 𝗦𝘆𝘀𝘁𝗲𝗺 𝗛𝗮𝗹𝗹𝘂𝗰𝗶𝗻𝗮𝘁𝗲𝘀

Phase 1: Document Ingestion