ஜப்பானிய ஆய்வகங்கள் எவ்வாறு சிறந்த RAG அமைப்புகளை உருவாக்குகின்றன
உங்கள் வெக்டர் தரவுத்தளம் (vector database) பொருத்தமான துண்டுகளை (chunks) வழங்குகிறது. உங்கள் எம்பெடிங் மாடல் (embedding model) பெஞ்ச்மார்க்குகளில் அதிக மதிப்பெண்களைப் பெறுகிறது. ஆனால் ஒரு பயனர் சிக்கலான கேள்வியைக் கேட்கும்போது, அந்த அமைப்பு பயனற்ற பதிலையே வழங்குகிறது.
இது ஒரு மீட்டெடுப்பு கட்டமைப்புத் தோல்வி (retrieval architecture failure). உங்கள் LLM-ஐச் சரிசெய்வது (tuning) இதைச் சரிசெய்யாது.
ஒரு ஜப்பானிய ஆராய்ச்சி குழு இதற்குத் தீர்வுகாணும் வழியைக் கண்டறிந்துள்ளது. அவர்கள் ஒரு அறிவு வரைபட (knowledge graph) RAG அமைப்பை உருவாக்கினர். இந்த அணுகுமுறை அறிவியல் சார்ந்த பணிகளில் துல்லியத்தை 90% வரை மேம்படுத்தியது.
வழக்கமான RAG-இல் உள்ள சிக்கல் பொருண்மை ஒற்றுமை (semantic similarity) ஆகும். புரத மடிப்பு (protein folding) பற்றிய ஒரு துண்டு, CRISPR பற்றிய வினாவைப் போலவே தோன்றலாம். ஆனால் ஒற்றுமை என்பது பொருத்தம் (relevance) என்று பொருளல்ல.
ஜப்பானிய குழு வெறும் உரைத் துண்டுகளுக்குப் பதிலாகப் பொருண்மை உறவுகளைப் (entity relationships) பயன்படுத்துகிறது. அவர்கள் இதைப் பிரித்தெடுக்கிறார்கள்:
- புரதங்கள் அல்லது ஆராய்ச்சியாளர்கள் போன்ற பொருள்கள் (Entities)
- தடுக்கிறது அல்லது மேற்கோள் காட்டுகிறது போன்ற உறவுகள் (Relationships)
- நம்பிக்கை மதிப்பெண்கள் (confidence scores) போன்ற பண்புகள் (Attributes)
அவர்கள் இரண்டு கட்ட செயல்முறையைப் பயன்படுத்துகிறார்கள். முதலில், அவர்கள் பொருத்தமான துணை வரைபடங்களை (subgraphs) அடையாளம் காண்கிறார்கள். இரண்டாவதாக, அந்தப் பொருள்களுடன் இணைக்கப்பட்ட உரையை மீட்டெடுக்கிறார்கள். இது பொருண்மை விலகலைத் (semantic drift) தடுக்கிறது. நீங்கள் வெறும் ஒத்த சொற்களை மட்டும் மீட்டெடுக்காமல், சூழலையும் (context) மீட்டெடுக்கிறீர்கள்.
வழக்கமான RAG-ஐ விட GraphRAG-ஐ உருவாக்குவது கடினம். உங்களுக்குத் தேவை:
- Entity extraction pipelines
- Relationship classification
- Graph storage infrastructure
- Hybrid query engines
இதில் மிகப்பெரிய ஆபத்து பராமரிப்பு (maintenance) ஆகும். வரைபடங்களை நீங்கள் புதுப்பிக்கவில்லை என்றால் அவை காலாவதியாகிவிடும். 2023-இல் நான் இதிலிருந்து கசப்பான அனுபவத்தைப் பெற்றேன். நான் மிகத் துல்லியமான ஒரு சட்ட ரீதியான RAG அமைப்பை உருவாக்கினேன். ஆனால் ஒரு புதுப்பித்தல் முறையை (update mechanism) உருவாக்கத் தவறிவிட்டேன். ஆறு மாதங்களுக்குப் பிறகு, தரவுகள் காலாவதியாகிவிட்டன. துல்லியம் 94%-லிருந்து 71%-ஆகக் குறைந்தது.
இதைச் சரியாக எவ்வாறு உருவாக்குவது:
- ஒரு Entity taxonomy-உடன் தொடங்குங்கள். 20 முதல் 30 முக்கியமான வகைகளைத் தேர்ந்தெடுங்கள்.
- முதல் நாளிலிருந்தே hybrid retrieval முறையைப் பயன்படுத்துங்கள். உறவுகளுக்கு வரைபடங்களையும் (graphs), தலைப்புகளுக்கு வெக்டர்களையும் (vectors) பயன்படுத்துங்கள்.
- முதலில் உங்கள் பராமரிப்புப் பாதையை (maintenance pipeline) உருவாக்குங்கள். புதிய ஆவணங்கள் வரைபடத்தைப் புதுப்பிக்கும் முறையைத் திட்டமிடுங்கள்.
- தர்க்கச் சங்கிலிகளை (reasoning chains) அளவிடுங்கள். ஒரு கேள்விக்குப் பதிலளிக்க அமைப்பு எத்தனை படிகளை எடுக்கிறது என்பதைக் கண்காணியுங்கள்.
நீங்கள் அறிவியல், சட்டம் அல்லது மருத்துவத் துறையில் பணிபுரிந்தால், இந்த பராமரிப்புச் செலவு தகுதியானது. எளிய அடிக்கடி கேட்கப்படும் கேள்விகளுக்கு (FAQs), வழக்கமான RAG போதுமானது.
உங்களிடமே இதைக் கேட்டுக்கொள்ளுங்கள்: உங்கள் வினாக்களில் எத்தனை சதவீதம் உறவுகளைப் பற்றியது? உங்கள் பயனர்களில் 40%-க்கும் அதிகமானோர் விஷயங்கள் எவ்வாறு ஒன்றோடொன்று தொடர்புடையவை என்று கேட்டால், உங்களுக்கு ஒரு வரைபடம் (graph) தேவை.
Optional learning community: https://t.me/GyaanSetuAi