மல்டி-ஹாப் ரீசனிங்கை (Multi-Hop Reasoning) புரிந்துகொள்ளுதல்

வெக்டர் தரவுத்தளங்கள் (Vector databases) அர்த்தம் சார்ந்த தேடலுக்கு (semantic search) சிறப்பாகச் செயல்படுகின்றன. ஆனால் மனிதர்கள், அமைப்புகள் மற்றும் நிகழ்வுகளுக்கு இடையிலான பல படிநிலை ரீசனிங்கில் (multi-step reasoning) அவை சிரமப்படுகின்றன.

நிலையான RAG கணிதத்தின் அடிப்படையில் உரைத் துண்டுகளை (text chunks) மீட்டெடுக்கிறது. இது தரவுப் புள்ளிகளுக்கு இடையிலான இணைப்புகளைத் தவறவிடுகிறது. GraphRAG இதைத் தீர்க்கிறது. இது பெரிய மொழி மாதிரிகளை (Large Language Models) ஒரு நேரடி அறிவு வரைபடத்துடன் (live knowledge graph) இணைக்கிறது.

ஒரு Text-Attributed Graph நோட்கள் (nodes) மற்றும் விளிம்புகளை (edges) பயன்படுத்துகிறது.

  • நோட்கள் (Nodes) என்பது பயனர்கள் அல்லது தயாரிப்புகள் போன்ற உருப்படிகள் (entities).
  • விளிம்புகள் (Edges) என்பது "IMPACTS" அல்லது "CLONED_FROM" போன்ற உறவுகள் (relationships).
  • ஒரு "ஹாப்" (hop) என்பது ஒரு விளிம்பு வழியாக ஒரு நோட்டிலிருந்து மற்றொரு நோட்டிற்கு நகர்வதாகும்.

மல்டி-ஹாப் ரீசனிங் என்பது எந்த ஒரு தனி ஆவணத்திலும் இல்லாத இணைப்புகளைக் கண்டறிகிறது.

உதாரணம்: ஒரு பயனர், "CSV பதிவேற்றப் பிழையை நான் எவ்வாறு சரிசெய்வது?" என்று கேட்கிறார்.

நிலையான RAG முக்கியச் சொற்களைத் (keywords) தேடுகிறது. இது ஒரு பழைய FAQ அல்லது ஒரு தற்செயலான பிழை அறிக்கையை (bug report) வழங்கக்கூடும். இது வணிகச் சூழலைத் (business context) தவறவிடுகிறது.

GraphRAG துல்லியமான பாதையைத் தேடுகிறது: (User Bug Report) -> [CLONED_FROM] -> (Master Engineering Ticket) -> [HAS_RESOLUTION] -> (Patch Deployed).

இது LLM-க்கு ஒரு தெளிவற்ற ஊகத்திற்குப் பதிலாக, சரிபார்க்கப்பட்ட படிகளை வழங்குகிறது.

இதை நீங்கள் இரண்டு முறைகள் மூலம் கட்டுப்படுத்தலாம்:

  1. டெப்த் டிராவர்சல் (Depth Traversal) குறிப்பிட்ட விவரங்களுக்குள் ஆழமாகச் செல்ல இதைப் பயன்படுத்தவும். இது மூல காரணப் பகுப்பாய்விற்கு (root-cause analysis) பயனுள்ளதாக இருக்கும். Cypher-இல், நீங்கள் ஹாப்களின் வரம்பை (range of hops) அமைக்கலாம். ஒரு பிழைக்கான மறுஉருவாக்கப் படிகளைக் (reproduction steps) கண்டறிய, ஒரு வினவல் (query) 1 முதல் 5 அடுக்குகள் ஆழமாகத் தேடலாம்.

  2. பிரெத் டிராவர்சல் (Breadth Traversal) முழு சூழலையும் (ecosystem) பார்க்க இதைப் பயன்படுத்தவும். இது அனைத்து உடனடி இணைப்புகளையும் காண கிடைமட்டமாக (horizontally) விரிவடைகிறது. இது ஒரு தயாரிப்பைப் பாதிக்கும் ஒவ்வொரு ஆதரவு டிக்கெட்டையும் (support ticket) ஒரே நேரத்தில் பார்க்க உதவுகிறது.

மேம்பட்ட AI-ஐ உருவாக்க, இந்த வினவல்களை (queries) ஹார்ட்-கோட் (hard-code) செய்ய வேண்டாம். ஒரு மல்டி-ஏஜென்ட் சிஸ்டத்தைப் (multi-agent system) பயன்படுத்தவும்:

  • ஒருங்கிணைப்பாளர் ஏஜென்ட் (The Coordinator Agent): இந்த ஏஜென்ட் வினவத் திட்டமிடுகிறது. கேள்விக்கு அகலமான தேடல் (breadth) தேவையா அல்லது ஆழமான தேடல் (depth) தேவையா என்பதை இது தீர்மானிக்கிறது. இது பயனர் ப்ராம்ப்ட்டை (user prompt) வரைபட வினவலுக்கான (graph query) ஒரு கணித அளவுருவாக (mathematical parameter) மாற்றுகிறது.
  • மறுநிகழ்வு மீட்டெடுப்பு ஏஜென்ட் (The Recursive Retrieval Agent): தரவுத்தளம் நோட்களைக் கண்டறியும் போது, இந்த ஏஜென்ட் அவற்றை மதிப்பீடு செய்கிறது. LLM பார்ப்பதற்கு முன்பே இது முக்கியமான தரவுகளைத் தக்கவைத்துக்கொண்டு, தேவையற்ற இரைச்சல்களை (noise) நீக்குகிறது.

இந்த கட்டமைப்பு (architecture) தனது விசாரணையை விரிவுபடுத்தக்கூடிய அமைப்புகளை உருவாக்குகிறது. வெக்டர் தேடலால் வழங்க முடியாத முழுமையான பதில்களை நீங்கள் பெறலாம்.

ஆதாரம்: https://dev.to/imhyke/understanding-multi-hop-reasoning-how-graph-databases-traverse-data-for-ai-31ml

விருப்பத்தேர்வு கற்றல் சமூகம்: https://t.me/GyaanSetuAi