Understanding Multi-Hop Reasoning

Векторні бази даних добре працюють для семантичного пошуку. Проте вони мають труднощі з багатоетапними міркуваннями між людьми, системами та подіями.

Стандартний RAG витягує фрагменти тексту на основі математичних розрахунків. Він пропускає зв'язки між точками даних. GraphRAG вирішує цю проблему. Він підключає великі мовні моделі (LLM) до живого графа знань.

Граф із текстовими атрибутами (Text-Attributed Graph) використовує вузли та ребра.

  • Вузли — це сутності, такі як користувачі або продукти.
  • Ребра — це зв'язки, такі як "IMPACTS" або "CLONED_FROM".
  • "Крок" (hop) — це перехід від одного вузла до іншого через ребро.

Багатокрокові міркування (multi-hop reasoning) дозволяють знаходити зв'язки, яких немає в жодному окремому документі.

Приклад: Користувач запитує: "Як мені виправити помилку завантаження CSV?"

Стандартний RAG шукає за ключовими словами. Він може повернути старе FAQ або випадковий звіт про помилку. Він пропускає бізнес-контекст.

GraphRAG відстежує точний шлях: (Звіт користувача про помилку) -> [CLONED_FROM] -> (Головний інженерний тікет) -> [HAS_RESOLUTION] -> (Патч розгорнуто).

Це надає LLM перевірені кроки замість приблизних припущень.

Ви можете керувати цим за допомогою двох методів:

  1. Обхід за глибиною (Depth Traversal) Використовуйте це для заглиблення в конкретні деталі. Це корисно для аналізу першопричин. У Cypher ви встановлюєте діапазон кроків. Запит може шукати на глибині від 1 до 5 рівнів, щоб знайти кроки для відтворення помилки.

  2. Обхід у ширину (Breadth Traversal) Використовуйте це, щоб побачити всю екосистему. Він розширюється горизонтально, щоб охопити всі безпосередні зв'язки. Це допомагає побачити всі тікети підтримки, що впливають на один продукт, одночасно.

Щоб створювати передовий ШІ, не прописуйте ці запити жорстко. Використовуйте багатоагентну систему:

  • Агент-координатор (Coordinator Agent): Цей агент планує запит. Він вирішує, чи потребує питання охоплення в ширину, чи глибини. Він перетворює запит користувача на математичний параметр для графового запиту.
  • Агент рекурсивного пошуку (Recursive Retrieval Agent): Цей агент оцінює вузли в міру того, як їх знаходить база даних. Він зберігає важливі дані та видаляє шум перед тим, як їх побачить LLM.

Така архітектура дозволяє створювати системи, які масштабують процес дослідження. Ви отримуєте вичерпні відповіді, які не може надати векторний пошук.

Source: https://dev.to/imhyke/understanding-multi-hop-reasoning-how-graph-databases-traverse-data-for-ai-31ml

Optional learning community: https://t.me/GyaanSetuAi