𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

📅2 hours ago⏱1 min read

Гібридний пошук та спостережуваність агентів

Більшість RAG-систем зазнають невдачі у продакшені. Вони дають збій не через мовну модель. Вони дають збій на етапі пошуку (retrieval).

Система не може знайти потрібний фрагмент даних. Або вона знаходить дані, але ховає їх на 40-му місці в ранжуванні. Генератор ніколи не бачить цієї інформації. Ваша команда не має можливості побачити, що саме пішло не так.

Ця архітектура вирішує обидві проблеми.

Дотримуйтесь цих трьох кроків для кращих результатів:

Використовуйте гібридний пошук (Hybrid Retrieval) Запускайте лексичний BM25 та щільний семантичний пошук (dense semantic search) одночасно. Використовуйте reciprocal rank fusion для об'єднання списків. Тести показують, що це додає 8 відсоткових пунктів до Recall@5 на текстових та табличних даних порівняно лише з BM25.
Додайте реранкер (Reranker) Реранкер — це найкращий спосіб підвищити точність (precision). Використовуйте cross-encoder для 50–100 найкращих кандидатів. Цей крок значно покращує ваші результати.
Зосередьтеся на спостережуваності (Observability) Вам потрібні трасування (traces), щоб знаходити помилки у вашому конвеєрі пошуку (retrieval pipeline). Без трасування ви не зможете виправити систему.

Будуйте свою RAG-систему відповідно до цих стандартів продакшену.

Джерело: https://dev.to/rishi_kora/hybrid-retrieval-and-agent-observability-a-production-rag-build-2h6p

Додаткова спільнота для навчання: https://t.me/GyaanSetuAi

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

Continue reading

𝗛𝗶𝗴𝗵 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗗𝗶𝘀𝘁𝗿𝗶𝗯𝘂𝘁𝗲𝗱 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗔𝗚, 𝗔𝗜 𝗠𝗲𝗺𝗼𝗿𝘆, 𝗮𝗻𝗱 𝗚𝗼𝗼𝗴𝗹𝗲 𝗖𝗟𝗜

𝗬𝗢𝗨𝗥 𝗔𝗚𝗘𝗡𝗧 𝗙𝗔𝗜𝗟𝗘𝗗 𝗜𝗡 𝗣𝗥𝗢𝗗. 𝗚𝗢𝗢𝗗 𝗟𝗨𝗖𝗞 𝗥𝗘𝗣𝗥𝗢𝗗𝗨𝗖𝗜𝗡𝗚 𝗜𝗧.

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗥𝗲𝘀𝗶𝗹𝗶𝗲𝗻𝘁 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

7 помилок, які ламають ШІ-агентів