Гибридный поиск и наблюдаемость агентов

📅2 hours ago⏱1 min read

Гибридный поиск и наблюдаемость агентов

Большинство RAG-систем терпят неудачу в продакшене. Они подводят не из-за языковой модели. Они подводят на этапе поиска (retrieval).

Система не может извлечь нужный фрагмент данных. Или она извлекает данные, но опускает их на 40-е место в выдаче. Генератор так и не видит эту информацию. А у вашей команды нет возможности понять, что именно пошло не так.

Эта архитектура решает обе проблемы.

Следуйте этим трем шагам для достижения лучших результатов:

Используйте гибридный поиск (Hybrid Retrieval) Запускайте лексический поиск BM25 и плотный семантический поиск (dense semantic search) одновременно. Используйте Reciprocal Rank Fusion для объединения списков. Бенчмарки показывают, что это увеличивает Recall@5 на текстовых и табличных данных на 8 процентных пунктов по сравнению с использованием только BM25.
Добавьте реранкер (Reranker) Реранкер — это лучший способ повысить точность (precision). Используйте cross-encoder для топ-50 или топ-100 кандидатов. Этот шаг значительно улучшит ваши результаты.
Сосредоточьтесь на наблюдаемости (Observability) Вам нужны трассировки (traces), чтобы находить ошибки в вашем конвейере поиска (retrieval pipeline). Без трассировок вы не сможете исправить систему.

Стройте свои RAG-системы, следуя этим стандартам продакшена.

Источник: https://dev.to/rishi_kora/hybrid-retrieval-and-agent-observability-a-production-rag-build-2h6p

Опциональное обучающее сообщество: https://t.me/GyaanSetuAi

Гибридный поиск и наблюдаемость агентов

Continue reading

𝗛𝗶𝗴𝗵 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗗𝗶𝘀𝘁𝗿𝗶𝗯𝘂𝘁𝗲𝗱 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗔𝗚, 𝗔𝗜 𝗠𝗲𝗺𝗼𝗿𝘆, 𝗮𝗻𝗱 𝗚𝗼𝗼𝗴𝗹𝗲 𝗖𝗟𝗜

𝗬𝗢𝗨𝗥 𝗔𝗚𝗘𝗡𝗧 𝗙𝗔𝗜𝗟𝗘𝗗 𝗜𝗡 𝗣𝗥𝗢𝗗. 𝗚𝗢𝗢𝗗 𝗟𝗨𝗖𝗞 𝗥𝗘𝗣𝗥𝗢𝗗𝗨𝗖𝗜𝗡𝗚 𝗜𝗧.

𝗕𝘂𝗶𝗹𝗱𝗶𝗻𝗴 𝗥𝗲𝘀𝗶𝗹𝗶𝗲𝗻𝘁 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀