بازیابی ترکیبی و مشاهده‌پذیری عامل

📅3 hours ago⏱1 min read

بازیابی ترکیبی و مشاهده‌پذیری عامل

اکثر سیستم‌های RAG در محیط عملیاتی شکست می‌خورند. آن‌ها به دلیل مدل زبانی شکست نمی‌خورند، بلکه در مرحله بازیابی (retrieval) دچار مشکل می‌شوند.

سیستم در استخراج قطعه داده (data chunk) صحیح شکست می‌خورد، یا داده را پیدا می‌کند اما آن را در رتبه ۴۰ قرار می‌دهد. در این حالت، مولد (generator) هرگز آن اطلاعات را نمی‌بیند و تیم شما نیز راهی برای فهمیدن اینکه مشکل از کجاست ندارد.

این معماری هر دو مشکل را حل می‌کند.

برای نتایج بهتر، این سه مرحله را دنبال کنید:

از بازیابی ترکیبی (Hybrid Retrieval) استفاده کنید جستجوی واژگانی BM25 و جستجوی معنایی متراکم (dense semantic search) را به‌طور هم‌زمان اجرا کنید. برای ادغام لیست‌ها از روش ترکیب رتبه متقابل (reciprocal rank fusion) استفاده کنید. بنچمارک‌ها نشان می‌دهند که این کار در مقایسه با استفاده از BM25 به تنهایی، میزان Recall@5 را در داده‌های متنی و جدولی ۸ درصد افزایش می‌دهد.
یک بازرتبه‌کننده (Reranker) اضافه کنید یک Reranker بهترین راه برای افزایش دقت (precision) شماست. از یک cross-encoder روی ۵۰ تا ۱۰۰ کاندیدای برتر استفاده کنید. این مرحله نتایج شما را به‌طور قابل‌توجهی بهبود می‌بخشد.
بر مشاهده‌پذیری (Observability) تمرکز کنید برای یافتن خطاها در خط لوله بازیابی (retrieval pipeline) خود، به ردپاها (traces) نیاز دارید. بدون ردپاها، نمی‌توانید سیستم را اصلاح کنید.

سیستم RAG خود را با این استانداردهای عملیاتی بسازید.

منبع: https://dev.to/rishi_kora/hybrid-retrieval-and-agent-observability-a-production-rag-build-2h6p

انجمن یادگیری اختیاری: https://t.me/GyaanSetuAi

بازیابی ترکیبی و مشاهده‌پذیری عامل

Continue reading

𝗛𝗶𝗴𝗵 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗗𝗶𝘀𝘁𝗿𝗶𝗯𝘂𝘁𝗲𝗱 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗔𝗚, 𝗔𝗜 𝗠𝗲𝗺𝗼𝗿𝘆, 𝗮𝗻𝗱 𝗚𝗼𝗼𝗴𝗹𝗲 𝗖𝗟𝗜

𝗬𝗢𝗨𝗥 𝗔𝗚𝗘𝗡𝗧 𝗙𝗔𝗜𝗟𝗘𝗗 𝗜𝗡 𝗣𝗥𝗢𝗗. 𝗚𝗢𝗢𝗗 𝗟𝗨𝗖𝗞 𝗥𝗘𝗣𝗥𝗢𝗗𝗨𝗖𝗜𝗡𝗚 𝗜𝗧.

ساخت عامل‌های هوش مصنوعی تاب‌آور

۷ اشتباهی که عامل‌های هوش مصنوعی را از کار می‌اندازد