𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

📅2 hours ago⏱1 min read

שליפה היברידית ו-Observability של סוכנים

רוב מערכות ה-RAG נכשלות בסביבת ייצור (production). הן לא נכשלות בגלל מודל השפה; הן נכשלות בשלב השליפה (retrieval).

המערכת נכשלת בשליפת מקטע הנתונים (data chunk) הנכון, או שהיא שולפת את הנתונים אך קוברת אותם בדירוג 40. הגנרטור לעולם לא רואה את המידע, ולצוות שלכם אין דרך לראות מה השתבש.

הארכיטקטורה הזו פותרת את שתי הבעיות.

עקבו אחר שלושת השלבים הללו לתוצאות טובות יותר:

השתמשו בשליפה היברידית (Hybrid Retrieval) הריצו חיפוש BM25 לקסיקלי וחיפוש סמנטי דחוס (dense semantic search) בו-זמנית. השתמשו ב-reciprocal rank fusion כדי למזג את הרשימות. מדדים (benchmarks) מראים שזה מוסיף 8 נקודות אחוז ל-Recall@5 על נתוני טקסט וטבלאות בהשוואה ל-BM25 לבדו.
הוסיפו Reranker Reranker הוא הדרך הטובה ביותר שלכם להגדיל את הדיוק (precision). השתמשו ב-cross-encoder על 50 עד 100 המועמדים המובילים. שלב זה משפר את התוצאות שלכם משמעותית.
התמקדו ב-Observability אתם זקוקים ל-traces כדי למצוא שגיאות ב-retrieval pipeline שלכם. ללא traces, לא תוכלו לתקן את המערכת.

בנו את מערכת ה-RAG שלכם לפי סטנדרטים אלו של סביבת ייצור.

Source: https://dev.to/rishi_kora/hybrid-retrieval-and-agent-observability-a-production-rag-build-2h6p

Optional learning community: https://t.me/GyaanSetuAi

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗲𝘁𝗿𝗶𝗲𝘃𝗮𝗹 𝗮𝗻𝗱 𝗔𝗴𝗲𝗻𝘁 𝗢𝗯𝘀𝗲𝗿𝘃𝗮𝗯𝗶𝗹𝗶𝘁𝘆

Continue reading

𝗛𝗶𝗴𝗵 𝗣𝗲𝗿𝗳𝗼𝗿𝗺𝗮𝗻𝗰𝗲 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀 𝗔𝗿𝗲 𝗗𝗶𝘀𝘁𝗿𝗶𝗯𝘂𝘁𝗲𝗱 𝗦𝘆𝘀𝘁𝗲𝗺𝘀

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗔𝗚, 𝗔𝗜 𝗠𝗲𝗺𝗼𝗿𝘆, 𝗮𝗻𝗱 𝗚𝗼𝗼𝗴𝗹𝗲 𝗖𝗟𝗜

𝗬𝗢𝗨𝗥 𝗔𝗚𝗘𝗡𝗧 𝗙𝗔𝗜𝗟𝗘𝗗 𝗜𝗡 𝗣𝗥𝗢𝗗. 𝗚𝗢𝗢𝗗 𝗟𝗨𝗖𝗞 𝗥𝗘𝗣𝗥𝗢𝗗𝗨𝗖𝗜𝗡𝗚 𝗜𝗧.

בניית סוכני AI עמידים

𝟳 𝗠𝗶𝘀𝘁𝗮𝗸𝗲𝘀 𝗧𝗵𝗮𝘁 𝗕𝗿𝗲𝗮𝗸 𝗔𝗜 𝗔𝗴𝗲𝗻𝘁𝘀