𝗩𝗲𝗰𝘁𝗼𝗿 𝗦𝗲𝗮𝗿𝗰𝗵 𝗜𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵 𝗳𝗼𝗿 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗜

📅4 hours ago⏱1 min read

חיפוש וקטורי אינו מספיק עבור AI בסביבת ייצור

חיפוש וקטורי שינה את אופן השליפה הסמנטית. אתה מבצע embedding לנתונים, embedding לשאילתה, ומוצא שכנים. הוא החליף את התאמת מילות המפתח הישנה.

אך AI בסביבת ייצור זקוק ליותר מאשר embeddings דומים. השליפה עוברת מבעיית "שכנים" לבעיה של דירוג וקבלת החלטות.

אב-טיפוס עובד עם וקטורים. מערכת ייצור דורשת יותר.

שאילתת משתמש אמיתית זקוקה לדברים הבאים בו-זמנית:

מטא-דאטה מובנה ופילטרים
חוקים עסקיים להעלאה (boost) או הורדה (demote) של תוצאות
פרסונליזציה המבוססת על היסטוריית המשתמש
רעננות נתונים ובקרת גישה
מודלים של למידת מכונה לדירוג

רוב הצוותים פותרים זאת על ידי חיבור של כלים שונים. אתה מחבר מסד נתונים וקטורי, מנוע חיפוש, reranker ומאגר מאפיינים (feature store).

זה יוצר בעיות:

כל חיבור מוסיף שיהוי (latency)
כל חלק זקוק לתפעול (operations) משלו
שמירה על סנכרון הנתונים היא משימה קשה

וקטורים הם מערכים חד-ממדיים. טנזורים (Tensors) הם מבנים רב-ממדיים.

טנזורים מאפשרים לך לשלב dense embeddings, מאפיינים דלילים (sparse features) ומטא-דאטה במעבר אחד. כך נמנעת בניית pipeline מקוטע.

מודלים חדשים כמו ColBERT משתמשים בגישות מרובות-וקטורים. הם אינם דוחסים מסמך לנקודה אחת. הם שומרים על פרטים ברמת ה-token. זה משפר את הרלוונטיות אך שובר מסדי נתונים וקטוריים ישנים.

ארכיטקטורות Tensor-native מתייחסות למבנים אלו כעדיפות עליונה. הן אינן מכריחות אותם להיכנס לצורות וקטוריות פשוטות.

אם אתם בונים RAG pipelines או מערכות המלצה, הפיצול (fragmentation) יאט אתכם. המצב מחמיר ככל שאתם צומחים.

שאלו את עצמכם את השאלות הבאות:

כמה מערכות "מודבקות" זו לזו ב-stack שלכם?
מה תקציב השיהוי (latency) הכולל שלכם?
האם התשתית שלכם יכולה להתמודד עם מודלים מרובי-וקטורים?

קראו את הפרטים המלאים בדו"ח של GigaOm כדי לסייע בקבלת החלטות ארכיטקטוניות.

מקור: https://dev.to/thegatewayguy/vector-search-got-you

𝗩𝗲𝗰𝘁𝗼𝗿 𝗦𝗲𝗮𝗿𝗰𝗵 𝗜𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵 𝗳𝗼𝗿 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗜

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗔𝗚, 𝗔𝗜 𝗠𝗲𝗺𝗼𝗿𝘆, 𝗮𝗻𝗱 𝗚𝗼𝗼𝗴𝗹𝗲 𝗖𝗟𝗜

𝗩𝗲𝗰𝘁𝗼𝗿 𝗗𝗮𝘁𝗮𝗯𝗮𝘀𝗲𝘀 𝘄𝗶𝘁𝗵 𝗔𝗺𝗮𝘇𝗼𝗻 𝗔𝘂𝗿𝗼𝗿𝗮

𝗩𝗲𝗰𝘁𝗼𝗿 𝗧𝗮𝗯𝗹𝗲𝘀 𝟭𝟬𝟭: 𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗩𝗲𝗰𝘁𝗼𝗿 𝗮𝗻𝗱 𝗣𝗚𝗩𝗲𝗰𝘁𝗼𝗿