𝗩𝗲𝗰𝘁𝗼𝗿 𝗦𝗲𝗮𝗿𝗰𝗵 𝗜𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵 𝗳𝗼𝗿 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗜

📅4 hours ago⏱1 min read

Wyszukiwanie wektorowe to za mało dla produkcyjnej sztucznej inteligencji

Wyszukiwanie wektorowe zmieniło semantyczne pobieranie danych (retrieval). Tworzysz osadzenia (embeddings) dla danych i zapytania, a następnie znajdujesz najbliższych sąsiadów. Zastąpiło ono stare dopasowywanie słów kluczowych.

Jednak produkcyjna sztuczna inteligencja potrzebuje czegoś więcej niż tylko podobnych osadzeń. Proces pobierania danych ewoluuje z problemu znajdowania sąsiadów w problem rankingu i podejmowania decyzji.

Prototyp może działać na wektorach. System produkcyjny wymaga czegoś więcej.

Prawdziwe zapytanie użytkownika wymaga poniższych rzeczy jednocześnie:

Ustrukturyzowanych metadanych i filtrów
Reguł biznesowych do promowania lub obniżania rangi wyników
Personalizacji opartej na historii użytkownika
Świeżości danych i kontroli dostępu
Modeli uczenia maszynowego do rankingu

Większość zespołów rozwiązuje to poprzez łączenie różnych narzędzi. Łączysz bazę danych wektorowych, silnik wyszukiwania, reranker i feature store.

Tworzy to problemy:

Każde połączenie zwiększa opóźnienie (latency)
Każda część wymaga własnych operacji
Utrzymanie synchronizacji danych jest trudne

Wektory to tablice jednowymiarowe. Tensory to struktury wielowymiarowe.

Tensory pozwalają połączyć gęste osadzenia (dense embeddings), rzadkie cechy (sparse features) i metadane w jednym przebiegu. Dzięki temu unikasz rozproszonego potoku (pipeline).

Nowe modele, takie jak ColBERT, wykorzystują podejścia wielowektorowe. Nie kompresują one dokumentu do jednego punktu, lecz zachowują szczegóły na poziomie tokenów. Poprawia to trafność, ale uniemożliwia pracę starym bazom danych wektorowych.

Architektury natywne dla tensorów traktują te struktury jako priorytet. Nie wymuszają na nich przyjmowania prostych kształtów wektorowych.

Jeśli budujesz potoki RAG lub systemy rekomendacyjne, fragmentacja będzie Cię spowalniać. Problem ten nasila się wraz ze wzrostem skali.

Zadaj sobie te pytania:

Ile systemów jest ze sobą „sklejonych” w Twoim stosie technologicznym?
Jaki jest Twój całkowity budżet opóźnień (latency)?
Czy Twoja infrastruktura poradzi sobie z modelami wielowektorowymi?

Przeczytaj pełne szczegóły w raporcie GigaOm, aby wspomóc swoje decyzje architektoniczne.

Źródło: https://dev.to/thegatewayguy/vector-search-got-you-started-production-ai-needs-tensors-41dl

Opcjonalna społeczność edukacyjna: https://t.me/GyaanSetuAi

𝗩𝗲𝗰𝘁𝗼𝗿 𝗦𝗲𝗮𝗿𝗰𝗵 𝗜𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵 𝗳𝗼𝗿 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗜

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗔𝗚, 𝗔𝗜 𝗠𝗲𝗺𝗼𝗿𝘆, 𝗮𝗻𝗱 𝗚𝗼𝗼𝗴𝗹𝗲 𝗖𝗟𝗜

𝗩𝗲𝗰𝘁𝗼𝗿 𝗗𝗮𝘁𝗮𝗯𝗮𝘀𝗲𝘀 𝘄𝗶𝘁𝗵 𝗔𝗺𝗮𝘇𝗼𝗻 𝗔𝘂𝗿𝗼𝗿𝗮

𝗩𝗲𝗰𝘁𝗼𝗿 𝗧𝗮𝗯𝗹𝗲𝘀 𝟭𝟬𝟭: 𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗩𝗲𝗰𝘁𝗼𝗿 𝗮𝗻𝗱 𝗣𝗚𝗩𝗲𝗰𝘁𝗼𝗿