𝗩𝗲𝗰𝘁𝗼𝗿 𝗦𝗲𝗮𝗿𝗰𝗵 𝗜𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵 𝗳𝗼𝗿 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗜

Production AI-க்கு வெக்டர் தேடல் (Vector Search) மட்டும் போதுமானதல்ல.

வெக்டர் தேடல் பொருண்மை சார்ந்த மீட்டெடுப்பை (semantic retrieval) மாற்றியமைத்தது. நீங்கள் தரவை எம்பெட் (embed) செய்து, ஒரு வினவலை (query) எம்பெட் செய்து, அதன் அருகிலுள்ள தரவுகளைக் கண்டறிகிறீர்கள். இது பழைய முக்கியச்சொல் பொருத்தம் (keyword matching) முறையை மாற்றியமைத்தது.

ஆனால் Production AI-க்கு ஒத்த எம்பெடிங்குகளை (embeddings) விட மேலதிகத் தேவைகள் உள்ளன. மீட்டெடுப்பு என்பது ஒரு 'அருகிலுள்ள தரவு' (neighbor) சிக்கலில் இருந்து, தரவரிசைப்படுத்துதல் (ranking) மற்றும் முடிவெடுத்தல் (decision) சார்ந்த சிக்கலாக மாறிவருகிறது.

ஒரு முன்மாதிரி (prototype) வெக்டர்களுடன் செயல்படும். ஆனால் ஒரு production system-க்கு அதற்கு மேலதிகத் தேவைகள் உள்ளன.

ஒரு உண்மையான பயனர் வினவிற்கு இவை அனைத்தும் ஒரே நேரத்தில் தேவைப்படுகின்றன:

பெரும்பாலான குழுக்கள் பல்வேறு கருவிகளை ஒன்றிணைப்பதன் மூலம் இதைத் தீர்க்க முயல்கின்றன. நீங்கள் ஒரு வெக்டர் தரவுத்தளம் (vector database), ஒரு தேடுபொறி (search engine), ஒரு reranker மற்றும் ஒரு feature store ஆகியவற்றை இணைக்கிறீர்கள்.

இது சில சிக்கல்களை உருவாக்குகிறது:

வெக்டர்கள் ஒரு பரிமாண வரிசைகள் (one-dimensional arrays). டென்சர்கள் (Tensors) பல பரிமாண அமைப்புகள் (multi-dimensional structures).

டென்சர்கள் அடர்த்தியான எம்பெடிங்குகள் (dense embeddings), சிதறிய அம்சங்கள் (sparse features) மற்றும் மெட்டாடேட்டா ஆகியவற்றை ஒரே முறையில் இணைக்க அனுமதிக்கின்றன. இதன் மூலம் சிதறிய குழாய்வழி முறையை (fragmented pipeline) நீங்கள் தவிர்க்கலாம்.

ColBERT போன்ற புதிய மாதிரிகள் பல-வெக்டர் அணுகுமுறைகளைப் (multi-vector approaches) பயன்படுத்துகின்றன. அவை ஒரு ஆவணத்தை ஒரே புள்ளியாகச் சுருக்குவதில்லை. அவை டோக்கன் அளவிலான (token-level) விவரங்களைப் பராமரிக்கின்றன. இது பொருத்தத்தை (relevance) மேம்படுத்துகிறது, ஆனால் பழைய வெக்டர் தரவுத்தளங்களைச் சிதைக்கிறது.

டென்சர்-நேட்டிவ் கட்டமைப்புகள் (Tensor-native architectures) இந்த அமைப்புகளுக்கே முதன்மை முன்னுரிமை அளிக்கின்றன. அவை இவற்றை எளிய வெக்டர் வடிவங்களுக்குள் கட்டாயப்படுத்தவில்லை.

நீங்கள் RAG குழாய்வழிகளை (pipelines) அல்லது பரிந்துரை அமைப்புகளை (recommendation systems) உருவாக்குகிறீர்கள் என்றால், இந்தத் துண்டாடல் (fragmentation) உங்கள் வேகத்தைக் குறைக்கும். உங்கள் வணிகம் வளர வளர இது இன்னும் மோசமாகும்.

உங்களை நீங்களே இந்தக் கேள்விகளைக் கேட்டுக்கொள்ளுங்கள்:

உங்கள் கட்டமைப்பு சார்ந்த முடிவுகளை எடுக்க உதவ, GigaOm அறிக்கையில் முழு விவரங்களையும் படிக்கவும்.

Source: https://dev.to/thegatewayguy/vector-search-got-you-started-production-ai-needs-tensors-41dl

Optional learning community: https://t.me/GyaanSetuAi