𝗩𝗲𝗰𝘁𝗼𝗿 𝗦𝗲𝗮𝗿𝗰𝗵 𝗜𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵 𝗳𝗼𝗿 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗜
Production AI-க்கு வெக்டர் தேடல் (Vector Search) மட்டும் போதுமானதல்ல.
வெக்டர் தேடல் பொருண்மை சார்ந்த மீட்டெடுப்பை (semantic retrieval) மாற்றியமைத்தது. நீங்கள் தரவை எம்பெட் (embed) செய்து, ஒரு வினவலை (query) எம்பெட் செய்து, அதன் அருகிலுள்ள தரவுகளைக் கண்டறிகிறீர்கள். இது பழைய முக்கியச்சொல் பொருத்தம் (keyword matching) முறையை மாற்றியமைத்தது.
ஆனால் Production AI-க்கு ஒத்த எம்பெடிங்குகளை (embeddings) விட மேலதிகத் தேவைகள் உள்ளன. மீட்டெடுப்பு என்பது ஒரு 'அருகிலுள்ள தரவு' (neighbor) சிக்கலில் இருந்து, தரவரிசைப்படுத்துதல் (ranking) மற்றும் முடிவெடுத்தல் (decision) சார்ந்த சிக்கலாக மாறிவருகிறது.
ஒரு முன்மாதிரி (prototype) வெக்டர்களுடன் செயல்படும். ஆனால் ஒரு production system-க்கு அதற்கு மேலதிகத் தேவைகள் உள்ளன.
ஒரு உண்மையான பயனர் வினவிற்கு இவை அனைத்தும் ஒரே நேரத்தில் தேவைப்படுகின்றன:
- கட்டமைக்கப்பட்ட மெட்டாடேட்டா (metadata) மற்றும் வடிகட்டிகள் (filters)
- முடிவுகளை முன்னிலைப்படுத்த அல்லது தரம் குறைக்க வணிக விதிகள் (business rules)
- பயனர் வரலாற்றின் அடிப்படையில் தனிப்பயனாக்கம் (personalization)
- தரவின் புதுப்பித்தன்மை (data freshness) மற்றும் அணுகல் கட்டுப்பாடுகள் (access controls)
- தரவரிசைப்படுத்துதலுக்கான இயந்திர கற்றல் மாதிரிகள் (machine learning models)
பெரும்பாலான குழுக்கள் பல்வேறு கருவிகளை ஒன்றிணைப்பதன் மூலம் இதைத் தீர்க்க முயல்கின்றன. நீங்கள் ஒரு வெக்டர் தரவுத்தளம் (vector database), ஒரு தேடுபொறி (search engine), ஒரு reranker மற்றும் ஒரு feature store ஆகியவற்றை இணைக்கிறீர்கள்.
இது சில சிக்கல்களை உருவாக்குகிறது:
- ஒவ்வொரு இணைப்பும் தாமதத்தை (latency) ஏற்படுத்துகிறது
- ஒவ்வொரு பகுதியையும் தனித்தனியாக நிர்வகிக்க வேண்டியுள்ளது
- தரவை ஒத்திசைவாக (sync) வைத்திருப்பது கடினம்
வெக்டர்கள் ஒரு பரிமாண வரிசைகள் (one-dimensional arrays). டென்சர்கள் (Tensors) பல பரிமாண அமைப்புகள் (multi-dimensional structures).
டென்சர்கள் அடர்த்தியான எம்பெடிங்குகள் (dense embeddings), சிதறிய அம்சங்கள் (sparse features) மற்றும் மெட்டாடேட்டா ஆகியவற்றை ஒரே முறையில் இணைக்க அனுமதிக்கின்றன. இதன் மூலம் சிதறிய குழாய்வழி முறையை (fragmented pipeline) நீங்கள் தவிர்க்கலாம்.
ColBERT போன்ற புதிய மாதிரிகள் பல-வெக்டர் அணுகுமுறைகளைப் (multi-vector approaches) பயன்படுத்துகின்றன. அவை ஒரு ஆவணத்தை ஒரே புள்ளியாகச் சுருக்குவதில்லை. அவை டோக்கன் அளவிலான (token-level) விவரங்களைப் பராமரிக்கின்றன. இது பொருத்தத்தை (relevance) மேம்படுத்துகிறது, ஆனால் பழைய வெக்டர் தரவுத்தளங்களைச் சிதைக்கிறது.
டென்சர்-நேட்டிவ் கட்டமைப்புகள் (Tensor-native architectures) இந்த அமைப்புகளுக்கே முதன்மை முன்னுரிமை அளிக்கின்றன. அவை இவற்றை எளிய வெக்டர் வடிவங்களுக்குள் கட்டாயப்படுத்தவில்லை.
நீங்கள் RAG குழாய்வழிகளை (pipelines) அல்லது பரிந்துரை அமைப்புகளை (recommendation systems) உருவாக்குகிறீர்கள் என்றால், இந்தத் துண்டாடல் (fragmentation) உங்கள் வேகத்தைக் குறைக்கும். உங்கள் வணிகம் வளர வளர இது இன்னும் மோசமாகும்.
உங்களை நீங்களே இந்தக் கேள்விகளைக் கேட்டுக்கொள்ளுங்கள்:
- உங்கள் தொழில்நுட்ப அடுக்குத் தொகுப்பில் (stack) எத்தனை அமைப்புகள் ஒன்றிணைக்கப்பட்டுள்ளன?
- உங்கள் மொத்த தாமத வரம்பு (latency budget) என்ன?
- உங்கள் உள்கட்டமைப்பு (infrastructure) பல-வெக்டர் மாதிரிகளைக் கையாள முடியுமா?
உங்கள் கட்டமைப்பு சார்ந்த முடிவுகளை எடுக்க உதவ, GigaOm அறிக்கையில் முழு விவரங்களையும் படிக்கவும்.
Source: https://dev.to/thegatewayguy/vector-search-got-you-started-production-ai-needs-tensors-41dl
Optional learning community: https://t.me/GyaanSetuAi