𝗩𝗲𝗰𝘁𝗼𝗿 𝗦𝗲𝗮𝗿𝗰𝗵 𝗜𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵 𝗳𝗼𝗿 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗜

📅3 hours ago⏱1 min read

การค้นหาแบบเวกเตอร์ (Vector search) ได้เปลี่ยนโฉมการดึงข้อมูลเชิงความหมาย (semantic retrieval) โดยคุณเพียงแค่ทำ embedding ข้อมูล ทำ embedding คำค้นหา แล้วหาจุดที่อยู่ใกล้เคียงกัน ซึ่งมันได้เข้ามาแทนที่การจับคู่ด้วยคำสำคัญ (keyword matching) แบบเดิม

แต่ Production AI ต้องการอะไรที่มากกว่าแค่ embedding ที่คล้ายกัน การดึงข้อมูล (Retrieval) กำลังเปลี่ยนผ่านจากการแก้ปัญหาเรื่อง "เพื่อนบ้าน" (neighbor problem) ไปสู่ปัญหาเรื่อง "การจัดลำดับและการตัดสินใจ" (ranking and decision problem)

ตัวต้นแบบ (Prototype) อาจทำงานได้ด้วยเวกเตอร์ แต่ระบบที่ใช้งานจริง (Production system) ต้องการมากกว่านั้น

คำค้นหาของผู้ใช้จริงจำเป็นต้องมีสิ่งเหล่านี้พร้อมกัน:

Metadata แบบมีโครงสร้างและตัวกรอง (filters)
กฎทางธุรกิจเพื่อเพิ่มหรือลดความสำคัญของผลลัพธ์ (boost or demote)
การปรับแต่งเฉพาะบุคคลตามประวัติของผู้ใช้ (Personalization)
ความสดใหม่ของข้อมูลและการควบคุมการเข้าถึง (access controls)
โมเดล Machine Learning สำหรับการจัดลำดับ (ranking)

ทีมส่วนใหญ่แก้ปัญหานี้ด้วยการนำเครื่องมือต่างๆ มาเชื่อมต่อกัน โดยคุณต้องเชื่อมต่อทั้ง vector database, search engine, reranker และ feature store เข้าด้วยกัน

ซึ่งสิ่งนี้สร้างปัญหา:

ทุกการเชื่อมต่อทำให้เกิดความหน่วง (latency) เพิ่มขึ้น
แต่ละส่วนต้องมีการจัดการ (operations) แยกกัน
การทำให้ข้อมูลซิงค์กัน (in sync) เป็นเรื่องยาก

เวกเตอร์คืออาร์เรย์หนึ่งมิติ (one-dimensional arrays) ส่วนเทนเซอร์ (Tensors) คือโครงสร้างแบบหลายมิติ (multi-dimensional structures)

Tensors ช่วยให้คุณรวม dense embeddings, sparse features และ metadata เข้าด้วยกันได้ในการประมวลผลเพียงครั้งเดียว (one pass) ซึ่งช่วยหลีกเลี่ยงปัญหา pipeline ที่กระจัดกระจาย

โมเดลใหม่ๆ อย่าง ColBERT ใช้แนวทางแบบ multi-vector โดยไม่ได้บีบอัดเอกสารให้เหลือเพียงจุดเดียว แต่จะเก็บรายละเอียดในระดับ token ไว้ ซึ่งช่วยเพิ่มความแม่นยำ (relevance) แต่ก็ทำให้ฐานข้อมูลเวกเตอร์แบบเดิมใช้งานไม่ได้

สถาปัตยกรรมแบบ Tensor-native จะให้ความสำคัญกับโครงสร้างเหล่านี้เป็นอันดับแรก โดยไม่พยายามบังคับให้พวกมันอยู่ในรูปแบบเวกเตอร์ที่เรียบง่ายเกินไป

หากคุณกำลังสร้าง RAG pipelines หรือระบบแนะนำ (recommendation systems) ความกระจัดกระจายของระบบจะทำให้คุณทำงานช้าลง และปัญหานี้จะยิ่งรุนแรงขึ้นเมื่อระบบของคุณขยายตัว

ลองถามคำถามเหล่านี้กับตัวเอง:

มีกี่ระบบที่ถูกนำมาปะติดปะต่อกันใน stack ของคุณ?
งบประมาณความหน่วง (latency budget) ทั้งหมดของคุณคือเท่าไหร่?
โครงสร้างพื้นฐาน (infrastructure) ของคุณสามารถรองรับโมเดลแบบ multi-vector ได้หรือไม่?

อ่านรายละเอียดฉบับเต็มในสรุปของ GigaOm เพื่อช่วยในการตัดสินใจด้านสถาปัตยกรรมของคุณ

Source: https://dev.to/thegatewayguy/vector-search-got-you-started-production-ai-needs-tensors-41dl

Optional learning community: https://t.me/GyaanSetuAi

𝗩𝗲𝗰𝘁𝗼𝗿 𝗦𝗲𝗮𝗿𝗰𝗵 𝗜𝘀 𝗡𝗼𝘁 𝗘𝗻𝗼𝘂𝗴𝗵 𝗳𝗼𝗿 𝗣𝗿𝗼𝗱𝘂𝗰𝘁𝗶𝗼𝗻 𝗔𝗜

Continue reading

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗔𝗜 𝗜𝘀 𝗠𝗼𝗿𝗲 𝗧𝗵𝗮𝗻 𝗣𝗿𝗼𝗺𝗽𝘁𝘀

𝗛𝘆𝗯𝗿𝗶𝗱 𝗥𝗔𝗚, 𝗔𝗜 𝗠𝗲𝗺𝗼𝗿𝘆, 𝗮𝗻𝗱 𝗚𝗼𝗼𝗴𝗹𝗲 𝗖𝗟𝗜

𝗩𝗲𝗰𝘁𝗼𝗿 𝗗𝗮𝘁𝗮𝗯𝗮𝘀𝗲𝘀 𝘄𝗶𝘁𝗵 𝗔𝗺𝗮𝘇𝗼𝗻 𝗔𝘂𝗿𝗼𝗿𝗮

𝗩𝗲𝗰𝘁𝗼𝗿 𝗧𝗮𝗯𝗹𝗲𝘀 𝟭𝟬𝟭: 𝗨𝗻𝗱𝗲𝗿𝘀𝘁𝗮𝗻𝗱𝗶𝗻𝗴 𝗩𝗲𝗰𝘁𝗼𝗿 𝗮𝗻𝗱 𝗣𝗚𝗩𝗲𝗰𝘁𝗼𝗿