ভেক্টর ডেটাবেস কী?

AI সার্চ বা RAG সম্পর্কে পড়ার সময় আপনি সম্ভবত 'vector database' শব্দটি শুনেছেন।

একটি ভেক্টর ডেটাবেস ডেটাকে ভেক্টর হিসেবে সংরক্ষণ করে। এগুলো হলো সংখ্যার তালিকা যা কোনো বিষয়ের অর্থ বা মর্মার্থ ধারণ করে। শব্দের হুবহু মিল খোঁজার পরিবর্তে, এটি সাদৃশ্যের ভিত্তিতে তথ্য খুঁজে বের করে।

এই প্রযুক্তি AI সার্চকে আরও বুদ্ধিদীপ্ত করে তোলে।

প্রথাগত ডেটাবেসগুলো সুনির্দিষ্ট প্রশ্নের ক্ষেত্রে ভালো কাজ করে। আপনি যখন কোনো নির্দিষ্ট ইউজার আইডি বা গত সপ্তাহের অর্ডারের তালিকা চান, তখন এগুলো কার্যকর। কিন্তু যখন আপনি একই ধরণের অর্থ বহন করে এমন কিছু খোঁজেন, তখন এগুলো সমস্যায় পড়ে।

একটি ভেক্টর ডেটাবেস এই সমস্যার সমাধান করে। এটি embeddings ব্যবহার করে। এগুলো হলো টেক্সট, ইমেজ বা অডিওর জন্য গাণিতিক বা সংখ্যাসূচক ফিঙ্গারপ্রিন্ট। যেসব বিষয়ের অর্থ কাছাকাছি, তাদের ভেক্টরগুলোও একে অপরের খুব কাছে থাকে। আপনি যখন সার্চ করেন, ডেটাবেসটি আপনার কুয়েরির (query) সবচেয়ে কাছাকাছি ফলাফলগুলো প্রদান করে।

প্রক্রিয়াটি তিনটি ধাপে সম্পন্ন হয়:

  • Embed: একটি AI মডেল কোনো ডকুমেন্ট বা ইমেজকে ভেক্টরে রূপান্তরিত করে।
  • Index: দ্রুত সার্চ করার সুবিধার্থে ডেটাবেস এই ভেক্টরগুলোকে একটি বিশেষ ইনডেক্সে সংরক্ষণ করে।
  • Query: আপনার সার্চটিও একটি ভেক্টরে রূপান্তরিত হয়। ডেটাবেস তখন তার সবচেয়ে কাছাকাছি থাকা ভেক্টরগুলো খুঁজে বের করে।

এই কারণেই "how to reset my password" লিখে সার্চ করলে "recover a forgotten login" শিরোনামের একটি আর্টিকেল খুঁজে পাওয়া সম্ভব। শব্দগুলো আলাদা হলেও এদের অর্থ একই।

আপনার বর্তমান ডেটাবেস পরিবর্তন করার প্রয়োজন নেই। বেশিরভাগ অ্যাপই উভয়টি ব্যবহার করে।

  • Relational databases আপনার স্ট্রাকচার্ড রেকর্ড এবং সুনির্দিষ্ট ডেটা সংরক্ষণ করে।
  • Vector databases সাদৃশ্য এবং অর্থের বিষয়গুলো পরিচালনা করে।

pgvector-এর মতো টুল ব্যবহার করে আপনি PostgreSQL-এ ভেক্টর সার্চ যুক্ত করতে পারেন। এতে উভয় ধরণের ডেটা এক জায়গাতেই থাকে।

ভেক্টর ডেটাবেস সিম্যান্টিক সার্চ (semantic search), প্রোডাক্ট রিকমেন্ডেশন এবং RAG-এর রিট্রিভাল (retrieval) ধাপকে সচল করে। একটি AI অ্যাসিস্ট্যান্ট আপনাকে উত্তর দেওয়ার আগে প্রাসঙ্গিক টেক্সট খুঁজে বের করার ইঞ্জিন হিসেবে এগুলো কাজ করে।

২০২৬ সালের জনপ্রিয় কিছু অপশন হলো:

  • Pinecone
  • Weaviate
  • Qdrant
  • Milvus
  • Chroma
  • pgvector

আপনার কাজের পরিধি এবং আপনি ম্যানেজড সার্ভিস নাকি সেলফ-হোস্টেড সেটআপ চান, তার ওপর ভিত্তি করে বেছে নিন।

উৎস: https://dev.to/ricco020/what-is-a-vector-database-a-plain-english-guide-2026-29c