Qu'est-ce qu'une base de données vectorielle ?
Vous entendez probablement le terme « base de données vectorielle » lorsque vous lisez des articles sur la recherche par IA ou le RAG.
Une base de données vectorielle stocke les données sous forme de vecteurs. Il s'agit de listes de nombres qui capturent le sens. Au lieu de rechercher des correspondances de mots exactes, elle trouve des éléments par similitude.
Cette technologie rend la recherche par IA « intelligente ».
Les bases de données traditionnelles fonctionnent bien pour les questions précises. Vous demandez un ID utilisateur spécifique ou une liste de commandes de la semaine dernière. Elles ont du mal lorsque vous demandez des choses ayant des sens similaires.
Une base de données vectorielle résout ce problème. Elle utilise des embeddings. Ce sont des empreintes numériques pour le texte, les images ou l'audio. Les éléments ayant des sens similaires ont des vecteurs qui sont proches les uns des autres. Lorsque vous effectuez une recherche, la base de données renvoie les résultats les plus proches de votre requête.
Le processus suit trois étapes :
- Embed : Un modèle d'IA transforme un document ou une image en un vecteur.
- Index : La base de données stocke ces vecteurs dans un index spécial pour permettre une recherche rapide.
- Query : Votre recherche se transforme également en vecteur. La base de données trouve les vecteurs les plus proches de celui-ci.
C'est pourquoi une recherche pour « comment réinitialiser mon mot de passe » peut trouver un article intitulé « récupérer un identifiant oublié ». Les mots sont différents, mais le sens est le même.
Vous n'avez pas besoin de remplacer votre base de données actuelle. La plupart des applications utilisent les deux.
- Les bases de données relationnelles conservent vos enregistrements structurés et vos données exactes.
- Les bases de données vectorielles gèrent la similitude et le sens.
Des outils comme pgvector vous permettent d'ajouter la recherche vectorielle à PostgreSQL. Cela permet de conserver les deux types de données au même endroit.
Les bases de données vectorielles alimentent la recherche sémantique, les recommandations de produits et l'étape de récupération (retrieval) dans le RAG. Elles agissent comme le moteur qui récupère le texte pertinent avant qu'un assistant IA ne vous réponde.
Les options populaires en 2026 incluent :
- Pinecone
- Weaviate
- Qdrant
- Milvus
- Chroma
- pgvector
Choisissez en fonction de votre échelle et de votre préférence pour un service managé ou une installation auto-hébergée.
Source: https://dev.to/ricco020/what-is-a-vector-database-a-plain-english-guide-2026-29c