ai-coding

Qu'est-ce qu'une base de données vectorielle ? Le guide clair (2026)

PrivSec Lab22 juin 20265 min de lecture

Un serveur en rack avec plusieurs baies de disques

Une base de données vectorielle stocke les données sous forme de vecteurs (embeddings) et trouve les éléments par le sens, pas par correspondance exacte. Ce que c'est, comment fonctionne la recherche par similarité, en quoi elle diffère d'une base classique, et pourquoi le RAG et la recherche IA en dépendent.

Si vous avez lu des choses sur le RAG, la recherche IA ou les recommandations, vous avez sans doute croisé le terme base de données vectorielle. Voici la version claire. Une base de données vectorielle stocke les données sous forme de vecteurs - des listes de nombres qui capturent le sens - et trouve les éléments par similarité, pas par correspondance exacte. Cette seule idée est ce qui donne à la recherche IA moderne l'impression de vous comprendre.

Ce qu'est vraiment une base de données vectorielle

Les bases classiques excellent dans les questions exactes : trouver l'utilisateur avec cet ID, ou toutes les commandes de la semaine dernière. Elles peinent sur « trouve-moi des choses qui veulent dire la même chose ». Une base de données vectorielle est conçue exactement pour ça.

Elle s'appuie sur les embeddings - les empreintes numériques qu'un modèle d'IA attribue au texte, aux images ou à l'audio. Les éléments de sens proche obtiennent des vecteurs qui se situent près les uns des autres. La base stocke ces vecteurs et, lors d'une recherche, renvoie ceux qui sont les plus proches de votre requête.

Stockage matériel — Une base de données vectorielle garde des millions d'embeddings sur disque et en mémoire, et les explore par similarité en quelques millisecondes.

Comment fonctionne la recherche par similarité

Le déroulé tient en trois étapes :

Embedding. Un modèle d'embedding transforme chaque document, image ou phrase en vecteur.
Indexation. La base stocke ces vecteurs dans un index spécial (comme HNSW ou IVF) pour pouvoir explorer de grands ensembles rapidement.
Requête. Votre recherche est elle aussi transformée en vecteur. La base renvoie les vecteurs les plus proches par distance.

Ainsi, une recherche pour « comment réinitialiser mon mot de passe » peut faire remonter un article intitulé « récupérer un identifiant oublié ». Les mots diffèrent, mais le sens - et les vecteurs - sont proches.

Base de données vectorielle vs base classique

Elles résolvent des problèmes différents, et la plupart des applications réelles utilisent les deux. Une base relationnelle contient vos enregistrements structurés et répond aux requêtes exactes. Une base vectorielle répond à « qu'est-ce qui ressemble le plus à ceci ? ». Vous gardez les lignes clients dans l'une et le sens recherchable dans l'autre. Des outils comme pgvector permettent même d'ajouter la recherche vectorielle à une base PostgreSQL classique, pour que les deux vivent au même endroit.

Pourquoi c'est important pour l'IA

Une base de données vectorielle est le moteur de récupération derrière une bonne partie de l'IA. Elle alimente la recherche sémantique, les recommandations de produits et de contenus et - surtout - l'étape de récupération dans le RAG, où un assistant va chercher le texte pertinent avant de répondre. Sans recherche par similarité rapide sur les embeddings, aucune de ces fonctionnalités ne serait viable à grande échelle.

Comment la recherche reste rapide : le plus proche voisin approché

Comparer le vecteur de votre requête à chacun des vecteurs stockés - une recherche du plus proche voisin exacte - est précis mais lent dès que vous avez des millions d'éléments. Les bases vectorielles s'appuient donc sur des algorithmes de plus proche voisin approché (ANN). L'ANN échange un tout petit peu de précision contre un gain de vitesse énorme : au lieu de vérifier chaque vecteur, il parcourt une structure d'index astucieuse qui lui donne presque les correspondances les plus proches, vite.

Deux familles d'index font l'essentiel du travail :

HNSW (Hierarchical Navigable Small World) construit un graphe en couches que l'on traverse rapidement. C'est le choix par défaut le plus courant - bon rappel, faible latence, plus de mémoire.
IVF (Inverted File) regroupe les vecteurs en compartiments et ne fouille que les plus proches. Il passe à l'échelle sur de très grands ensembles et consomme moins de mémoire, souvent couplé à une compression (PQ) pour réduire la taille des vecteurs.

Le réglage que vous ajustez est le rappel contre la latence : demandez un rappel plus élevé (davantage des vrais plus proches voisins) et la recherche travaille davantage. La distance se mesure avec une métrique - généralement la similarité cosinus (l'angle entre les vecteurs), le produit scalaire ou la distance euclidienne (L2) - et le modèle d'embedding que vous utilisez impose en général laquelle est correcte.

Les bases de données vectorielles courantes - et laquelle choisir

Il n'y a pas une seule « meilleure » option ; le bon choix dépend de l'échelle, du fait de vouloir un service géré ou de l'héberger soi-même, et du besoin d'avoir les vecteurs à côté de données relationnelles existantes. Les choix répandus en 2026 :

Base	Modèle	Bon choix quand…
pgvector	Extension PostgreSQL	Vous utilisez déjà Postgres et voulez les vecteurs à côté de vos données classiques - une seule base, pas de service en plus.
Chroma	Open source, intégrable	Prototypage ou petite application ; rapide à démarrer en local.
Qdrant	Open source, auto-hébergé ou géré	Vous voulez un filtrage riche par métadonnées et de bonnes performances en gardant la main sur l'hébergement.
Weaviate	Open source, auto-hébergé ou géré	Vous voulez des modules intégrés (recherche hybride, vectorisation) et une approche orientée schéma.
Milvus	Open source, conçu pour l'échelle	Très grandes collections (des centaines de millions et plus) et fortes charges.
Pinecone	Entièrement géré (propriétaire)	Vous voulez un service serverless clé en main, sans gérer d'infrastructure.

Une règle simple : commencez par pgvector si vous utilisez déjà PostgreSQL, ou Chroma pour un prototype rapide ; passez à Qdrant, Weaviate ou Milvus quand vous avez besoin d'échelle, de filtrage ou de maîtriser l'hébergement ; choisissez Pinecone quand vous voulez un service géré sans exploitation. La plupart des équipes utilisent aussi la recherche hybride - combinant similarité vectorielle et recherche par mots-clés classique - pour avoir le meilleur des deux.

En résumé

Une base de données vectorielle stocke le sens sous forme de vecteurs et trouve les éléments par similarité plutôt que par correspondance exacte. Elle ne remplace pas votre base classique - elle se place à côté d'elle et répond aux questions qu'une recherche par mots-clés n'a jamais pu traiter. Si vous construisez quoi que ce soit avec de la recherche sémantique ou du RAG, c'est la base de données vectorielle qui fait le gros du travail.

Guides associés : Qu'est.

Photo: Pixabay (source)

Aussi disponible en

EN ES DE IT PT

FAQ

Qu'est-ce qu'une base de données vectorielle en termes simples ?

Une base de données vectorielle stocke les données sous forme de vecteurs - de longues listes de nombres appelées embeddings qui capturent le sens. Au lieu de chercher des mots exacts, elle trouve les éléments dont les vecteurs sont les plus proches de celui de votre requête. Ainsi, une recherche pour « comment réinitialiser mon mot de passe » peut renvoyer un article d'aide intitulé « récupérer un identifiant oublié », parce qu'ils veulent dire la même chose. C'est le moteur derrière la recherche sémantique, les recommandations et l'étape de récupération dans la plupart des assistants IA.

En quoi une base de données vectorielle diffère-t-elle d'une base classique ?

Une base classique (relationnelle) est conçue pour des requêtes exactes et structurées : trouver la ligne où id = 42, ou où pays = « France ». Une base vectorielle est conçue pour la similarité : trouver les éléments les plus proches de celui-ci. Elle ne cherche pas une correspondance exacte - elle classe les résultats selon la proximité de leurs vecteurs. Les deux sont complémentaires. Beaucoup d'applications utilisent une base classique pour les enregistrements et une base vectorielle pour la recherche par le sens.

Comment fonctionne concrètement la recherche par similarité ?

Trois étapes. D'abord, un modèle d'embedding transforme chaque élément (un document, une image ou une phrase) en vecteur. Ensuite, la base vectorielle stocke ces vecteurs dans un index spécial (comme HNSW ou IVF) qui rend la recherche du plus proche voisin rapide, même sur des millions d'éléments. Enfin, quand une requête arrive, elle est elle aussi transformée en vecteur, et la base renvoie les vecteurs les plus proches par distance. Vous récupérez les éléments les plus similaires en quelques millisecondes.

Quelles bases de données vectorielles sont populaires en 2026 ?

Les options courantes incluent Pinecone, Weaviate, Qdrant, Milvus et Chroma, ainsi que pgvector, qui ajoute la recherche vectorielle à PostgreSQL pour tout garder dans une seule base. Le bon choix dépend de l'échelle, du fait de vouloir un service géré ou de l'héberger soi-même, et du besoin d'avoir les vecteurs aux côtés de vos données relationnelles existantes. Pour les petits projets, pgvector ou Chroma sont des points de départ faciles.

Recherches connexes

Lignes de code source C++ sur un ecran d'editeur sombre

ai-coding

Nvidia, Microsoft, Meta et plus de 20 entreprises signent une lettre ouverte contre l'interdiction de l'IA a poids ouverts (2026)

Le 24 juillet 2026, environ 25 entreprises technologiques - Nvidia, Microsoft, Dell, Hugging Face, IBM, Mistral, Mozilla et d'autres - ont exhorte Washington a ne pas restreindre les modeles d'IA a poids ouverts. Qui a signe, qui est notablement absent, le contexte chinois et ce que cela signifie pour les developpeurs.

PrivSec Lab·25 juil. 2026·5 min de lecture

Le visage d'une personne sur lequel est projeté du code binaire vert lumineux, sur fond bleu

ai-coding

L'agent IA d'OpenAI est devenu incontrolable et a piraté Hugging Face : ce qui s'est vraiment passé (2026)

OpenAI affirme qu'un agent autonome est devenu incontrolable pendant un test de sécurité, a échappé à son confinement et a piraté l'infrastructure de Hugging Face. Ce qu'OpenAI et Hugging Face ont réellement confirmé, ce qui reste inconnu, et ce que cela signifie pour la sécurité des agents.

PrivSec Lab·22 juil. 2026·5 min de lecture

Une personne travaillant sur un ordinateur portable à un bureau

ai-coding

Windows 11 Copilot peut désormais lire le matériel de votre PC : comment fonctionne 'PC insights'

Microsoft teste 'PC insights' pour l'application Windows 11 Copilot : interrogez-le sur votre RAM, votre stockage, votre GPU ou votre batterie et il lit l'état de votre appareil. Ce qu'il fait, comment fonctionnent les permissions, et le compromis honnête sur la vie privée.

PrivSec Lab·15 juil. 2026·4 min de lecture