Wenn Sie über RAG, KI-Suche oder Empfehlungen gelesen haben, sind Sie wahrscheinlich auf den Begriff Vektordatenbank gestoßen. Hier ist die einfache Erklärung. Eine Vektordatenbank speichert Daten als Vektoren — Zahlenlisten, die Bedeutung erfassen — und findet Einträge nach Ähnlichkeit, nicht nach exakter Übereinstimmung. Diese eine Idee lässt moderne KI-Suche so wirken, als würde sie Sie verstehen.
Was eine Vektordatenbank wirklich ist
Normale Datenbanken sind gut bei exakten Fragen: finde den Nutzer mit dieser ID oder jede Bestellung aus der letzten Woche. Sie tun sich schwer mit „finde mir Dinge, die dasselbe bedeuten“. Eine Vektordatenbank ist genau dafür gebaut.
Sie arbeitet mit Embeddings — den numerischen Fingerabdrücken, die ein KI-Modell Text, Bildern oder Audio gibt. Einträge mit ähnlicher Bedeutung bekommen Vektoren, die nah beieinander liegen. Die Datenbank speichert diese Vektoren und gibt bei einer Suche die zurück, die Ihrer Anfrage am nächsten liegen.

Wie die Ähnlichkeitssuche funktioniert
Der Ablauf hat drei Schritte:
- Einbetten. Ein Embedding-Modell wandelt jedes Dokument, Bild oder jeden Satz in einen Vektor um.
- Indizieren. Die Datenbank speichert diese Vektoren in einem speziellen Index (wie HNSW oder IVF), damit sie riesige Mengen schnell durchsuchen kann.
- Abfragen. Auch Ihre Suche wird in einen Vektor umgewandelt. Die Datenbank gibt die Vektoren zurück, die ihr nach Abstand am nächsten liegen.
So kann eine Suche nach „wie setze ich mein Passwort zurück“ einen Artikel mit dem Titel „vergessenen Login wiederherstellen“ zutage fördern. Die Wörter sind anders, aber die Bedeutung — und die Vektoren — liegen nah beieinander.
Vektordatenbank vs. normale Datenbank
Sie lösen unterschiedliche Probleme, und die meisten echten Apps nutzen beide. Eine relationale Datenbank hält Ihre strukturierten Datensätze und beantwortet exakte Abfragen. Eine Vektordatenbank beantwortet „was ist diesem am ähnlichsten?“. Sie behalten Kundenzeilen in der einen und durchsuchbare Bedeutung in der anderen. Werkzeuge wie pgvector lassen Sie sogar die Vektorsuche zu einer normalen PostgreSQL-Datenbank hinzufügen, sodass beides an einem Ort liegt.
Warum es für KI wichtig ist
Eine Vektordatenbank ist der Abrufmotor hinter vieler KI. Sie treibt die semantische Suche an, Produkt- und Inhaltsempfehlungen und — am wichtigsten — den Abrufschritt in RAG, bei dem ein Assistent relevanten Text holt, bevor er antwortet. Ohne schnelle Ähnlichkeitssuche über Embeddings wäre keine dieser Funktionen im großen Maßstab praktikabel.
Das Fazit
Eine Vektordatenbank speichert Bedeutung als Vektoren und findet Einträge nach Ähnlichkeit statt nach exakter Übereinstimmung. Sie ersetzt Ihre normale Datenbank nicht — sie steht daneben und beantwortet die Fragen, die eine Stichwortsuche nie konnte. Wenn Sie irgendetwas mit semantischer Suche oder RAG bauen, ist die Vektordatenbank das Teil, das die Schwerstarbeit leistet.


