alexi.sh
Todos los artículosSeguridad del navegadorPrivacidad de redHerramientas de privacidadModelado de amenazasProgramación con IAHerramientas de dev

alexi.shInvestigación

ai-coding

¿Qué es una base de datos vectorial? Guía clara (2026)

PrivSec Lab3 min de lectura
Un servidor en rack con varias bahías de discos

Una base de datos vectorial guarda los datos como vectores (embeddings) y busca elementos por significado, no por coincidencia exacta. Qué es, cómo funciona la búsqueda por similitud, en qué se diferencia de una base de datos normal y por qué el RAG y la búsqueda con IA dependen de ella.

Si has leído sobre RAG, búsqueda con IA o recomendaciones, seguramente te has topado con el término base de datos vectorial. Aquí va la versión clara. Una base de datos vectorial guarda los datos como vectores —listas de números que capturan el significado— y encuentra elementos por similitud, no por coincidencia exacta. Esa única idea es lo que hace que la búsqueda con IA moderna parezca que te entiende.

Qué es realmente una base de datos vectorial

Las bases de datos normales son muy buenas con preguntas exactas: encontrar al usuario con este ID, o todos los pedidos de la semana pasada. Tienen problemas con «búscame cosas que signifiquen lo mismo». Una base de datos vectorial está hecha justo para eso.

Funciona con embeddings: las huellas numéricas que un modelo de IA da al texto, las imágenes o el audio. Los elementos con un significado parecido obtienen vectores que quedan cerca unos de otros. La base de datos guarda esos vectores y, cuando buscas, devuelve los más cercanos a tu consulta.

Almacenamiento de hardware
Una base de datos vectorial mantiene millones de embeddings en disco y en memoria, y los busca por similitud en milisegundos.

Cómo funciona la búsqueda por similitud

El flujo tiene tres pasos:

  1. Convertir en vector. Un modelo de embeddings convierte cada documento, imagen o frase en un vector.
  2. Indexar. La base de datos guarda esos vectores en un índice especial (como HNSW o IVF) para poder buscar rápido en conjuntos enormes.
  3. Consultar. Tu búsqueda también se convierte en vector. La base de datos devuelve los vectores más cercanos a ella por distancia.

Así, una búsqueda de «cómo restablecer mi contraseña» puede sacar a la luz un artículo llamado «recuperar un inicio de sesión olvidado». Las palabras son distintas, pero el significado —y los vectores— están cerca.

Base de datos vectorial frente a base de datos normal

Resuelven problemas distintos, y la mayoría de las apps reales usan ambas. Una base de datos relacional guarda tus registros estructurados y responde consultas exactas. Una base de datos vectorial responde «¿qué se parece más a esto?». Guardas las filas de clientes en una y el significado buscable en la otra. Herramientas como pgvector incluso te permiten añadir búsqueda vectorial a una base de datos PostgreSQL normal, así ambas viven en un mismo lugar.

Por qué importa para la IA

Una base de datos vectorial es el motor de recuperación detrás de buena parte de la IA. Impulsa la búsqueda semántica, las recomendaciones de productos y contenidos y —lo más importante— el paso de recuperación en el RAG, donde un asistente busca el texto relevante antes de responder. Sin una búsqueda por similitud rápida sobre embeddings, ninguna de esas funciones sería práctica a gran escala.

En resumen

Una base de datos vectorial guarda el significado como vectores y encuentra elementos por similitud en lugar de por coincidencia exacta. No reemplaza tu base de datos normal: se coloca a su lado y responde las preguntas que una búsqueda por palabras clave nunca pudo. Si estás construyendo algo con búsqueda semántica o RAG, una base de datos vectorial es la pieza que hace el trabajo pesado.

Photo: Pixabay (source)

También disponible en

FAQ

¿Qué es una base de datos vectorial en términos simples?
Una base de datos vectorial guarda los datos como vectores: largas listas de números llamadas embeddings que capturan el significado. En lugar de buscar palabras exactas, encuentra los elementos cuyos vectores están más cerca del vector de tu consulta. Así, una búsqueda de «cómo restablecer mi contraseña» puede devolver un artículo de ayuda titulado «recuperar un inicio de sesión olvidado», porque significan lo mismo. Es el motor detrás de la búsqueda semántica, las recomendaciones y el paso de recuperación en la mayoría de los asistentes de IA.
¿En qué se diferencia una base de datos vectorial de una base de datos normal?
Una base de datos normal (relacional) está hecha para consultas exactas y estructuradas: encontrar la fila donde id = 42, o donde país = 'Francia'. Una base de datos vectorial está hecha para la similitud: encontrar los elementos más parecidos a este. No busca una coincidencia exacta, sino que ordena los resultados según lo cerca que estén sus vectores. Las dos son complementarias. Muchas apps usan una base de datos normal para los registros y una base de datos vectorial para la búsqueda por significado.
¿Cómo funciona realmente la búsqueda por similitud?
Tres pasos. Primero, un modelo de embeddings convierte cada elemento (un documento, una imagen o una frase) en un vector. Segundo, la base de datos vectorial guarda esos vectores en un índice especial (como HNSW o IVF) que hace rápida la búsqueda del vecino más cercano, incluso entre millones de elementos. Tercero, cuando llega una consulta, también se convierte en vector, y la base de datos devuelve los vectores más cercanos a ella por distancia. Recibes los elementos más parecidos en milisegundos.
¿Qué bases de datos vectoriales son populares en 2026?
Entre las opciones comunes están Pinecone, Weaviate, Qdrant, Milvus y Chroma, además de pgvector, que añade búsqueda vectorial a PostgreSQL para que puedas tener todo en una sola base de datos. La elección correcta depende de la escala, de si quieres un servicio gestionado o autohospedarlo, y de si necesitas los vectores junto a tus datos relacionales actuales. Para proyectos pequeños, pgvector o Chroma son puntos de partida fáciles.