Si has leído sobre RAG, búsqueda con IA o recomendaciones, seguramente te has topado con el término base de datos vectorial. Aquí va la versión clara. Una base de datos vectorial guarda los datos como vectores —listas de números que capturan el significado— y encuentra elementos por similitud, no por coincidencia exacta. Esa única idea es lo que hace que la búsqueda con IA moderna parezca que te entiende.
Qué es realmente una base de datos vectorial
Las bases de datos normales son muy buenas con preguntas exactas: encontrar al usuario con este ID, o todos los pedidos de la semana pasada. Tienen problemas con «búscame cosas que signifiquen lo mismo». Una base de datos vectorial está hecha justo para eso.
Funciona con embeddings: las huellas numéricas que un modelo de IA da al texto, las imágenes o el audio. Los elementos con un significado parecido obtienen vectores que quedan cerca unos de otros. La base de datos guarda esos vectores y, cuando buscas, devuelve los más cercanos a tu consulta.

Cómo funciona la búsqueda por similitud
El flujo tiene tres pasos:
- Convertir en vector. Un modelo de embeddings convierte cada documento, imagen o frase en un vector.
- Indexar. La base de datos guarda esos vectores en un índice especial (como HNSW o IVF) para poder buscar rápido en conjuntos enormes.
- Consultar. Tu búsqueda también se convierte en vector. La base de datos devuelve los vectores más cercanos a ella por distancia.
Así, una búsqueda de «cómo restablecer mi contraseña» puede sacar a la luz un artículo llamado «recuperar un inicio de sesión olvidado». Las palabras son distintas, pero el significado —y los vectores— están cerca.
Base de datos vectorial frente a base de datos normal
Resuelven problemas distintos, y la mayoría de las apps reales usan ambas. Una base de datos relacional guarda tus registros estructurados y responde consultas exactas. Una base de datos vectorial responde «¿qué se parece más a esto?». Guardas las filas de clientes en una y el significado buscable en la otra. Herramientas como pgvector incluso te permiten añadir búsqueda vectorial a una base de datos PostgreSQL normal, así ambas viven en un mismo lugar.
Por qué importa para la IA
Una base de datos vectorial es el motor de recuperación detrás de buena parte de la IA. Impulsa la búsqueda semántica, las recomendaciones de productos y contenidos y —lo más importante— el paso de recuperación en el RAG, donde un asistente busca el texto relevante antes de responder. Sin una búsqueda por similitud rápida sobre embeddings, ninguna de esas funciones sería práctica a gran escala.
En resumen
Una base de datos vectorial guarda el significado como vectores y encuentra elementos por similitud en lugar de por coincidencia exacta. No reemplaza tu base de datos normal: se coloca a su lado y responde las preguntas que una búsqueda por palabras clave nunca pudo. Si estás construyendo algo con búsqueda semántica o RAG, una base de datos vectorial es la pieza que hace el trabajo pesado.


