Se já leu sobre RAG, pesquisa por IA ou recomendações, é provável que tenha encontrado o termo base de dados vetorial. Aqui está a versão simples. Uma base de dados vetorial guarda dados como vetores — listas de números que captam significado — e encontra itens por similaridade, não por correspondência exata. É essa ideia única que faz a pesquisa por IA moderna parecer que o entende.
O que é, na verdade, uma base de dados vetorial
As bases de dados normais são ótimas em perguntas exatas: encontrar o utilizador com este ID, ou todas as encomendas da semana passada. Têm dificuldade com «encontra-me coisas que signifiquem o mesmo». Uma base de dados vetorial foi feita exatamente para isso.
Funciona com embeddings — as impressões digitais numéricas que um modelo de IA atribui a texto, imagens ou áudio. Itens com significado parecido ficam com vetores próximos uns dos outros. A base de dados guarda esses vetores e, quando pesquisa, devolve os mais próximos da sua pesquisa.

Como funciona a pesquisa por similaridade
O fluxo tem três passos:
- Embedding. Um modelo de embedding transforma cada documento, imagem ou frase num vetor.
- Indexação. A base de dados guarda esses vetores num índice especial (como HNSW ou IVF) para conseguir pesquisar conjuntos enormes depressa.
- Pesquisa. A sua pesquisa também é transformada em vetor. A base de dados devolve os vetores mais próximos dela por distância.
Assim, uma pesquisa por «como repor a minha palavra-passe» pode trazer à superfície um artigo chamado «recuperar um início de sessão esquecido». As palavras diferem, mas o significado — e os vetores — estão próximos.
Base de dados vetorial vs base de dados normal
Resolvem problemas diferentes, e a maioria das aplicações reais usa ambas. Uma base de dados relacional guarda os seus registos estruturados e responde a consultas exatas. Uma base de dados vetorial responde a «o que é mais parecido com isto?». Guarda as linhas de clientes numa e o significado pesquisável na outra. Ferramentas como pgvector permitem até acrescentar pesquisa vetorial a uma base de dados PostgreSQL normal, para que ambas vivam num só lugar.
Porque é que isto importa para a IA
Uma base de dados vetorial é o motor de recuperação por detrás de muita IA. Move a pesquisa semântica, as recomendações de produtos e de conteúdos e — o mais importante — o passo de recuperação no RAG, em que um assistente vai buscar texto relevante antes de responder. Sem pesquisa rápida por similaridade sobre embeddings, nenhuma dessas funcionalidades seria prática à escala.
Conclusão
Uma base de dados vetorial guarda o significado como vetores e encontra itens por similaridade em vez de correspondência exata. Não substitui a sua base de dados normal — fica ao lado dela e responde às perguntas que uma pesquisa por palavras-chave nunca conseguiria. Se está a construir algo com pesquisa semântica ou RAG, é a base de dados vetorial que faz o trabalho pesado.


