alexi.sh
Todos os artigosSegurança do navegadorPrivacidade de redeFerramentas de privacidadeModelagem de ameaçasProgramação com IAFerramentas de dev

alexi.shInvestigação

ai-coding

O Que É uma Base de Dados Vetorial? Um Guia Simples (2026)

PrivSec Lab3 min de leitura
Um servidor em rack com várias baias de discos

Uma base de dados vetorial guarda dados como vetores (embeddings) e encontra itens por significado, não por correspondência exata. O que é, como funciona a pesquisa por similaridade, como difere de uma base de dados normal, e porque RAG e a pesquisa por IA dependem dela.

Se já leu sobre RAG, pesquisa por IA ou recomendações, é provável que tenha encontrado o termo base de dados vetorial. Aqui está a versão simples. Uma base de dados vetorial guarda dados como vetores — listas de números que captam significado — e encontra itens por similaridade, não por correspondência exata. É essa ideia única que faz a pesquisa por IA moderna parecer que o entende.

O que é, na verdade, uma base de dados vetorial

As bases de dados normais são ótimas em perguntas exatas: encontrar o utilizador com este ID, ou todas as encomendas da semana passada. Têm dificuldade com «encontra-me coisas que signifiquem o mesmo». Uma base de dados vetorial foi feita exatamente para isso.

Funciona com embeddings — as impressões digitais numéricas que um modelo de IA atribui a texto, imagens ou áudio. Itens com significado parecido ficam com vetores próximos uns dos outros. A base de dados guarda esses vetores e, quando pesquisa, devolve os mais próximos da sua pesquisa.

Armazenamento em hardware
Uma base de dados vetorial mantém milhões de embeddings em disco e em memória, e pesquisa-os por similaridade em milissegundos.

Como funciona a pesquisa por similaridade

O fluxo tem três passos:

  1. Embedding. Um modelo de embedding transforma cada documento, imagem ou frase num vetor.
  2. Indexação. A base de dados guarda esses vetores num índice especial (como HNSW ou IVF) para conseguir pesquisar conjuntos enormes depressa.
  3. Pesquisa. A sua pesquisa também é transformada em vetor. A base de dados devolve os vetores mais próximos dela por distância.

Assim, uma pesquisa por «como repor a minha palavra-passe» pode trazer à superfície um artigo chamado «recuperar um início de sessão esquecido». As palavras diferem, mas o significado — e os vetores — estão próximos.

Base de dados vetorial vs base de dados normal

Resolvem problemas diferentes, e a maioria das aplicações reais usa ambas. Uma base de dados relacional guarda os seus registos estruturados e responde a consultas exatas. Uma base de dados vetorial responde a «o que é mais parecido com isto?». Guarda as linhas de clientes numa e o significado pesquisável na outra. Ferramentas como pgvector permitem até acrescentar pesquisa vetorial a uma base de dados PostgreSQL normal, para que ambas vivam num só lugar.

Porque é que isto importa para a IA

Uma base de dados vetorial é o motor de recuperação por detrás de muita IA. Move a pesquisa semântica, as recomendações de produtos e de conteúdos e — o mais importante — o passo de recuperação no RAG, em que um assistente vai buscar texto relevante antes de responder. Sem pesquisa rápida por similaridade sobre embeddings, nenhuma dessas funcionalidades seria prática à escala.

Conclusão

Uma base de dados vetorial guarda o significado como vetores e encontra itens por similaridade em vez de correspondência exata. Não substitui a sua base de dados normal — fica ao lado dela e responde às perguntas que uma pesquisa por palavras-chave nunca conseguiria. Se está a construir algo com pesquisa semântica ou RAG, é a base de dados vetorial que faz o trabalho pesado.

Photo: Pixabay (source)

Também disponível em

FAQ

O que é uma base de dados vetorial em termos simples?
Uma base de dados vetorial guarda dados como vetores — longas listas de números chamados embeddings que captam significado. Em vez de corresponder palavras exatas, encontra itens cujos vetores estão mais perto do vetor da sua pesquisa. Por isso, uma pesquisa por «como repor a minha palavra-passe» pode devolver um artigo de ajuda intitulado «recuperar um início de sessão esquecido», porque significam o mesmo. É o motor por detrás da pesquisa semântica, das recomendações e do passo de recuperação na maioria dos assistentes de IA.
Em que difere uma base de dados vetorial de uma base de dados normal?
Uma base de dados normal (relacional) foi feita para consultas exatas e estruturadas: encontrar a linha onde id = 42, ou onde país = «França». Uma base de dados vetorial foi feita para similaridade: encontrar os itens mais parecidos com este. Não procura uma correspondência exata — ordena os resultados pela proximidade dos seus vetores. As duas são complementares. Muitas aplicações usam uma base de dados normal para os registos e uma base de dados vetorial para a pesquisa por significado.
Como funciona, na prática, a pesquisa por similaridade?
Três passos. Primeiro, um modelo de embedding transforma cada item (um documento, imagem ou frase) num vetor. Segundo, a base de dados vetorial guarda esses vetores num índice especial (como HNSW ou IVF) que torna rápida a pesquisa do vizinho mais próximo, mesmo com milhões de itens. Terceiro, quando chega uma pesquisa, ela também é transformada em vetor, e a base de dados devolve os vetores mais próximos por distância. Recebe de volta os itens mais parecidos em milissegundos.
Que bases de dados vetoriais são populares em 2026?
Opções comuns incluem Pinecone, Weaviate, Qdrant, Milvus e Chroma, além de pgvector, que acrescenta pesquisa vetorial ao PostgreSQL para poder manter tudo numa só base de dados. A escolha certa depende da escala, de querer um serviço gerido ou alojar por conta própria, e de precisar dos vetores junto aos seus dados relacionais existentes. Para projetos pequenos, pgvector ou Chroma são pontos de partida fáceis.