alexi.sh
Tutti gli articoliSicurezza del browserPrivacy di reteStrumenti per la privacyModellazione delle minacceProgrammazione con IAStrumenti per sviluppatori

alexi.shRicerca

ai-coding

Cos'è un database vettoriale? Una guida semplice (2026)

PrivSec Lab2 min di lettura
Un server rack con più alloggiamenti per dischi

Un database vettoriale memorizza i dati come vettori (embedding) e trova gli elementi in base al significato, non alla corrispondenza esatta. Cos'è, come funziona la ricerca per similarità, in cosa differisce da un database normale e perché RAG e ricerca AI ne dipendono.

Se hai letto qualcosa su RAG, ricerca AI o suggerimenti, probabilmente ti sei imbattuto nel termine database vettoriale. Ecco la versione semplice. Un database vettoriale memorizza i dati come vettori — liste di numeri che catturano il significato — e trova gli elementi per similarità, non per corrispondenza esatta. È proprio questa idea a far sembrare che la ricerca AI moderna ti capisca.

Cos'è davvero un database vettoriale

I database normali sono ottimi per le domande esatte: trova l'utente con questo ID, o ogni ordine della scorsa settimana. Faticano con « trovami cose che significano la stessa cosa ». Un database vettoriale è costruito esattamente per questo.

Funziona sugli embedding — le impronte numeriche che un modello AI assegna a testo, immagini o audio. Gli elementi con significato simile ottengono vettori che stanno vicini tra loro. Il database memorizza quei vettori e, quando cerchi, restituisce quelli più vicini alla tua query.

Archiviazione hardware
Un database vettoriale tiene milioni di embedding su disco e in memoria, e li cerca per similarità in pochi millisecondi.

Come funziona la ricerca per similarità

Il flusso ha tre passaggi:

  1. Embed. Un modello di embedding trasforma ogni documento, immagine o frase in un vettore.
  2. Indicizza. Il database memorizza quei vettori in un indice speciale (come HNSW o IVF) così può cercare velocemente in insiemi enormi.
  3. Query. Anche la tua ricerca viene trasformata in embedding. Il database restituisce i vettori più vicini per distanza.

Così una ricerca per « come reimpostare la mia password » può far emergere un articolo intitolato « recuperare un accesso dimenticato ». Le parole sono diverse, ma il significato — e i vettori — sono vicini.

Database vettoriale vs database normale

Risolvono problemi diversi, e la maggior parte delle app reali usa entrambi. Un database relazionale contiene i tuoi record strutturati e risponde a query esatte. Un database vettoriale risponde a « cosa è più simile a questo? » Tieni le righe dei clienti in uno e il significato ricercabile nell'altro. Strumenti come pgvector ti permettono perfino di aggiungere la ricerca vettoriale a un normale database PostgreSQL, così entrambi vivono in un solo posto.

Perché conta per l'AI

Un database vettoriale è il motore di recupero dietro a gran parte dell'AI. Alimenta la ricerca semantica, i suggerimenti di prodotti e contenuti e — soprattutto — la fase di recupero in RAG, dove un assistente recupera testo pertinente prima di rispondere. Senza una ricerca per similarità veloce sugli embedding, nessuna di queste funzioni sarebbe pratica su larga scala.

In sintesi

Un database vettoriale memorizza il significato come vettori e trova gli elementi per similarità invece che per corrispondenza esatta. Non sostituisce il tuo database normale: gli sta accanto e risponde alle domande a cui una ricerca per parole chiave non potrebbe mai rispondere. Se stai costruendo qualcosa con ricerca semantica o RAG, il database vettoriale è il pezzo che fa il lavoro pesante.

Photo: Pixabay (source)

Disponibile anche in

FAQ

Cos'è un database vettoriale in parole semplici?
Un database vettoriale memorizza i dati come vettori: lunghe liste di numeri chiamate embedding che catturano il significato. Invece di cercare le parole esatte, trova gli elementi i cui vettori sono più vicini al vettore della tua query. Così una ricerca per « come reimpostare la mia password » può restituire un articolo di aiuto intitolato « recuperare un accesso dimenticato », perché significano la stessa cosa. È il motore dietro la ricerca semantica, i suggerimenti e la fase di recupero nella maggior parte degli assistenti AI.
In cosa differisce un database vettoriale da un database normale?
Un database normale (relazionale) è pensato per query esatte e strutturate: trova la riga dove id = 42, o dove paese = « Francia ». Un database vettoriale è pensato per la similarità: trova gli elementi più simili a questo. Non cerca una corrispondenza esatta: ordina i risultati in base a quanto sono vicini i loro vettori. I due sono complementari. Molte app usano un database normale per i record e un database vettoriale per la ricerca basata sul significato.
Come funziona davvero la ricerca per similarità?
Tre passaggi. Primo, un modello di embedding trasforma ogni elemento (un documento, un'immagine o una frase) in un vettore. Secondo, il database vettoriale memorizza quei vettori in un indice speciale (come HNSW o IVF) che rende veloce la ricerca dei vicini più prossimi, anche su milioni di elementi. Terzo, quando arriva una query, anch'essa viene trasformata in embedding, e il database restituisce i vettori più vicini per distanza. Ottieni gli elementi più simili in pochi millisecondi.
Quali database vettoriali sono popolari nel 2026?
Le opzioni comuni includono Pinecone, Weaviate, Qdrant, Milvus e Chroma, oltre a pgvector, che aggiunge la ricerca vettoriale a PostgreSQL così puoi tenere tutto in un unico database. La scelta giusta dipende dalla scala, dal fatto che tu voglia un servizio gestito o l'auto-hosting, e dal fatto che ti servano i vettori accanto ai tuoi dati relazionali esistenti. Per i piccoli progetti, pgvector o Chroma sono punti di partenza facili.