Se hai letto qualcosa su RAG, ricerca AI o suggerimenti, probabilmente ti sei imbattuto nel termine database vettoriale. Ecco la versione semplice. Un database vettoriale memorizza i dati come vettori — liste di numeri che catturano il significato — e trova gli elementi per similarità, non per corrispondenza esatta. È proprio questa idea a far sembrare che la ricerca AI moderna ti capisca.
Cos'è davvero un database vettoriale
I database normali sono ottimi per le domande esatte: trova l'utente con questo ID, o ogni ordine della scorsa settimana. Faticano con « trovami cose che significano la stessa cosa ». Un database vettoriale è costruito esattamente per questo.
Funziona sugli embedding — le impronte numeriche che un modello AI assegna a testo, immagini o audio. Gli elementi con significato simile ottengono vettori che stanno vicini tra loro. Il database memorizza quei vettori e, quando cerchi, restituisce quelli più vicini alla tua query.

Come funziona la ricerca per similarità
Il flusso ha tre passaggi:
- Embed. Un modello di embedding trasforma ogni documento, immagine o frase in un vettore.
- Indicizza. Il database memorizza quei vettori in un indice speciale (come HNSW o IVF) così può cercare velocemente in insiemi enormi.
- Query. Anche la tua ricerca viene trasformata in embedding. Il database restituisce i vettori più vicini per distanza.
Così una ricerca per « come reimpostare la mia password » può far emergere un articolo intitolato « recuperare un accesso dimenticato ». Le parole sono diverse, ma il significato — e i vettori — sono vicini.
Database vettoriale vs database normale
Risolvono problemi diversi, e la maggior parte delle app reali usa entrambi. Un database relazionale contiene i tuoi record strutturati e risponde a query esatte. Un database vettoriale risponde a « cosa è più simile a questo? » Tieni le righe dei clienti in uno e il significato ricercabile nell'altro. Strumenti come pgvector ti permettono perfino di aggiungere la ricerca vettoriale a un normale database PostgreSQL, così entrambi vivono in un solo posto.
Perché conta per l'AI
Un database vettoriale è il motore di recupero dietro a gran parte dell'AI. Alimenta la ricerca semantica, i suggerimenti di prodotti e contenuti e — soprattutto — la fase di recupero in RAG, dove un assistente recupera testo pertinente prima di rispondere. Senza una ricerca per similarità veloce sugli embedding, nessuna di queste funzioni sarebbe pratica su larga scala.
In sintesi
Un database vettoriale memorizza il significato come vettori e trova gli elementi per similarità invece che per corrispondenza esatta. Non sostituisce il tuo database normale: gli sta accanto e risponde alle domande a cui una ricerca per parole chiave non potrebbe mai rispondere. Se stai costruendo qualcosa con ricerca semantica o RAG, il database vettoriale è il pezzo che fa il lavoro pesante.


