Chatbot, assistenti di codifica, riassuntori — quasi ogni strumento AI che hai usato di recente è alimentato da un LLM. Il termine è ovunque nel 2026, ma raramente spiegato chiaramente. Questa guida risponde in modo semplice: cos'è un modello di linguaggio di grandi dimensioni, come funziona realmente, in cosa è veramente bravo e — altrettanto importante — cosa non può fare.
Cos'è un LLM
Un LLM (modello di linguaggio di grandi dimensioni) è una rete neurale addestrata su enormi quantità di testo per comprendere e generare un linguaggio simile a quello umano. Il suo compito principale è ingannevolmente semplice: prevedere il prossimo token (una parola o parte di parola) dato tutto ciò che lo precede. Facendo ciò ripetutamente si ottengono risposte coerenti, saggi, traduzioni e codice.
"Grande" si riferisce sia ai dati di addestramento (gran parte del web pubblico e altro) sia ai parametri — spesso miliardi di valori interni che memorizzano ciò che il modello ha appreso. ChatGPT, Claude, Gemini e Llama sono tutti LLM.
Come funziona
Quasi ogni LLM moderno utilizza l'architettura transformer. L'addestramento avviene in fasi:
- Preaddestramento — il modello legge vasti testi e apprende schemi prevedendo ripetutamente il prossimo token e correggendosi quando sbaglia. È qui che si forma la maggior parte della sua conoscenza.
- Affinamento & RLHF — viene poi raffinato con esempi curati e feedback umano per essere più utile, seguire istruzioni ed evitare output dannosi.
All'inferenza (quando lo usi), fornisci un prompt e genera una risposta un token alla volta, ciascuno scelto dalle probabilità che ha appreso. Fondamentalmente, non sta cercando informazioni — sta prevedendo testo plausibile da schemi.
Token e parametri
- Token — l'unità di testo che un LLM legge e scrive, approssimativamente una parola o parte di parola. Limiti come la finestra di contesto sono misurati in token.
- Parametri — i miliardi di pesi interni regolati durante l'addestramento che memorizzano ciò che il modello ha appreso.
Più parametri e dati possono significare maggiore capacità, ma l'architettura, la qualità dei dati e l'affinamento sono importanti tanto quanto la dimensione grezza.
Cosa possono e non possono fare gli LLM
Forti in: redazione e riassunto, rispondere a domande, tradurre, spiegare e scrivere e fare debug di codice.
Limiti reali:
- Allucinazione — possono affermare cose false con sicurezza. Prevedono testo plausibile, che non è lo stesso di corretto.
- Taglio della conoscenza — non conoscono intrinsecamente eventi recenti.
- Nessuna vera comprensione — nessuna credenza o fondamento, solo schemi appresi.
- Bias — possono riflettere i bias nei loro dati di addestramento.
La soluzione per fatti e freschezza è fornire loro fonti reali al momento della risposta — è esattamente ciò che fa RAG (generazione aumentata dal recupero).
LLM vs AI
L'AI è il campo ampio; un LLM è un tipo prominente di AI specializzato nel linguaggio. Ogni LLM è AI, ma i generatori di immagini, i raccomandatori e gli agenti di gioco sono anche AI, costruiti diversamente. "AI" oggi spesso significa un chatbot LLM — ma i termini non sono intercambiabili.
Esecuzione e scelta di uno
Puoi eseguire LLM aperti privatamente sulla tua macchina con Ollama, e per lo sviluppo specificamente, vedi la nostra guida ai migliori LLM per la codifica. Gli stessi fondamenti — token, parametri, previsione del prossimo token — si applicano sia che il modello venga eseguito nel cloud o sul tuo laptop.
In sintesi
Un LLM è una rete neurale che genera linguaggio prevedendo il prossimo token, addestrato su enormi testi e raffinato con feedback umano. È notevolmente capace nel linguaggio e nel codice, e limitato realmente da allucinazioni, un taglio della conoscenza e l'assenza di una vera comprensione. Usalo per ciò in cui è bravo, verifica ciò che conta e aggiungi il recupero quando hai bisogno di fatti attuali e fondati.


