Chatbots, asistentes de código, resumidores — casi cada herramienta de IA que has usado últimamente funciona con un LLM. El término está en todas partes en 2026, pero rara vez se explica con claridad. Esta guía lo responde sin rodeos: qué es un gran modelo de lenguaje, cómo funciona de verdad, en qué destaca, y — igual de importante — qué no puede hacer.
Qué es un LLM
Un LLM (gran modelo de lenguaje) es una red neuronal entrenada con enormes cantidades de texto para entender y generar lenguaje similar al humano. Su tarea central es engañosamente simple: predecir el siguiente token (palabra o fragmento de palabra) dado todo lo anterior. Haz eso una y otra vez y obtienes respuestas coherentes, textos, traducciones y código.
«Grande» se refiere a los datos de entrenamiento (gran parte de la web pública y más) y a los parámetros — a menudo miles de millones de valores internos que almacenan lo aprendido. ChatGPT, Claude, Gemini y Llama son todos LLM.
Cómo funciona
Casi todo LLM moderno usa la arquitectura transformer. El entrenamiento ocurre por etapas:
- Preentrenamiento — el modelo lee texto inmenso y aprende patrones prediciendo una y otra vez el siguiente token y corrigiéndose. Aquí se forma la mayor parte de su conocimiento.
- Fine-tuning y RLHF — luego se refina con ejemplos cuidados y retroalimentación humana para ser más útil, seguir instrucciones y evitar salidas dañinas.
En la inferencia (cuando lo usas), le das un prompt y genera una respuesta un token a la vez, cada uno tomado de las probabilidades aprendidas. Clave: no consulta nada — predice texto plausible a partir de patrones.
Tokens y parámetros
- Tokens — la unidad de texto que un LLM lee y escribe, más o menos una palabra o fragmento. Límites como la ventana de contexto se miden en tokens.
- Parámetros — los miles de millones de pesos internos ajustados en el entrenamiento que almacenan lo aprendido.
Más parámetros y datos pueden significar más capacidad, pero la arquitectura, la calidad de los datos y el fine-tuning importan tanto como el tamaño bruto.
Qué pueden y qué no pueden hacer los LLM
Fuertes en: redactar y resumir, responder, traducir, explicar, y escribir y depurar código.
Límites reales:
- Alucinación — pueden afirmar falsedades con seguridad. Predicen texto plausible, no necesariamente correcto.
- Fecha de corte de conocimiento — no conocen de oficio eventos recientes.
- Sin comprensión real — sin creencias ni anclaje, solo patrones aprendidos.
- Sesgo — pueden reflejar sesgos de sus datos.
El remedio para los hechos y la actualidad es darles fuentes reales en el momento de responder — eso es exactamente lo que hace el RAG (generación aumentada por recuperación).
LLM vs IA
La IA es el campo amplio; un LLM es un tipo prominente de IA, especializado en lenguaje. Todo LLM es IA, pero los generadores de imágenes, recomendadores y agentes de juego también son IA, construidos de otra forma. Hoy «IA» suele significar un chatbot con LLM — pero los términos no son intercambiables.
Ejecutarlo y elegir uno
Puedes ejecutar LLM abiertos de forma privada en tu máquina con Ollama, y para el desarrollo, mira nuestra guía de los mejores LLM para programar. Los mismos fundamentos — tokens, parámetros, predicción del siguiente token — se aplican tanto si el modelo corre en la nube como en tu portátil.
En resumen
Un LLM es una red neuronal que genera lenguaje prediciendo el siguiente token, entrenada con texto inmenso y refinada con retroalimentación humana. Es notablemente capaz con el lenguaje y el código, y genuinamente limitado por la alucinación, una fecha de corte de conocimiento y la ausencia de comprensión real. Úsalo para lo que es bueno, verifica lo que importa, y añade recuperación cuando necesites hechos actuales y anclados.