Una búsqueda que encuentra el documento correcto aunque no comparta ninguna palabra clave con tu consulta; una IA que recupera la parte relevante de tus notas para responder — ambas funcionan sobre embeddings. Un embedding convierte datos en números que capturan el significado, para que una computadora mida cuánto se parecen dos cosas. Esta guía explica qué es un embedding, cómo funciona, para qué sirve, y por qué sostiene la búsqueda y la IA modernas.
Qué es un embedding
Un embedding representa datos — una palabra, frase, imagen — como un vector: una lista de números (a menudo cientos o miles) que codifica su significado. La propiedad definitoria: los elementos con significado similar obtienen vectores cercanos en este espacio numérico, y los elementos sin relación quedan lejos.
Así, «perro» y «cachorro» caen cerca, lejos de «hoja de cálculo». Los embeddings permiten a las computadoras medir matemáticamente la similitud semántica — base de la búsqueda moderna, las recomendaciones y la IA aumentada por recuperación.
Cómo funciona
Un modelo de embedding (normalmente una red neuronal) se entrena para mapear cada entrada a un punto en un espacio de alta dimensión donde el significado se codifica por la posición. Las cosas usadas en contextos similares terminan cerca.
Le das texto (o una imagen) y produce un vector de longitud fija. Para comparar dos elementos, mides la distancia o el ángulo entre sus vectores — comúnmente la similitud del coseno. Más cerca significa más parecido en significado. El modelo no «entiende» en sentido humano; capta patrones estadísticos de similitud.
Para qué sirven los embeddings
- Búsqueda semántica — encontrar documentos sobre un tema aunque no compartan palabras clave.
- Generación aumentada por recuperación (RAG) — convertir tus documentos y una pregunta en embeddings, recuperar los fragmentos más cercanos para alimentar un LLM. Así funciona exactamente el RAG.
- Recomendaciones — sugerir elementos cuyos embeddings estén cerca de lo que te gustó.
- Agrupamiento y clasificación — agrupar o etiquetar por similitud.
- Deduplicación y detección de anomalías.
Allí donde necesites «¿qué tan parecidas en significado son estas dos cosas?», los embeddings son la herramienta.
Embedding vs token
Pasos relacionados. Un token es una pequeña unidad de texto (palabra o fragmento de palabra) que un modelo lee. Un embedding es el vector numérico que representa el significado — y dentro de un modelo, cada token se convierte en un embedding antes de procesarse. Los tokens son cómo se trocea el texto; los embeddings, cómo esos trozos se vuelven números con significado. En búsqueda/RAG, «un embedding» suele significar un vector para un fragmento entero.
El límite honesto
Los embeddings son potentes pero aproximados. Captan patrones estadísticos de los datos de entrenamiento, así que la calidad depende del modelo y del dominio — un modelo entrenado con texto web general puede juzgar mal la jerga especializada, y los sesgos pasan a los vectores. Distintos modelos producen embeddings incompatibles, así que no se mezclan vectores entre modelos. Son un sustituto notablemente útil del significado, no una verdadera comprensión del lenguaje.
En resumen
Un embedding convierte datos en un vector de números que captura el significado, colocando las cosas similares cerca para que la similitud sea una distancia medible. Es el motor silencioso tras la búsqueda semántica, las recomendaciones y el RAG. Solo recuerda que es una aproximación moldeada por su modelo de entrenamiento — extraordinariamente útil, pero un sustituto del significado más que una comprensión.