alexi.sh
Todos los artículosSeguridad del navegadorPrivacidad de redHerramientas de privacidadModelado de amenazasProgramación con IAHerramientas de dev

Calculadora de coste de API LLM

Estima lo que costará una función de IA antes de lanzarla. Elige un modelo, ajusta tus tokens de entrada/salida por petición y tu volumen diario, y obtén la factura por petición, mensual y anual. Los precios son valores indicativos editables — verifícalos en la página de precios de cada proveedor. Todo se ejecuta en tu navegador; nada se envía a nuestros servidores.

Indicative price (USD / 1M tokens) — editable. Verify on the provider's pricing page.

Per request
$0.0100
Monthly (×30 days)
$300
Yearly
$3600

60.0M input → $150 · 15.0M output → $150 per month

Tip: output tokens usually dominate the bill — they cost several times more than input on most models.

Cómo funciona el precio de las API LLM

La mayoría de las API LLM facturan por token, separando la entrada (tu prompt + contexto) y la salida (la respuesta del modelo), con precio independiente por millón de tokens. Los tokens de salida casi siempre cuestan varias veces más que los de entrada, así que las respuestas largas dominan la factura. El coste mensual ≈ (tokens de entrada × precio de entrada + tokens de salida × precio de salida) × peticiones. El tamaño del contexto, los reintentos y los system prompts añaden tokens de entrada — recortar el contexto y limitar la longitud de salida son las mayores palancas de ahorro. Esta herramienta hace visibles esas decisiones antes de elegir un modelo.

FAQ

How do I estimate LLM API costs?
Multiply your input tokens per request by the model's input price (per million tokens), add output tokens times the output price, then multiply by your number of requests. This calculator does it for you and shows per-request, monthly, and yearly totals — adjust the editable prices to match the provider's current rates.
Why are output tokens more expensive than input?
Generating tokens is more compute-intensive than reading them, so most providers price output several times higher than input (often 3–5×). That means long, verbose responses drive your bill more than large prompts — capping max output length is one of the most effective cost controls.
Are the prices in this calculator accurate?
They are indicative defaults as of June 2026 and are fully editable. API pricing changes frequently, so always confirm the current input and output price on the provider's official pricing page and update the fields accordingly.
How can I reduce my LLM API bill?
Trim context and system prompts (fewer input tokens), cap output length, use a smaller/cheaper model where quality allows, cache repeated context, and batch where possible. For privacy-sensitive or high-volume workloads, running a local LLM can remove per-token cost entirely.

Esta herramienta se ejecuta enteramente en tu navegador; no se transmite ni almacena ningún dato. Los precios son valores indicativos editables (junio de 2026) — confirma siempre el precio actual con el proveedor. El enlace a Proton es un enlace de afiliado, divulgado y marcado rel="sponsored".