Modelos y precios
Paga por consumo real de tokens. Sin cuotas mensuales, sin gasto mínimo. Consulta el uso y la facturación en tiempo real en la consola.
Tabla de precios de modelos
Precios de referencia para los modelos disponibles actualmente en RMB (¥) por millón de tokens.
| Modelo | Input / 1M | Output / 1M |
|---|---|---|
| ¥35 | ¥210 | |
| ¥17.5 | ¥105 | |
| ¥5.25 | ¥31.5 | |
| ¥12.25 | ¥98 | |
| ¥12.25 | ¥98 | |
| ¥35 | ¥175 | |
| ¥35 | ¥175 | |
| ¥35 | ¥175 | |
| ¥21 | ¥105 | |
| ¥7 | ¥35 | |
| ¥3 | ¥6 | |
| ¥1 | ¥3 | |
| ¥3 | ¥6 | |
| ¥1 | ¥3 | |
| ¥46 | ¥46 | |
| ¥46 | ¥46 |
Los precios pueden cambiar con ajustes de canales upstream. La consola muestra tarifas en tiempo real. Los descuentos de Prompt Cache se aplican automáticamente.
Modelo de facturación
Pago por consumo de tokens: Input (prompt) y Output (generación) se facturan independientemente, en ¥/1M tokens.
| Concepto | Descripción |
|---|---|
| Input Tokens | Contenido enviado al modelo: prompt del sistema + historial de conversación + mensaje actual del usuario. |
| Output Tokens | Contenido generado por el modelo, típicamente 4–5× más caro que el input. |
| Cache Read | Tokens que aciertan en Prompt Cache — facturados con descuento (ver abajo). |
Descuentos de Prompt Cache
Cuando el mismo contenido de prefijo (prompts de sistema largos, documentos de referencia) se repite en varias solicitudes, la plataforma aplica automáticamente el mecanismo de Prompt Cache del proveedor — las partes en caché se facturan con un gran descuento.
Descuento oficial de Anthropic ~90% de descuento.
Aciertos de caché GPT ~10% del precio original (~90% de descuento).
Aciertos de caché DeepSeek ~1% del precio original (~99% de descuento).
Ejemplos de estimación de costos
Costos de ejemplo usando claude-sonnet-4-6 (¥21 / 1M input, ¥105 / 1M output).
| Escenario | Input | Output | Costo por solicitud |
|---|---|---|---|
| Preguntas simples (100×/día) | 200 tokens | 300 tokens | ≈ ¥0.004 / solicitud |
| Resumen de documento (2000 caracteres) | 1500 tokens | 400 tokens | ≈ ¥0.074 / solicitud |
| Revisión de código (500 líneas) | 3000 tokens | 800 tokens | ≈ ¥0.147 / solicitud |
| RAG (10 fragmentos de contexto) | 5000 tokens | 600 tokens | ≈ ¥0.168 / solicitud |
El costo real depende del modelo, la longitud de entrada y las rondas de conversación. Monitorea el uso en consola y configura alertas de presupuesto.

