Idioma
Español
Modelos y precios

Modelos y precios

Paga por consumo real de tokens. Sin cuotas mensuales, sin gasto mínimo. Consulta el uso y la facturación en tiempo real en la consola.

Tabla de precios de modelos

Precios de referencia para los modelos disponibles actualmente en RMB (¥) por millón de tokens.

ModeloInput / 1MOutput / 1M
gpt-5.5
¥35¥210
gpt-5.4
¥17.5¥105
gpt-5.4-mini
¥5.25¥31.5
gpt-5.3-chat
¥12.25¥98
gpt-5.3-codex
¥12.25¥98
claude-opus-4-8
¥35¥175
claude-opus-4-7
¥35¥175
claude-opus-4-6
¥35¥175
claude-sonnet-4-6
¥21¥105
claude-haiku-4-5-20251001
¥7¥35
deepseek-v4-pro
¥3¥6
deepseek-v4-flash
¥1¥3
claude-deepseek-v4-pro
¥3¥6
claude-deepseek-v4-flash
¥1¥3
doubao-seedance-2-0-260128
¥46¥46
doubao-seedream-5-0-260128
¥46¥46

Los precios pueden cambiar con ajustes de canales upstream. La consola muestra tarifas en tiempo real. Los descuentos de Prompt Cache se aplican automáticamente.

Adaptadores Claude Los modelos marcados como Adaptadores Claude (ej. claude-deepseek-v4-pro, claude-deepseek-v4-flash) son alias para clientes como Claude Code y Claude Desktop que solo pueden llamar modelos con prefijo claude-. Te permiten usar DeepSeek y otros modelos dentro del ecosistema Claude sin cambiar de herramienta. La facturación es idéntica al modelo original.

Modelo de facturación

Pago por consumo de tokens: Input (prompt) y Output (generación) se facturan independientemente, en ¥/1M tokens.

ConceptoDescripción
Input TokensContenido enviado al modelo: prompt del sistema + historial de conversación + mensaje actual del usuario.
Output TokensContenido generado por el modelo, típicamente 4–5× más caro que el input.
Cache ReadTokens que aciertan en Prompt Cache — facturados con descuento (ver abajo).

Descuentos de Prompt Cache

Cuando el mismo contenido de prefijo (prompts de sistema largos, documentos de referencia) se repite en varias solicitudes, la plataforma aplica automáticamente el mecanismo de Prompt Cache del proveedor — las partes en caché se facturan con un gran descuento.

Claude
≈ 10%

Descuento oficial de Anthropic ~90% de descuento.

OpenAI
≈ 10%

Aciertos de caché GPT ~10% del precio original (~90% de descuento).

DeepSeek
≈ 1%

Aciertos de caché DeepSeek ~1% del precio original (~99% de descuento).

Los descuentos de caché se aplican automáticamente — sin cambios de código. Los detalles de facturación en consola muestran el uso de Cache Read y Cache Write.

Ejemplos de estimación de costos

Costos de ejemplo usando claude-sonnet-4-6 (¥21 / 1M input, ¥105 / 1M output).

EscenarioInputOutputCosto por solicitud
Preguntas simples (100×/día)200 tokens300 tokens≈ ¥0.004 / solicitud
Resumen de documento (2000 caracteres)1500 tokens400 tokens≈ ¥0.074 / solicitud
Revisión de código (500 líneas)3000 tokens800 tokens≈ ¥0.147 / solicitud
RAG (10 fragmentos de contexto)5000 tokens600 tokens≈ ¥0.168 / solicitud

El costo real depende del modelo, la longitud de entrada y las rondas de conversación. Monitorea el uso en consola y configura alertas de presupuesto.