模型与计费

模型与计费

按实际消耗的 Token 数量计费,无月费、无最低消费。所有模型统一在控制台实时查看用量和账单明细。

模型价格表

以下为当前上线模型的参考价格,单位为人民币(¥)/ 百万 Token。

模型渠道Input / 1MOutput / 1M
gpt-5.5gcp_l¥35¥210
gpt-5.4gcp_l¥17.5¥105
gpt-5.4-minigcp_l¥5.25¥31.5
gpt-5.3-chatgcp_l¥12.25¥98
gpt-5.3-codexgcp_l¥12.25¥98
claude-opus-4-7yy_yy¥35¥175
claude-opus-4-6yy_yy¥35¥175
claude-sonnet-4-6yy_yy¥21¥105
claude-haiku-4-5-20251001yy_yy¥7¥35
deepseek-v4-prods¥3¥6
deepseek-v4-flashds¥1¥3
claude-deepseek-v4-proClaude 客户端适配ds_claude¥3¥6
claude-deepseek-v4-flashClaude 客户端适配ds_claude¥1¥3
doubao-seedance-2-0-260128volcengine¥46¥46
doubao-seedream-5-0-260128volcengine¥46¥46

价格可能随上游渠道调整,以控制台实时展示为准。实际账单自动扣除 Prompt Cache 折扣。

Claude 客户端适配 标注的模型(如 claude-deepseek-v4-proclaude-deepseek-v4-flash)是专为 Claude Code、Claude Desktop 等客户端设计的别名模型。由于这些客户端只能调用以 claude- 开头的模型 ID,平台为非 Anthropic 模型提供了对应的别名,让你无需切换客户端即可在 Claude 生态内使用 DeepSeek 等模型。计费与原始模型一致。

计费模式

平台采用 Token 按量计费模型,分为 Input(提示词)和 Output(生成内容)两部分独立计价,单位为每百万 Token(¥/1M tokens)。

计费项说明
Input Tokens发送给模型的内容:系统提示词 + 对话历史 + 当前用户消息。
Output Tokens模型生成的回复内容,通常比 Input 贵 4–5 倍。
Cache Read命中 Prompt Cache 的 Token,按折扣价计费(详见下方)。

Prompt Cache 折扣

当相同的前缀内容(如长系统提示词、参考文档)在多次请求中重复出现时,平台会自动利用供应商的 Prompt Cache 机制,缓存命中部分以折扣价计费。

Claude
≈ 10% 原价

Anthropic 官方缓存折扣约 90% off。

OpenAI
50% 原价

GPT 系列缓存命中按半价计算。

DeepSeek
≈ 1% 原价

DeepSeek 缓存命中折扣极低,约 99% off。

缓存折扣由平台自动应用,无需修改代码。控制台账单明细中会显示 Cache Read 和 Cache Write 的用量。

费用估算示例

以下以 claude-sonnet-4-6(¥21 / 1M input,¥105 / 1M output)为例,帮助估算典型场景成本。

场景InputOutput单次成本
简单问答(100 次/天)200 tokens300 tokens≈ ¥0.004 / 次
文档摘要(2000 字原文)1500 tokens400 tokens≈ ¥0.074 / 次
代码审查(500 行代码)3000 tokens800 tokens≈ ¥0.147 / 次
RAG 检索增强(10 段上下文)5000 tokens600 tokens≈ ¥0.168 / 次

实际成本取决于模型、输入长度和对话轮次。建议在控制台「用量」页面实时监控,设置预算告警。