
DeepSeek V4 价格:Pro 和 Flash API 成本
DeepSeek V4 当前分为两个 API 模型:deepseek-v4-pro 和 deepseek-v4-flash。
官方价格把输入 token 拆成缓存命中和缓存未命中,再单独计算输出 token。这个设计很重要,因为稳定的 system prompt、复用上下文和模板化请求都可能显著降低成本。

可以把 Flash 和 Pro 看成两条价格通道:Flash 承担高频请求,Pro 留给错误成本更高的复杂任务。
官方 API 价格
| 模型 | 缓存命中输入 | 缓存未命中输入 | 输出 |
|---|---|---|---|
| DeepSeek V4 Flash | $0.028 / 1M tokens | $0.14 / 1M tokens | $0.28 / 1M tokens |
| DeepSeek V4 Pro | $0.145 / 1M tokens | $1.74 / 1M tokens | $3.48 / 1M tokens |
如何选择
高频场景优先用 DeepSeek V4 Flash,例如对话、摘要、抽取、分类、路由和初步分析。
复杂场景优先用 DeepSeek V4 Pro,例如代码修复、长链路推理、数学、agent 规划,或需要更高可靠性的最终回答。
本站 credits 规则
本站在官方 API 之上使用一层简单 credits:
- Flash 对话:1 credit
- Pro 对话:4 credits
- Thinking:+1 credit
- 联网搜索:+2 credits
这不是 DeepSeek 官方计费模型,而是本站为了统一比较 Flash、Pro、Thinking 和联网搜索所做的产品抽象。

