快速问答
回答常见问题、解释错误、处理轻量客服对话,不拖慢节奏。
DeepSeek V4 系列里的快速通道。保留 1M 上下文,同时用更少 active 参数和更低 token 价格服务日常产品流量。
DeepSeek-V4-Flash 是此页面的默认模型。Fast DeepSeek V4 model for daily chat, tool-assisted answers, and high-throughput workflows.
示例问题
当你想要更低成本和更快回复时,优先使用 Flash。
DeepSeek V4 Flash 是 V4 高效路线:284B 总参数、13B active 参数,并通过 DeepSeek API 提供 1M 上下文。高频对话、摘要、路由和快速迭代更适合用它。
长对话和大文档仍然可以放进来,不必一开始就升到 Pro。
Flash 的缓存命中输入、缓存未命中输入和输出价格都低于 Pro。
适合高频请求、草稿生成、路由、摘要和初步分析。
把 DeepSeek V4 Flash 与 DeepSeek V4 Pro 和主流 frontier 模型放在一起,方便看出快速路线在哪些任务接近 Pro、哪些任务应该升级。
高效 V4 路线,在代码和软件任务上接近 Pro。
当吞吐和成本更重要时,适合作为默认模型。
旗舰 V4 路线,在代码、agentic、浏览和工具调用任务上表现较强。
当最终答案出错成本很高时,再升级到 Pro。
通用推理强基线,SimpleQA 与 GPQA 分数较高。
外部 frontier 基线。
代码和软件工程任务上的强基线。
外部 frontier 基线。
偏深度推理的基线,Terminal、浏览和工具调用结果较强。
- 表示来源表格未披露该分数。
代码和 agentic 任务上的竞争基线。
外部 reasoning 基线。
用于对比推理、浏览和工具任务的中国 frontier 基线。
- 表示来源表格未披露该分数。
数值来自 DeepSeek V4 官方模型卡表格。它们适合做路由参考,不能替代你自己的生产 eval。
更新于 2026-04-24适合那些快速拿到有用答案比榨出最深推理更重要的任务。
回答常见问题、解释错误、处理轻量客服对话,不拖慢节奏。
把 release notes、文档、ticket、邮件和聊天历史压缩成短输出。
路由请求、打标签、抽取字段,并给下游流程准备输入。
只有需要新信息时才联网搜索,再让 Flash 快速起草回答。
快速试 prompt、对比输出、调整指令,不必等待更慢模型。
保留大上下文,同时控制每 token 成本。
关于 DeepSeek V4 Flash 的快速回答。
使用 deepseek-v4-flash。
官方材料列出 284B 总参数和 13B active 参数。
DeepSeek API pricing 表列出 DeepSeek V4 Flash 支持 1M 上下文。
当前价格页列出缓存命中输入 $0.028、缓存未命中输入 $0.14、输出 $0.28 / 1M tokens。
当任务复杂、用户可见或出错成本高时,用 Pro。
支持。Flash 保留同样列出的 1M 上下文,同时走更低成本路径。