DeepSeek V4 Flash:DeepSeek V4 的速度型模型

DeepSeek V4 系列里的快速通道。保留 1M 上下文,同时用更少 active 参数和更低 token 价格服务日常产品流量。

Ready To Chat
DeepSeek-V4-Flash
在线

DeepSeek-V4-Flash 已就绪

DeepSeek-V4-Flash 是此页面的默认模型。Fast DeepSeek V4 model for daily chat, tool-assisted answers, and high-throughput workflows.

选择 Flash 或 Pro,按需打开联网搜索和 Thinking,然后直接用真实问题开聊。
高速
Thinking
工具
低成本

示例问题

上下文
1M
规模
284B / 13B active
最大输出
32K
更适合
快速工作流
切换 DeepSeek V4 模型

当你想要更低成本和更快回复时,优先使用 Flash。

概览

DeepSeek V4 Flash 适合什么

DeepSeek V4 Flash 是 V4 高效路线:284B 总参数、13B active 参数,并通过 DeepSeek API 提供 1M 上下文。高频对话、摘要、路由和快速迭代更适合用它。

1M 上下文

长对话和大文档仍然可以放进来,不必一开始就升到 Pro。

更低 token 成本

Flash 的缓存命中输入、缓存未命中输入和输出价格都低于 Pro。

快速默认路径

适合高频请求、草稿生成、路由、摘要和初步分析。

DeepSeek V4 Flash 在主流模型 benchmark 里的位置

把 DeepSeek V4 Flash 与 DeepSeek V4 Pro 和主流 frontier 模型放在一起,方便看出快速路线在哪些任务接近 Pro、哪些任务应该升级。

DeepSeek V4 Flash

Max

高效 V4 路线,在代码和软件任务上接近 Pro。

当吞吐和成本更重要时,适合作为默认模型。

MMLU-Pro
86.2
SimpleQA
34.1
GPQA
88.1
LiveCodeBench
91.6
Terminal Bench
56.9
SWE Verified
79.0
SWE Pro
52.6
BrowseComp
73.2
MCPAtlas
69.0
Toolathlon
47.8

DeepSeek V4 Pro

Max

旗舰 V4 路线,在代码、agentic、浏览和工具调用任务上表现较强。

当最终答案出错成本很高时,再升级到 Pro。

MMLU-Pro
87.5
SimpleQA
57.9
GPQA
90.1
LiveCodeBench
93.5
Terminal Bench
67.9
SWE Verified
80.6
SWE Pro
55.4
BrowseComp
83.4
MCPAtlas
73.6
Toolathlon
51.8

Gemini 3.1 Pro

High

通用推理强基线,SimpleQA 与 GPQA 分数较高。

外部 frontier 基线。

MMLU-Pro
91.0
SimpleQA
75.6
GPQA
94.3
LiveCodeBench
91.7
Terminal Bench
68.5
SWE Verified
80.6
SWE Pro
54.2
BrowseComp
85.9
MCPAtlas
69.2
Toolathlon
48.8

Claude Opus 4.6

Max

代码和软件工程任务上的强基线。

外部 frontier 基线。

MMLU-Pro
89.1
SimpleQA
46.2
GPQA
91.3
LiveCodeBench
88.8
Terminal Bench
65.4
SWE Verified
80.8
SWE Pro
57.3
BrowseComp
83.7
MCPAtlas
73.8
Toolathlon
47.2

GPT-5.4

xHigh

偏深度推理的基线,Terminal、浏览和工具调用结果较强。

- 表示来源表格未披露该分数。

MMLU-Pro
87.5
SimpleQA
45.3
GPQA
93.0
LiveCodeBench
-
Terminal Bench
75.1
SWE Verified
-
SWE Pro
57.7
BrowseComp
82.7
MCPAtlas
67.2
Toolathlon
54.6

Kimi K2.6

Thinking

代码和 agentic 任务上的竞争基线。

外部 reasoning 基线。

MMLU-Pro
87.1
SimpleQA
36.9
GPQA
90.5
LiveCodeBench
89.6
Terminal Bench
66.7
SWE Verified
80.2
SWE Pro
58.6
BrowseComp
83.2
MCPAtlas
66.6
Toolathlon
50.0

GLM-5.1

Thinking

用于对比推理、浏览和工具任务的中国 frontier 基线。

- 表示来源表格未披露该分数。

MMLU-Pro
86.0
SimpleQA
38.1
GPQA
86.2
LiveCodeBench
-
Terminal Bench
63.5
SWE Verified
-
SWE Pro
58.4
BrowseComp
79.3
MCPAtlas
71.8
Toolathlon
40.7

数值来自 DeepSeek V4 官方模型卡表格。它们适合做路由参考,不能替代你自己的生产 eval。

更新于 2026-04-24
适用场景

DeepSeek V4 Flash 擅长什么

适合那些快速拿到有用答案比榨出最深推理更重要的任务。

快速问答

回答常见问题、解释错误、处理轻量客服对话,不拖慢节奏。

摘要

把 release notes、文档、ticket、邮件和聊天历史压缩成短输出。

分类和抽取

路由请求、打标签、抽取字段,并给下游流程准备输入。

搜索增强回答

只有需要新信息时才联网搜索,再让 Flash 快速起草回答。

提示词迭代

快速试 prompt、对比输出、调整指令,不必等待更慢模型。

低成本长上下文

保留大上下文,同时控制每 token 成本。

常见问题

DeepSeek V4 Flash 常见问题

关于 DeepSeek V4 Flash 的快速回答。

1

DeepSeek V4 Flash API 模型 ID 是什么?

使用 deepseek-v4-flash。

2

DeepSeek V4 Flash 多大?

官方材料列出 284B 总参数和 13B active 参数。

3

Flash 支持多长上下文?

DeepSeek API pricing 表列出 DeepSeek V4 Flash 支持 1M 上下文。

4

Flash 如何计费?

当前价格页列出缓存命中输入 $0.028、缓存未命中输入 $0.14、输出 $0.28 / 1M tokens。

5

什么时候应该用 Pro?

当任务复杂、用户可见或出错成本高时,用 Pro。

6

Flash 支持长上下文吗?

支持。Flash 保留同样列出的 1M 上下文,同时走更低成本路径。