5月22日,DeepSeek官宣了一条让全行业都得消化的消息:V4-Pro的2.5折优惠活动5月31日结束后,不会恢复原价,直接将折扣价定为正式价格1。
翻译成数字:每百万token输入3元(缓存未命中),输出6元,缓存命中0.025元2。原价12元输入、24元输出那一栏,变成了划线价。
不到一个月,DeepSeek调了四次价——4月24日V4发布,25日全线2.5折,26日缓存命中降到首发价十分之一(永久),5月22日2.5折变正价34。每次都说”这是最后一次”,每次都不是。
和同行比,不只便宜一点
把数字放在同一张表里就比较直观了。
| 模型 | 输入 | 输出 | 缓存命中 |
|---|---|---|---|
| DeepSeek V4-Pro | ¥3 | ¥6 | ¥0.025 |
| DeepSeek V4-Flash | ¥1 | ¥2 | ¥0.02 |
| GPT-5.5 | ¥36 | ¥216 | 无公开价 |
| Claude Opus 4.7 | ¥36 | ¥180 | ¥3.6 |
| Gemini 3.5 Pro | ¥14.4 | ¥86.4 | 区间定价 |
V4-Pro的输出价格是GPT-5.5的1/34,是Claude Opus 4.7的1/3056。缓存命中价格更夸张——0.025元,和Opus的3.6元差了140倍27。
对开发者来说,这种价差已经超出了”哪个更划算”的范畴——它改变了什么值得做、什么不值得做的判断边界。以前估算下来太贵而放弃的Agent场景,现在可能就是几个零头的成本。
模型厂商怎么应对
今年以来,国内外模型厂商形成了一种默契:模型越做越大,API价格越来越贵3。OpenAI从GPT-4o到GPT-5.5,输出涨了4倍。Anthropic从Claude 3.5 Sonnet到Opus 4.7,输出涨了5倍多。国内的智谱、阿里、腾讯也在跟着涨价。
DeepSeek在这个时间点把价格钉死在地板上,等于直接告诉同行:你们的价格体系站不住了。
但现实是,OpenAI和Anthropic短期内不会跟进。原因很简单——GPU集群的成本摆在那里。OpenAI跑在微软Azure的H200集群上,Anthropic跑在AWS和GCP上8。美国GPU推理的边际成本就在那个水位,跟着降价意味着亏损。DeepSeek的底层架构完全不是同一套打法——自研推理框架加上混合压缩注意力(CSA+HCA),1M上下文只需要V3版本27%的推理算力9。再加上国产昇腾芯片的支撑,成本结构本身就是不同的游戏。
所以硅谷厂商更可能走差异化路线:强调安全审查、企业合规(HIPAA、SOC2、FedRAMP)、产品生态整合8。OpenAI有ChatGPT和Codex平台做护城河,Anthropic押注政府和企业合规市场。不拼价格,拼信任——这是目前最可能的出路。
托管商也坐不住了——这才是关键
故事到这里只讲了一半。OpenAI和Anthropic是闭源模型,DeepSeek的价格再低,用户想使用也只能调DeepSeek的API。但DeepSeek是MIT开源的9——这意味着任何人都可以拿模型自己部署,或者找第三方托管。
第三方托管商正是被挤得最狠的群体。
Together AI已经上架了V4-Pro,定价2.10美元输入、4.40美元输出10。Fireworks AI也是1.74美元输入、3.48美元输出——和DeepSeek原厂原价一样11。DeepInfra提供FP4量化版,混合价2.17美元12。
| 托管商 | V4-Pro输入/百万token | V4-Pro输出/百万token | 特点 |
|---|---|---|---|
| DeepSeek原厂 | $0.435 | $0.87 | 1M上下文,并发上限5002 |
| Together AI | $2.10 | $4.40 | 512K上下文,企业级SLA10 |
| Fireworks AI | $1.74 | $3.48 | 167 t/s吞吐量,1M上下文12 |
| DeepInfra | $1.74 | $3.48 | FP4量化,66K上下文12 |
| Novita AI | $1.74 | $3.48 | 1M上下文12 |
Together AI的价格是DeepSeek原厂的5倍,Fireworks和DeepInfra是原厂的4倍。以前这些托管商的卖点是”帮你运行开源模型,省得自己搭基础设施”——当原厂API已经便宜到这个程度,托管商的价值主张就得重新梳理了。
托管商手里的底牌还有几张:更高并发(DeepSeek原厂只给500并发)2、更高吞吐(Fireworks做到167 t/s)12、企业合规认证、数据不出特定区域。值得一提的是,Together目前只支持512K上下文10,反而比DeepSeek原厂的1M上下文还短——这也是托管商的价值主张越来越难讲的一个缩影。
更麻烦的是:托管商之间也在相互竞争。Fireworks、DeepInfra、Novita都定价$2.17/百万token混合价,彼此差距只有1.2倍12。利润薄到什么程度,外界不好估计,但方向很明确——持续压缩。
缓存命中0.025元意味着什么
这可能是整件事里最容易被忽视的一个数字。
0.025元每百万token缓存命中——不到3分钱2。Agent产品、编程助手、客服系统、文档密集型工作流,这些场景里同样的系统提示词和参考文档反复传进去,95%以上的输入走缓存3。也就是说,实际使用中,大部分输入token的成本接近于零。
这对Agent开发者尤其重要。Agent每次调用都要把整个上下文重新传一遍。如果缓存命中接近免费,Agent的每次调用成本就几乎只剩输出token的钱。6元每百万输出token——一个中等复杂度的Agent任务,每天的费用可能不到一杯咖啡。
这就是36氪说的”清场”——不是在价格战里多赢几个百分点,是把成本打到对手跟进就是亏损的位置3。
下半年的昇腾950变量
DeepSeek在V4发布时的说明里留了一句话:受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,价格还会继续下探413。
如果950如期量产,DeepSeek的推理成本还有继续往下压的空间。到那时,V4-Pro的永久定价可能还不是终点——它可能再次”永久降价”。高盛的分析也指向同一个方向:国产算力扩容带来更大的降价空间13。
对所有人来说,这意味着一件事:别把现在的定价当终局。DeepSeek已经证明了,它的”永久”可能只是一块跳板。
参考来源
结语
DeepSeek把2.5折变成正价,意义不在”又降了一次”。它告诉所有人:这个价格,我能一直撑住。
对OpenAI和Anthropic来说,压力还不是最直接的——闭源模型至少还有信任壁垒和数据合规的优势。真正被推到墙角的是托管商。当原厂API已经比托管商便宜4-5倍,“帮你运行模型”这个生意的基础就被动摇了。托管商要么在服务上下功夫(并发、吞吐、SLA),要么在价格上继续压缩,要么找到新的价值锚点。
下半年的昇腾950如果如期量产,这轮降价可能还没到底。DeepSeek已经证明了:它的”永久定价”就是用来打破的。
Footnotes
-
DeepSeek官方公告 — V4-Pro 2.5折优惠结束后正式调整为原定价1/4 https://api-docs.deepseek.com/zh-cn/quick_start/pricing ↩
-
DeepSeek定价页 — V4-Pro永久定价:输入3元、输出6元、缓存命中0.025元/百万token https://api-docs.deepseek.com/zh-cn/quick_start/pricing ↩ ↩2 ↩3 ↩4 ↩5 ↩6
-
36氪 — “涨价潮里,DeepSeek选择了清场”——技术代差发动的降维打击分析 https://36kr.com/p/3785921785076998 ↩ ↩2 ↩3 ↩4
-
网易 — “DeepSeek官宣:2.5折变永久!价格屠夫又杀回来了”——一个月降四次的时间线 https://www.163.com/dy/article/KTJJHO5H05568W0A.html ↩ ↩2
-
OpenAI定价页 — GPT-5.5定价:$5/百万输入,$30/百万输出 https://openai.com/api/pricing/ ↩ ↩2
-
Anthropic定价页 — Claude Opus 4.7定价:$5/百万输入,$25/百万输出 https://anthropic.com/pricing ↩ ↩2
-
Yahoo香港 — DeepSeek V4-Pro永久降价75%,缓存命中价与对手差距达138倍 https://hk.news.yahoo.com/deepseek-v4-pro-宣佈永久降價-75-175922880.html ↩ ↩2
-
TechFastForward — Anthropic结构上最脆弱:API收入集中,无法匹配DeepSeek定价 https://techfastforward.com/articles/deepseek-v4-pro-matches-claude-at-86-percent-off-frontier-ai-economics-2026 ↩ ↩2
-
DeepSeek V4技术报告 — 1.6T参数MoE,49B激活,CSA+HCA混合注意力只需27%推理算力,MIT许可 https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro ↩ ↩2
-
Together AI — V4-Pro上架:$2.10输入,$4.40输出,512K上下文 https://www.together.ai/blog/deepseek-v4-pro-now-available-on-together-ai ↩ ↩2 ↩3 ↩4
-
LLMReference — Fireworks AI托管V4-Pro定价和DeepSeek原厂原价一致 https://www.llmreference.com/model/deepseek-v4-pro/fireworks-ai ↩ ↩2
-
DeepInfra — 6家托管商基准测试:Fireworks 167 t/s最快,Together 0.99s TTFT,混合价$2.17 https://deepinfra.com/blog/deepseek-v4-pro-max-api-benchmarks-latency-throughput-cost ↩ ↩2 ↩3 ↩4 ↩5 ↩6 ↩7
-
香港中通社/高盛 — 华为昇腾950PR下半年量产,V4-Pro价格预计进一步大幅下调 https://www.hkcna.hk/h5/docDetail.jsp?channel=2808&id=101306406 ↩ ↩2