新闻 深度 观点 研究 数据 资源 活动 关于

DeepSeek的2.5折变成正价——压力不只给到模型厂商

DeepSeek把V4-Pro的2.5折优惠直接变成永久定价。每百万token输入3元、输出6元。但真正被挤压的不只是OpenAI和Anthropic——所有托管DeepSeek模型的第三方服务商也得重新想清楚了。

5月22日,DeepSeek官宣了一条让全行业都得消化的消息:V4-Pro的2.5折优惠活动5月31日结束后,不会恢复原价,直接将折扣价定为正式价格1

翻译成数字:每百万token输入3元(缓存未命中),输出6元,缓存命中0.025元2。原价12元输入、24元输出那一栏,变成了划线价。

不到一个月,DeepSeek调了四次价——4月24日V4发布,25日全线2.5折,26日缓存命中降到首发价十分之一(永久),5月22日2.5折变正价34。每次都说”这是最后一次”,每次都不是。

和同行比,不只便宜一点

把数字放在同一张表里就比较直观了。

表1:前沿模型API定价比对(每百万token) 2567

模型输入输出缓存命中
DeepSeek V4-Pro¥3¥6¥0.025
DeepSeek V4-Flash¥1¥2¥0.02
GPT-5.5¥36¥216无公开价
Claude Opus 4.7¥36¥180¥3.6
Gemini 3.5 Pro¥14.4¥86.4区间定价

V4-Pro的输出价格是GPT-5.5的1/34,是Claude Opus 4.7的1/3056。缓存命中价格更夸张——0.025元,和Opus的3.6元差了140倍27

对开发者来说,这种价差已经超出了”哪个更划算”的范畴——它改变了什么值得做、什么不值得做的判断边界。以前估算下来太贵而放弃的Agent场景,现在可能就是几个零头的成本。

模型厂商怎么应对

今年以来,国内外模型厂商形成了一种默契:模型越做越大,API价格越来越贵3。OpenAI从GPT-4o到GPT-5.5,输出涨了4倍。Anthropic从Claude 3.5 Sonnet到Opus 4.7,输出涨了5倍多。国内的智谱、阿里、腾讯也在跟着涨价。

DeepSeek在这个时间点把价格钉死在地板上,等于直接告诉同行:你们的价格体系站不住了。

但现实是,OpenAI和Anthropic短期内不会跟进。原因很简单——GPU集群的成本摆在那里。OpenAI跑在微软Azure的H200集群上,Anthropic跑在AWS和GCP上8。美国GPU推理的边际成本就在那个水位,跟着降价意味着亏损。DeepSeek的底层架构完全不是同一套打法——自研推理框架加上混合压缩注意力(CSA+HCA),1M上下文只需要V3版本27%的推理算力9。再加上国产昇腾芯片的支撑,成本结构本身就是不同的游戏。

所以硅谷厂商更可能走差异化路线:强调安全审查、企业合规(HIPAA、SOC2、FedRAMP)、产品生态整合8。OpenAI有ChatGPT和Codex平台做护城河,Anthropic押注政府和企业合规市场。不拼价格,拼信任——这是目前最可能的出路。

托管商也坐不住了——这才是关键

故事到这里只讲了一半。OpenAI和Anthropic是闭源模型,DeepSeek的价格再低,用户想使用也只能调DeepSeek的API。但DeepSeek是MIT开源的9——这意味着任何人都可以拿模型自己部署,或者找第三方托管。

第三方托管商正是被挤得最狠的群体。

Together AI已经上架了V4-Pro,定价2.10美元输入、4.40美元输出10。Fireworks AI也是1.74美元输入、3.48美元输出——和DeepSeek原厂原价一样11。DeepInfra提供FP4量化版,混合价2.17美元12

表2:同一模型,不同托管商,价格差一倍 101112

托管商V4-Pro输入/百万tokenV4-Pro输出/百万token特点
DeepSeek原厂$0.435$0.871M上下文,并发上限5002
Together AI$2.10$4.40512K上下文,企业级SLA10
Fireworks AI$1.74$3.48167 t/s吞吐量,1M上下文12
DeepInfra$1.74$3.48FP4量化,66K上下文12
Novita AI$1.74$3.481M上下文12

Together AI的价格是DeepSeek原厂的5倍,Fireworks和DeepInfra是原厂的4倍。以前这些托管商的卖点是”帮你运行开源模型,省得自己搭基础设施”——当原厂API已经便宜到这个程度,托管商的价值主张就得重新梳理了。

托管商手里的底牌还有几张:更高并发(DeepSeek原厂只给500并发)2、更高吞吐(Fireworks做到167 t/s)12、企业合规认证、数据不出特定区域。值得一提的是,Together目前只支持512K上下文10,反而比DeepSeek原厂的1M上下文还短——这也是托管商的价值主张越来越难讲的一个缩影。

更麻烦的是:托管商之间也在相互竞争。Fireworks、DeepInfra、Novita都定价$2.17/百万token混合价,彼此差距只有1.2倍12。利润薄到什么程度,外界不好估计,但方向很明确——持续压缩。

缓存命中0.025元意味着什么

这可能是整件事里最容易被忽视的一个数字。

0.025元每百万token缓存命中——不到3分钱2。Agent产品、编程助手、客服系统、文档密集型工作流,这些场景里同样的系统提示词和参考文档反复传进去,95%以上的输入走缓存3。也就是说,实际使用中,大部分输入token的成本接近于零。

这对Agent开发者尤其重要。Agent每次调用都要把整个上下文重新传一遍。如果缓存命中接近免费,Agent的每次调用成本就几乎只剩输出token的钱。6元每百万输出token——一个中等复杂度的Agent任务,每天的费用可能不到一杯咖啡。

这就是36氪说的”清场”——不是在价格战里多赢几个百分点,是把成本打到对手跟进就是亏损的位置3

下半年的昇腾950变量

DeepSeek在V4发布时的说明里留了一句话:受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,价格还会继续下探413

如果950如期量产,DeepSeek的推理成本还有继续往下压的空间。到那时,V4-Pro的永久定价可能还不是终点——它可能再次”永久降价”。高盛的分析也指向同一个方向:国产算力扩容带来更大的降价空间13

对所有人来说,这意味着一件事:别把现在的定价当终局。DeepSeek已经证明了,它的”永久”可能只是一块跳板。

参考来源

结语

DeepSeek把2.5折变成正价,意义不在”又降了一次”。它告诉所有人:这个价格,我能一直撑住。

对OpenAI和Anthropic来说,压力还不是最直接的——闭源模型至少还有信任壁垒和数据合规的优势。真正被推到墙角的是托管商。当原厂API已经比托管商便宜4-5倍,“帮你运行模型”这个生意的基础就被动摇了。托管商要么在服务上下功夫(并发、吞吐、SLA),要么在价格上继续压缩,要么找到新的价值锚点。

下半年的昇腾950如果如期量产,这轮降价可能还没到底。DeepSeek已经证明了:它的”永久定价”就是用来打破的。

Footnotes

  1. DeepSeek官方公告 — V4-Pro 2.5折优惠结束后正式调整为原定价1/4 https://api-docs.deepseek.com/zh-cn/quick_start/pricing

  2. DeepSeek定价页 — V4-Pro永久定价:输入3元、输出6元、缓存命中0.025元/百万token https://api-docs.deepseek.com/zh-cn/quick_start/pricing 2 3 4 5 6

  3. 36氪 — “涨价潮里,DeepSeek选择了清场”——技术代差发动的降维打击分析 https://36kr.com/p/3785921785076998 2 3 4

  4. 网易 — “DeepSeek官宣:2.5折变永久!价格屠夫又杀回来了”——一个月降四次的时间线 https://www.163.com/dy/article/KTJJHO5H05568W0A.html 2

  5. OpenAI定价页 — GPT-5.5定价:$5/百万输入,$30/百万输出 https://openai.com/api/pricing/ 2

  6. Anthropic定价页 — Claude Opus 4.7定价:$5/百万输入,$25/百万输出 https://anthropic.com/pricing 2

  7. Yahoo香港 — DeepSeek V4-Pro永久降价75%,缓存命中价与对手差距达138倍 https://hk.news.yahoo.com/deepseek-v4-pro-宣佈永久降價-75-175922880.html 2

  8. TechFastForward — Anthropic结构上最脆弱:API收入集中,无法匹配DeepSeek定价 https://techfastforward.com/articles/deepseek-v4-pro-matches-claude-at-86-percent-off-frontier-ai-economics-2026 2

  9. DeepSeek V4技术报告 — 1.6T参数MoE,49B激活,CSA+HCA混合注意力只需27%推理算力,MIT许可 https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro 2

  10. Together AI — V4-Pro上架:$2.10输入,$4.40输出,512K上下文 https://www.together.ai/blog/deepseek-v4-pro-now-available-on-together-ai 2 3 4

  11. LLMReference — Fireworks AI托管V4-Pro定价和DeepSeek原厂原价一致 https://www.llmreference.com/model/deepseek-v4-pro/fireworks-ai 2

  12. DeepInfra — 6家托管商基准测试:Fireworks 167 t/s最快,Together 0.99s TTFT,混合价$2.17 https://deepinfra.com/blog/deepseek-v4-pro-max-api-benchmarks-latency-throughput-cost 2 3 4 5 6 7

  13. 香港中通社/高盛 — 华为昇腾950PR下半年量产,V4-Pro价格预计进一步大幅下调 https://www.hkcna.hk/h5/docDetail.jsp?channel=2808&id=101306406 2