May 23, 2026

DeepSeek的2.5折变成正价——压力不只给到模型厂商

DeepSeek把V4-Pro的2.5折优惠直接变成永久定价。每百万token输入3元、输出6元。但真正被挤压的不只是OpenAI和Anthropic——所有托管DeepSeek模型的第三方服务商也得重新想清楚了。

5月22日，DeepSeek官宣了一条让全行业都得消化的消息：V4-Pro的2.5折优惠活动5月31日结束后，不会恢复原价，直接将折扣价定为正式价格¹。

翻译成数字：每百万token输入3元（缓存未命中），输出6元，缓存命中0.025元²。原价12元输入、24元输出那一栏，变成了划线价。

不到一个月，DeepSeek调了四次价——4月24日V4发布，25日全线2.5折，26日缓存命中降到首发价十分之一（永久），5月22日2.5折变正价³⁴。每次都说”这是最后一次”，每次都不是。

和同行比，不只便宜一点

把数字放在同一张表里就比较直观了。

表1：前沿模型API定价比对（每百万token） ²⁵⁶⁷

模型	输入	输出	缓存命中
DeepSeek V4-Pro	¥3	¥6	¥0.025
DeepSeek V4-Flash	¥1	¥2	¥0.02
GPT-5.5	¥36	¥216	无公开价
Claude Opus 4.7	¥36	¥180	¥3.6
Gemini 3.5 Pro	¥14.4	¥86.4	区间定价

V4-Pro的输出价格是GPT-5.5的1/34，是Claude Opus 4.7的1/30⁵⁶。缓存命中价格更夸张——0.025元，和Opus的3.6元差了140倍²⁷。

对开发者来说，这种价差已经超出了”哪个更划算”的范畴——它改变了什么值得做、什么不值得做的判断边界。以前估算下来太贵而放弃的Agent场景，现在可能就是几个零头的成本。

模型厂商怎么应对

今年以来，国内外模型厂商形成了一种默契：模型越做越大，API价格越来越贵³。OpenAI从GPT-4o到GPT-5.5，输出涨了4倍。Anthropic从Claude 3.5 Sonnet到Opus 4.7，输出涨了5倍多。国内的智谱、阿里、腾讯也在跟着涨价。

DeepSeek在这个时间点把价格钉死在地板上，等于直接告诉同行：你们的价格体系站不住了。

但现实是，OpenAI和Anthropic短期内不会跟进。原因很简单——GPU集群的成本摆在那里。OpenAI跑在微软Azure的H200集群上，Anthropic跑在AWS和GCP上⁸。美国GPU推理的边际成本就在那个水位，跟着降价意味着亏损。DeepSeek的底层架构完全不是同一套打法——自研推理框架加上混合压缩注意力（CSA+HCA），1M上下文只需要V3版本27%的推理算力⁹。再加上国产昇腾芯片的支撑，成本结构本身就是不同的游戏。

所以硅谷厂商更可能走差异化路线：强调安全审查、企业合规（HIPAA、SOC2、FedRAMP）、产品生态整合⁸。OpenAI有ChatGPT和Codex平台做护城河，Anthropic押注政府和企业合规市场。不拼价格，拼信任——这是目前最可能的出路。

托管商也坐不住了——这才是关键

故事到这里只讲了一半。OpenAI和Anthropic是闭源模型，DeepSeek的价格再低，用户想使用也只能调DeepSeek的API。但DeepSeek是MIT开源的⁹——这意味着任何人都可以拿模型自己部署，或者找第三方托管。

第三方托管商正是被挤得最狠的群体。

Together AI已经上架了V4-Pro，定价2.10美元输入、4.40美元输出¹⁰。Fireworks AI也是1.74美元输入、3.48美元输出——和DeepSeek原厂原价一样¹¹。DeepInfra提供FP4量化版，混合价2.17美元¹²。

表2：同一模型，不同托管商，价格差一倍 ¹⁰¹¹¹²

托管商	V4-Pro输入/百万token	V4-Pro输出/百万token	特点
DeepSeek原厂	$0.435	$0.87	1M上下文，并发上限500²
Together AI	$2.10	$4.40	512K上下文，企业级SLA¹⁰
Fireworks AI	$1.74	$3.48	167 t/s吞吐量，1M上下文¹²
DeepInfra	$1.74	$3.48	FP4量化，66K上下文¹²
Novita AI	$1.74	$3.48	1M上下文¹²

Together AI的价格是DeepSeek原厂的5倍，Fireworks和DeepInfra是原厂的4倍。以前这些托管商的卖点是”帮你运行开源模型，省得自己搭基础设施”——当原厂API已经便宜到这个程度，托管商的价值主张就得重新梳理了。

托管商手里的底牌还有几张：更高并发（DeepSeek原厂只给500并发）²、更高吞吐（Fireworks做到167 t/s）¹²、企业合规认证、数据不出特定区域。值得一提的是，Together目前只支持512K上下文¹⁰，反而比DeepSeek原厂的1M上下文还短——这也是托管商的价值主张越来越难讲的一个缩影。

更麻烦的是：托管商之间也在相互竞争。Fireworks、DeepInfra、Novita都定价$2.17/百万token混合价，彼此差距只有1.2倍¹²。利润薄到什么程度，外界不好估计，但方向很明确——持续压缩。

缓存命中0.025元意味着什么

这可能是整件事里最容易被忽视的一个数字。

0.025元每百万token缓存命中——不到3分钱²。Agent产品、编程助手、客服系统、文档密集型工作流，这些场景里同样的系统提示词和参考文档反复传进去，95%以上的输入走缓存³。也就是说，实际使用中，大部分输入token的成本接近于零。

这对Agent开发者尤其重要。Agent每次调用都要把整个上下文重新传一遍。如果缓存命中接近免费，Agent的每次调用成本就几乎只剩输出token的钱。6元每百万输出token——一个中等复杂度的Agent任务，每天的费用可能不到一杯咖啡。

这就是36氪说的”清场”——不是在价格战里多赢几个百分点，是把成本打到对手跟进就是亏损的位置³。

下半年的昇腾950变量

DeepSeek在V4发布时的说明里留了一句话：受限于高端算力，目前Pro的服务吞吐十分有限，预计下半年昇腾950超节点批量上市后，价格还会继续下探⁴¹³。

如果950如期量产，DeepSeek的推理成本还有继续往下压的空间。到那时，V4-Pro的永久定价可能还不是终点——它可能再次”永久降价”。高盛的分析也指向同一个方向：国产算力扩容带来更大的降价空间¹³。

对所有人来说，这意味着一件事：别把现在的定价当终局。DeepSeek已经证明了，它的”永久”可能只是一块跳板。

参考来源

结语

DeepSeek把2.5折变成正价，意义不在”又降了一次”。它告诉所有人：这个价格，我能一直撑住。

对OpenAI和Anthropic来说，压力还不是最直接的——闭源模型至少还有信任壁垒和数据合规的优势。真正被推到墙角的是托管商。当原厂API已经比托管商便宜4-5倍，“帮你运行模型”这个生意的基础就被动摇了。托管商要么在服务上下功夫（并发、吞吐、SLA），要么在价格上继续压缩，要么找到新的价值锚点。

下半年的昇腾950如果如期量产，这轮降价可能还没到底。DeepSeek已经证明了：它的”永久定价”就是用来打破的。

DeepSeek官方公告 — V4-Pro 2.5折优惠结束后正式调整为原定价1/4 https://api-docs.deepseek.com/zh-cn/quick_start/pricing ↩
DeepSeek定价页 — V4-Pro永久定价：输入3元、输出6元、缓存命中0.025元/百万token https://api-docs.deepseek.com/zh-cn/quick_start/pricing ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶
36氪 — “涨价潮里，DeepSeek选择了清场”——技术代差发动的降维打击分析 https://36kr.com/p/3785921785076998 ↩ ↩² ↩³ ↩⁴
网易 — “DeepSeek官宣：2.5折变永久！价格屠夫又杀回来了”——一个月降四次的时间线 https://www.163.com/dy/article/KTJJHO5H05568W0A.html ↩ ↩²
OpenAI定价页 — GPT-5.5定价：$5/百万输入，$30/百万输出 https://openai.com/api/pricing/ ↩ ↩²
Anthropic定价页 — Claude Opus 4.7定价：$5/百万输入，$25/百万输出 https://anthropic.com/pricing ↩ ↩²
Yahoo香港 — DeepSeek V4-Pro永久降价75%，缓存命中价与对手差距达138倍 https://hk.news.yahoo.com/deepseek-v4-pro-宣佈永久降價-75-175922880.html ↩ ↩²
TechFastForward — Anthropic结构上最脆弱：API收入集中，无法匹配DeepSeek定价 https://techfastforward.com/articles/deepseek-v4-pro-matches-claude-at-86-percent-off-frontier-ai-economics-2026 ↩ ↩²
DeepSeek V4技术报告 — 1.6T参数MoE，49B激活，CSA+HCA混合注意力只需27%推理算力，MIT许可 https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro ↩ ↩²
Together AI — V4-Pro上架：$2.10输入，$4.40输出，512K上下文 https://www.together.ai/blog/deepseek-v4-pro-now-available-on-together-ai ↩ ↩² ↩³ ↩⁴
LLMReference — Fireworks AI托管V4-Pro定价和DeepSeek原厂原价一致 https://www.llmreference.com/model/deepseek-v4-pro/fireworks-ai ↩ ↩²
DeepInfra — 6家托管商基准测试：Fireworks 167 t/s最快，Together 0.99s TTFT，混合价$2.17 https://deepinfra.com/blog/deepseek-v4-pro-max-api-benchmarks-latency-throughput-cost ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷
香港中通社/高盛 — 华为昇腾950PR下半年量产，V4-Pro价格预计进一步大幅下调 https://www.hkcna.hk/h5/docDetail.jsp?channel=2808&id=101306406 ↩ ↩²