5月22日、DeepSeekが業界全体が覚悟していた決定を下した:V4-Proの75%割引——5月31日で終了の予定だった——を、そのまま恒久価格にする1。
数字で言えば:百万入力tokenあたり$0.435(キャッシュミス)、百万出力tokenあたり$0.87、キャッシュ命中は百万あたり$0.0036252。元値の$1.74/$3.48は打消し線付きの飾りになった。
1ヶ月足らずで4回も値下げしている。4月24日にV4発表、25日に75%オフ、26日にキャッシュ命中価格を10分の1に(永久)、そして22日に割引がそのまま定価へ34。毎回「これで最後」と言って、毎回そうではなかった。
数字を並べると見えてくる
表1:フロンティアモデルAPI価格比較(百万tokenあたり) 2567
| モデル | 入力 | 出力 | キャッシュ命中 |
|---|---|---|---|
| DeepSeek V4-Pro | $0.435 | $0.87 | $0.0036 |
| DeepSeek V4-Flash | $0.14 | $0.28 | $0.0028 |
| GPT-5.5 | $5.00 | $30.00 | 非公開 |
| Claude Opus 4.7 | $5.00 | $25.00 | $0.50 |
| Gemini 3.5 Pro | $2.00 | $12.00 | 段階制 |
V4-Proの出力価格はGPT-5.5の34分の1、Claude Opus 4.7の30分の156。キャッシュ命中なら差はさらに開く——Anthropicの$0.50に対して$0.0036、138倍の開きがある27。
開発者にとって、この価格差は「どちらがお得か」という話を超えている。「以前は高すぎて踏み切れなかった自動化が、今はほとんどタダで動かせる」という次元だ。
モデル会社が追いつけない理由
2026年初頭以来、米中のAI企業の間には暗黙の合意があった:モデルは大きくなり、価格は上がる3。OpenAIはGPT-4oからGPT-5.5で出力価格が4倍になった。AnthropicはSonnet 3.5からOpus 4.7で5倍以上に膨らんだ。中国の智譜、阿里、騰訊も同じ方向に動いた。
DeepSeekが価格を底値に固定することは、競合全員への宣言でもある:あなたたちの価格体系はもう成り立たない、と。
ただ、米国のラボがすぐに追随することはない。理由はシンプルで、GPUクラスタのコストが許さないからだ。OpenAIはMicrosoft AzureのH200クラスタ、AnthropicはAWSとGCPで動いている8。米国のGPU推論には限界コストの水準がある以上、DeepSeekの価格に合わせれば赤字になる。DeepSeekのコスト構造は別の競技だ——自社製推論フレームとCSA+HCAハイブリッドアテンション(1MコンテキストでV3比27%の計算量)、そして国産昇騰チップ9。アーキテクチャの差は数%ではなく、桁が違う。
米国勢の対応は価格競争ではなく差別化になるだろう。OpenAIはChatGPT、Codex、Microsoft連携を頼りにする。Anthropicは安全認証、政府契約、エンタープライズコンプライアンス(HIPAA、SOC 2、FedRAMP)に軸足を置く8。token単価ではなく、信頼の価値で勝負する、という方針だ。
本当に追い詰められているのはホスティング業者
ここからが見落とされがちな部分だ。
OpenAIとAnthropicはクローズドモデルだ。Claudeを使いたければAnthropicに支払うしかない。DeepSeekの価格はマージンを圧迫するが、同じエンドポイントでの直接の代替にはならない。
DeepSeekはMITライセンスで公開されている9。誰でもダウンロードして展開し、ホスティングサービスとして提供できる。Together AI、Fireworks AI、DeepInfra、Novitaがまさにそれをやっている。そして、そこが最も強い圧力のかかる場所になっている。
| プロバイダ | V4-Pro入力/百万 | V4-Pro出力/百万 | 特徴 |
|---|---|---|---|
| DeepSeek(直接) | $0.435 | $0.87 | 1Mコンテキスト、同時接続上限5002 |
| Together AI | $2.10 | $4.40 | 512Kコンテキスト、企業SLA10 |
| Fireworks AI | $1.74 | $3.48 | 167 t/sスループット、1Mコンテキスト12 |
| DeepInfra | $1.74 | $3.48 | FP4量子化、66Kコンテキスト12 |
| Novita AI | $1.74 | $3.48 | 1Mコンテキスト12 |
Together AIはDeepSeek直接の5倍、FireworksとDeepInfraは4倍101112。ホスティング業者の当初の訴求はシンプルだった:「オープンソースモデルを代わりに運用します」。モデル提供元のAPIがここまで安くなると、その価値をどう組み立て直すかが問われる。
残されたカードはある:高い同時接続数(DeepSeekは500上限)2、高スループット(Fireworksは167トークン/秒)12、コンプライアンス認証、データ所在地の保証。注目すべきは、Together AIのコンテキストはまだ512K止まりであり10、DeepSeek直接の1Mより短い——「より多くを提供する」という訴求が成り立ちにくくなっている一例だ。これらが4〜5倍のプレミアムを正当化できるかどうか、ホスティング利用者は今まさに計算しているところだ。
問題はさらに重なる。プロバイダ同士も競合している。Fireworks、DeepInfra、Novitaはいずれも$2.17/百万のブレンド価格に収まっており、互いの差は1.2倍に過ぎない12。この価格帯でのマージンは薄く、さらに縮む方向にある。
キャッシュ命中$0.0036が意味するもの
おそらく今回の発表で最も注目されていない数字がこれだ。
百万キャッシュ命中tokenあたり$0.0036252。エージェント製品、コーディングアシスタント、カスタマーサポート、文書処理ワークフロー——これらはすべて、同じシステムプロンプトと参照文書を毎回送り続ける。入力tokenの95%以上がキャッシュに当たる3。実質的な入力コストはほぼゼロに等しい。
エージェント開発者にとって、これが核心になる。エージェントは毎回コンテキスト全体を再送信する。キャッシュ入力がほぼ無料なら、1回あたりのコストは出力tokenだけになる。$0.87/百万出力なら、中程度の複雑さのエージェントを1日動かしてもコーヒー1杯分のコストだ。
下半期の昇騰950という変数
DeepSeekはV4発表時の注釈でこう書いていた:Pro版のスループットは現在、計算資源の制約を受けている。華為の昇騰950超ノードが下半期に量産されれば、価格はさらに下がる見込みだ413。
950が予定通りに量産されれば、もう一段の値下がりがある。ゴールドマン・サックスも同じ方向を見ている:国産チップ供給の拡大がさらなる価格低下を後押しする13。今週発表された「永久価格」は底値ではないかもしれない——次の踏み台にすぎないかもしれない。
この動向を追っている人に伝えたいことは一つ:今日の価格を終着点として扱わないことだ。DeepSeekはすでに示している——「永久価格」とは、上から破られるために設定されるものだということを。
参考文献
まとめ
DeepSeekが75%割引を恒久価格にした意味は、「また値下げした」ことではない。この価格をずっと維持できる、という意思表示だ。
OpenAIとAnthropicへの圧力はまだ直接的ではない——クローズドモデルには信頼とコンプライアンスの防壁がある。本当に追い詰められているのはホスティング業者だ。モデル提供元のAPIがサードパーティの4〜5倍安くなった時点で、「代わりに運用します」というビジネスの土台が揺らいでいる。ホスティング業者はサービス(同時接続、スループット、SLA)で差をつけるか、価格を下げるか、新しい価値の軸を見つけるか——そのどれかを選ぶ必要がある。
昇騰950が予定通り下半期に量産されれば、この値下げはまだ底ではないかもしれない。DeepSeekはすでに示している——「永久価格」は、次の値下げのための足場として設定されるものだ。
Footnotes
-
DeepSeek公式発表 — V4-Pro 75%割引を5月31日以降も恒久価格に維持 https://api-docs.deepseek.com/quick_start/pricing/ ↩
-
DeepSeek価格ページ — V4-Pro恒久価格:入力$0.435/百万、出力$0.87/百万、キャッシュ命中$0.0036/百万 https://api-docs.deepseek.com/quick_start/pricing/ ↩ ↩2 ↩3 ↩4 ↩5 ↩6
-
36Kr — 「値上げの波の中、DeepSeekは市場を一掃する道を選んだ」— 技術格差による構造的価格分析 https://36kr.com/p/3785921785076998 ↩ ↩2 ↩3
-
Startup Fortune — “DeepSeek is making its 75 percent API discount permanent” — 1ヶ月で4回値下げのタイムライン https://startupfortune.com/deepseek-is-making-its-75-percent-api-discount-permanent/ ↩ ↩2
-
OpenAI価格ページ — GPT-5.5:$5.00/百万入力、$30.00/百万出力 https://openai.com/api/pricing/ ↩ ↩2
-
Anthropic価格ページ — Claude Opus 4.7:$5.00/百万入力、$25.00/百万出力 https://anthropic.com/pricing ↩ ↩2
-
Yahoo香港 — DeepSeek V4-Proキャッシュ命中がAnthropicより138倍安い https://hk.news.yahoo.com/deepseek-v4-pro-%E5%AE%A3%E4%BD%88%E6%B0%B8%E4%B9%85%E9%99%8D%E5%83%B9-75-175922880.html ↩ ↩2
-
TechFastForward — Anthropicが構造的に最も脆弱:API収入集中、DeepSeek価格に追いつけない https://techfastforward.com/articles/deepseek-v4-pro-matches-claude-at-86-percent-off-frontier-ai-economics-2026 ↩ ↩2
-
DeepSeek V4技術レポート — 1.6TパラメータMoE、49B活性化、CSA+HCAハイブリッドアテンション27%計算量、MITライセンス https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro ↩ ↩2
-
Together AI — V4-Proホスティング:$2.10/百万入力、$4.40/百万出力、512Kコンテキスト https://www.together.ai/blog/deepseek-v4-pro-now-available-on-together-ai ↩ ↩2 ↩3 ↩4
-
LLMReference — Fireworks AIのV4-Pro価格がDeepSeek元値と同額 https://www.llmreference.com/model/deepseek-v4-pro/fireworks-ai ↩ ↩2
-
DeepInfra — 6社ベンチマーク:Fireworks 167 t/s、Together 0.99s TTFT、ブレンド$2.17 https://deepinfra.com/blog/deepseek-v4-pro-max-api-benchmarks-latency-throughput-cost ↩ ↩2 ↩3 ↩4 ↩5 ↩6 ↩7
-
HKCNA / ゴールドマン・サックス — 昇騰950PR 2026年下半期量産、V4-Pro価格さらに下落の見込み https://www.hkcna.hk/h5/docDetail.jsp?channel=2808&id=101306406 ↩ ↩2