May 23, 2026

DeepSeekが75%割引を定価に——押されるのはモデル会社だけじゃない

DeepSeekがV4-Proの75%割引をそのまま永久定価にした。入力$0.435/百万、出力$0.87/百万。だが本当の圧力はOpenAIやAnthropicにではなく、同じオープンソースモデルを4〜5倍の価格で提供するホスティング業者に向いている。

5月22日、DeepSeekが業界全体が覚悟していた決定を下した：V4-Proの75%割引——5月31日で終了の予定だった——を、そのまま恒久価格にする¹。

数字で言えば：百万入力tokenあたり$0.435（キャッシュミス）、百万出力tokenあたり$0.87、キャッシュ命中は百万あたり$0.003625²。元値の$1.74/$3.48は打消し線付きの飾りになった。

1ヶ月足らずで4回も値下げしている。4月24日にV4発表、25日に75%オフ、26日にキャッシュ命中価格を10分の1に（永久）、そして22日に割引がそのまま定価へ³⁴。毎回「これで最後」と言って、毎回そうではなかった。

数字を並べると見えてくる

表1：フロンティアモデルAPI価格比較（百万tokenあたり） ²⁵⁶⁷

モデル	入力	出力	キャッシュ命中
DeepSeek V4-Pro	$0.435	$0.87	$0.0036
DeepSeek V4-Flash	$0.14	$0.28	$0.0028
GPT-5.5	$5.00	$30.00	非公開
Claude Opus 4.7	$5.00	$25.00	$0.50
Gemini 3.5 Pro	$2.00	$12.00	段階制

V4-Proの出力価格はGPT-5.5の34分の1、Claude Opus 4.7の30分の1⁵⁶。キャッシュ命中なら差はさらに開く——Anthropicの$0.50に対して$0.0036、138倍の開きがある²⁷。

開発者にとって、この価格差は「どちらがお得か」という話を超えている。「以前は高すぎて踏み切れなかった自動化が、今はほとんどタダで動かせる」という次元だ。

モデル会社が追いつけない理由

2026年初頭以来、米中のAI企業の間には暗黙の合意があった：モデルは大きくなり、価格は上がる³。OpenAIはGPT-4oからGPT-5.5で出力価格が4倍になった。AnthropicはSonnet 3.5からOpus 4.7で5倍以上に膨らんだ。中国の智譜、阿里、騰訊も同じ方向に動いた。

DeepSeekが価格を底値に固定することは、競合全員への宣言でもある：あなたたちの価格体系はもう成り立たない、と。

ただ、米国のラボがすぐに追随することはない。理由はシンプルで、GPUクラスタのコストが許さないからだ。OpenAIはMicrosoft AzureのH200クラスタ、AnthropicはAWSとGCPで動いている⁸。米国のGPU推論には限界コストの水準がある以上、DeepSeekの価格に合わせれば赤字になる。DeepSeekのコスト構造は別の競技だ——自社製推論フレームとCSA+HCAハイブリッドアテンション（1MコンテキストでV3比27%の計算量）、そして国産昇騰チップ⁹。アーキテクチャの差は数%ではなく、桁が違う。

米国勢の対応は価格競争ではなく差別化になるだろう。OpenAIはChatGPT、Codex、Microsoft連携を頼りにする。Anthropicは安全認証、政府契約、エンタープライズコンプライアンス（HIPAA、SOC 2、FedRAMP）に軸足を置く⁸。token単価ではなく、信頼の価値で勝負する、という方針だ。

本当に追い詰められているのはホスティング業者

ここからが見落とされがちな部分だ。

OpenAIとAnthropicはクローズドモデルだ。Claudeを使いたければAnthropicに支払うしかない。DeepSeekの価格はマージンを圧迫するが、同じエンドポイントでの直接の代替にはならない。

DeepSeekはMITライセンスで公開されている⁹。誰でもダウンロードして展開し、ホスティングサービスとして提供できる。Together AI、Fireworks AI、DeepInfra、Novitaがまさにそれをやっている。そして、そこが最も強い圧力のかかる場所になっている。

表2：同じモデル、違うホスト、違う価格 ¹⁰¹¹¹²

プロバイダ	V4-Pro入力/百万	V4-Pro出力/百万	特徴
DeepSeek（直接）	$0.435	$0.87	1Mコンテキスト、同時接続上限500²
Together AI	$2.10	$4.40	512Kコンテキスト、企業SLA¹⁰
Fireworks AI	$1.74	$3.48	167 t/sスループット、1Mコンテキスト¹²
DeepInfra	$1.74	$3.48	FP4量子化、66Kコンテキスト¹²
Novita AI	$1.74	$3.48	1Mコンテキスト¹²

Together AIはDeepSeek直接の5倍、FireworksとDeepInfraは4倍¹⁰¹¹¹²。ホスティング業者の当初の訴求はシンプルだった：「オープンソースモデルを代わりに運用します」。モデル提供元のAPIがここまで安くなると、その価値をどう組み立て直すかが問われる。

残されたカードはある：高い同時接続数（DeepSeekは500上限）²、高スループット（Fireworksは167トークン/秒）¹²、コンプライアンス認証、データ所在地の保証。注目すべきは、Together AIのコンテキストはまだ512K止まりであり¹⁰、DeepSeek直接の1Mより短い——「より多くを提供する」という訴求が成り立ちにくくなっている一例だ。これらが4〜5倍のプレミアムを正当化できるかどうか、ホスティング利用者は今まさに計算しているところだ。

問題はさらに重なる。プロバイダ同士も競合している。Fireworks、DeepInfra、Novitaはいずれも$2.17/百万のブレンド価格に収まっており、互いの差は1.2倍に過ぎない¹²。この価格帯でのマージンは薄く、さらに縮む方向にある。

キャッシュ命中$0.0036が意味するもの

おそらく今回の発表で最も注目されていない数字がこれだ。

百万キャッシュ命中tokenあたり$0.003625²。エージェント製品、コーディングアシスタント、カスタマーサポート、文書処理ワークフロー——これらはすべて、同じシステムプロンプトと参照文書を毎回送り続ける。入力tokenの95%以上がキャッシュに当たる³。実質的な入力コストはほぼゼロに等しい。

エージェント開発者にとって、これが核心になる。エージェントは毎回コンテキスト全体を再送信する。キャッシュ入力がほぼ無料なら、1回あたりのコストは出力tokenだけになる。$0.87/百万出力なら、中程度の複雑さのエージェントを1日動かしてもコーヒー1杯分のコストだ。

下半期の昇騰950という変数

DeepSeekはV4発表時の注釈でこう書いていた：Pro版のスループットは現在、計算資源の制約を受けている。華為の昇騰950超ノードが下半期に量産されれば、価格はさらに下がる見込みだ⁴¹³。

950が予定通りに量産されれば、もう一段の値下がりがある。ゴールドマン・サックスも同じ方向を見ている：国産チップ供給の拡大がさらなる価格低下を後押しする¹³。今週発表された「永久価格」は底値ではないかもしれない——次の踏み台にすぎないかもしれない。

この動向を追っている人に伝えたいことは一つ：今日の価格を終着点として扱わないことだ。DeepSeekはすでに示している——「永久価格」とは、上から破られるために設定されるものだということを。

参考文献

まとめ

DeepSeekが75%割引を恒久価格にした意味は、「また値下げした」ことではない。この価格をずっと維持できる、という意思表示だ。

OpenAIとAnthropicへの圧力はまだ直接的ではない——クローズドモデルには信頼とコンプライアンスの防壁がある。本当に追い詰められているのはホスティング業者だ。モデル提供元のAPIがサードパーティの4〜5倍安くなった時点で、「代わりに運用します」というビジネスの土台が揺らいでいる。ホスティング業者はサービス（同時接続、スループット、SLA）で差をつけるか、価格を下げるか、新しい価値の軸を見つけるか——そのどれかを選ぶ必要がある。

昇騰950が予定通り下半期に量産されれば、この値下げはまだ底ではないかもしれない。DeepSeekはすでに示している——「永久価格」は、次の値下げのための足場として設定されるものだ。

DeepSeek公式発表 — V4-Pro 75%割引を5月31日以降も恒久価格に維持 https://api-docs.deepseek.com/quick_start/pricing/ ↩
DeepSeek価格ページ — V4-Pro恒久価格：入力$0.435/百万、出力$0.87/百万、キャッシュ命中$0.0036/百万 https://api-docs.deepseek.com/quick_start/pricing/ ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶
36Kr — 「値上げの波の中、DeepSeekは市場を一掃する道を選んだ」— 技術格差による構造的価格分析 https://36kr.com/p/3785921785076998 ↩ ↩² ↩³
Startup Fortune — “DeepSeek is making its 75 percent API discount permanent” — 1ヶ月で4回値下げのタイムライン https://startupfortune.com/deepseek-is-making-its-75-percent-api-discount-permanent/ ↩ ↩²
OpenAI価格ページ — GPT-5.5：$5.00/百万入力、$30.00/百万出力 https://openai.com/api/pricing/ ↩ ↩²
Anthropic価格ページ — Claude Opus 4.7：$5.00/百万入力、$25.00/百万出力 https://anthropic.com/pricing ↩ ↩²
Yahoo香港 — DeepSeek V4-Proキャッシュ命中がAnthropicより138倍安い https://hk.news.yahoo.com/deepseek-v4-pro-%E5%AE%A3%E4%BD%88%E6%B0%B8%E4%B9%85%E9%99%8D%E5%83%B9-75-175922880.html ↩ ↩²
TechFastForward — Anthropicが構造的に最も脆弱：API収入集中、DeepSeek価格に追いつけない https://techfastforward.com/articles/deepseek-v4-pro-matches-claude-at-86-percent-off-frontier-ai-economics-2026 ↩ ↩²
DeepSeek V4技術レポート — 1.6TパラメータMoE、49B活性化、CSA+HCAハイブリッドアテンション27%計算量、MITライセンス https://huggingface.co/deepseek-ai/DeepSeek-V4-Pro ↩ ↩²
Together AI — V4-Proホスティング：$2.10/百万入力、$4.40/百万出力、512Kコンテキスト https://www.together.ai/blog/deepseek-v4-pro-now-available-on-together-ai ↩ ↩² ↩³ ↩⁴
LLMReference — Fireworks AIのV4-Pro価格がDeepSeek元値と同額 https://www.llmreference.com/model/deepseek-v4-pro/fireworks-ai ↩ ↩²
DeepInfra — 6社ベンチマーク：Fireworks 167 t/s、Together 0.99s TTFT、ブレンド$2.17 https://deepinfra.com/blog/deepseek-v4-pro-max-api-benchmarks-latency-throughput-cost ↩ ↩² ↩³ ↩⁴ ↩⁵ ↩⁶ ↩⁷
HKCNA / ゴールドマン・サックス — 昇騰950PR 2026年下半期量産、V4-Pro価格さらに下落の見込み https://www.hkcna.hk/h5/docDetail.jsp?channel=2808&id=101306406 ↩ ↩²