DeepSeek API 砍價：cache hit 價降至 1/10、V4 Pro 75% OFF 至 5/5

Elponcrab

2026/4/27

根據 DeepSeek 官方 4 月 26 日公告，DeepSeek API 全系列模型的「輸入 cache hit」（input cache hit）價格即日起降至原價 1/10。同時提醒：DeepSeek V4 Pro 模型 75% OFF 限時折扣仍延續至 2026 年 5 月 5 日 UTC 15:59，最新定價可於 DeepSeek API 官方定價頁查閱。

Table of Contents

輸入 cache hit 價砍至 1/10、所有模型同步生效

Cache hit 是指：同一帳號跨 API 請求時，若新 prompt 的前綴與先前快取的內容重複（≥ 1,024 tokens），系統會以快取結果計價，這部分稱為 cache hit。對 RAG、agent、長對話等高重複前綴場景而言，cache hit 比例越高、成本下降越大。

本次調降覆蓋 DeepSeek 全系列模型，包含 V4 Pro、V4 Flash 與舊版本，均比照「原價 1/10」標準。對開發者而言，最直接的影響是：相同的 prompt 設計，月費帳單可能立即下降 50% 以上（取決於 cache hit cache hit rate）。

廣告 - 內文未完請往下捲動

V4 Pro 75% OFF 促銷延續至 5/5

同公告中 DeepSeek 提醒，4 月 24 日發布的 V4 Pro 旗艦模型仍享 75% 限時折扣，到 2026 年 5 月 5 日 UTC 15:59 截止。對照官方定價頁：

V4 Pro 計價（每 100 萬 tokens）	標準價	75% OFF 促銷價（至 5/5）
輸入（cache hit）	$0.145	$0.03625
輸入（cache miss）	$1.74	$0.435
輸出	$3.48	$0.87

促銷結束後，標準價會回到上表「標準價」一欄。對長期專案規劃而言，建議以標準價作為總成本估算基礎，把促銷期視為「免費試用窗口」。

對照 GPT-5.5 Pro 與 Claude Opus 4.7：價格戰主導

對照同級閉源旗艦：OpenAI GPT-5.5 Pro 與 Anthropic Claude Opus 4.7 的 API 價格範圍均落在每 100 萬輸出 tokens 數美元至十多美元級距；DeepSeek V4 Pro 即便回到標準價，輸出 $3.48/1M 仍落在閉源前段班的 1/3 到 1/4 區間。促銷期內的 $0.87/1M 輸出更是把同級對手徹底打開差距。

這也呼應 DeepSeek 自 V3.2 以來的價格戰策略：以「open weights + 同等水準性能 + 顯著低價」三軸搶佔企業 API 預算。對應用層開發者而言，cache 機制設計與成本敏感的工作流（RAG、agent 反覆查詢、客服）將是最快感受到價差的場景。

Ollama Cloud 已同步上架 V4 Pro 雲端版本

除了 DeepSeek 自家 API，Ollama 4 月 27 日已把 V4 Pro 加入官方雲端目錄，使用者可透過 ollama run deepseek-v4-pro:cloud 一行指令呼叫，並串接 Claude Code、Hermes Agent、OpenClaw 等主流 agent 工具。對追求工具整合便利性而非極致低價的用戶，Ollama Cloud 是另一條路徑；若以 token 成本為優先，DeepSeek 自家 API 在促銷期內仍是更便宜的選擇。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。