DeepSeek API 砍價:cache hit 價降至 1/10、V4 Pro 75% OFF 至 5/5

Elponcrab
分享
DeepSeek API 砍價:cache hit 價降至 1/10、V4 Pro 75% OFF 至 5/5

根據 DeepSeek 官方 4 月 26 日公告,DeepSeek API 全系列模型的「輸入 cache hit」(input cache hit)價格即日起降至原價 1/10。同時提醒:DeepSeek V4 Pro 模型 75% OFF 限時折扣仍延續至 2026 年 5 月 5 日 UTC 15:59,最新定價可於 DeepSeek API 官方定價頁查閱。

輸入 cache hit 價砍至 1/10、所有模型同步生效

Cache hit 是指:同一帳號跨 API 請求時,若新 prompt 的前綴與先前快取的內容重複(≥ 1,024 tokens),系統會以快取結果計價,這部分稱為 cache hit。對 RAG、agent、長對話等高重複前綴場景而言,cache hit 比例越高、成本下降越大。

本次調降覆蓋 DeepSeek 全系列模型,包含 V4 Pro、V4 Flash 與舊版本,均比照「原價 1/10」標準。對開發者而言,最直接的影響是:相同的 prompt 設計,月費帳單可能立即下降 50% 以上(取決於 cache hit cache hit rate)。

廣告 - 內文未完請往下捲動

V4 Pro 75% OFF 促銷延續至 5/5

同公告中 DeepSeek 提醒,4 月 24 日發布的 V4 Pro 旗艦模型仍享 75% 限時折扣,到 2026 年 5 月 5 日 UTC 15:59 截止。對照官方定價頁:

V4 Pro 計價(每 100 萬 tokens) 標準價 75% OFF 促銷價(至 5/5)
輸入(cache hit) $0.145 $0.03625
輸入(cache miss) $1.74 $0.435
輸出 $3.48 $0.87

促銷結束後,標準價會回到上表「標準價」一欄。對長期專案規劃而言,建議以標準價作為總成本估算基礎,把促銷期視為「免費試用窗口」。

對照 GPT-5.5 Pro 與 Claude Opus 4.7:價格戰主導

對照同級閉源旗艦:OpenAI GPT-5.5 ProAnthropic Claude Opus 4.7 的 API 價格範圍均落在每 100 萬輸出 tokens 數美元至十多美元級距;DeepSeek V4 Pro 即便回到標準價,輸出 $3.48/1M 仍落在閉源前段班的 1/3 到 1/4 區間。促銷期內的 $0.87/1M 輸出更是把同級對手徹底打開差距。

這也呼應 DeepSeek 自 V3.2 以來的價格戰策略:以「open weights + 同等水準性能 + 顯著低價」三軸搶佔企業 API 預算。對應用層開發者而言,cache 機制設計與成本敏感的工作流(RAG、agent 反覆查詢、客服)將是最快感受到價差的場景。

Ollama Cloud 已同步上架 V4 Pro 雲端版本

除了 DeepSeek 自家 API,Ollama 4 月 27 日已把 V4 Pro 加入官方雲端目錄,使用者可透過 ollama run deepseek-v4-pro:cloud 一行指令呼叫,並串接 Claude Code、Hermes Agent、OpenClaw 等主流 agent 工具。對追求工具整合便利性而非極致低價的用戶,Ollama Cloud 是另一條路徑;若以 token 成本為優先,DeepSeek 自家 API 在促銷期內仍是更便宜的選擇。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。