打破週期性迷思!一公式拆解 HBM 需求結構:記憶體為何只會繼續上漲?
AI 浪潮推動記憶體需求與價格水漲船高,然而外界仍擔憂 HBM 是否會重蹈「週期性」覆徹,像過去的 DRAM 一樣,在需求高峰後迅速反轉?半導體架構分析人士 fin 對此指出,HBM 的需求邏輯,已與傳統記憶體產業規律脫鉤,正透過 token 重新定價。
(記憶體漲勢趨緩?機構評估 Q2 漲幅縮窄至 30%,下半年進一步降溫)
CPU 時代的記憶體:可有可無的附屬品
fin 指出,在 CPU 主導運算的年代,DDR 記憶體的角色始終只是輔助角色。CPU 工程師發展出一整套掩蓋記憶體延遲的架構技巧,包括超純量設計、多層快取、暫存器重新命名等,讓處理器得以在不倚賴高速記憶體的條件下維持高效能:
工業界的經驗法則是,即便 DDR 頻寬直接翻倍,CPU 整體效能的提升也往往不超過兩成。
這樣的架構直接塑造了過去數十年 DRAM 產業的成長節奏。DDR3 到 DDR5,歷時整整十五年;過去十年間,一般 PC 的 DDR 容量從 7 至 8 GB 增長至約 23 GB,十年僅成長三倍。DRAM 廠商的主要獲利來源為容量大小,頻寬升級不過是拉高單位售價的手段。
在 CPU 時代,記憶體就是晶片產業裡邊際效用最低的一環,週期性起伏是常態、也是宿命。
AI 推理時代來臨,從根本改寫記憶體價值標準
然而,當運算主角切換至 AI 推理引擎,衡量標準也隨之更迭,晶片廠商比的是每秒能執行多少次浮點運算;如今,AI 時代的核心 KPI 只有一個:每單位成本與每單位功耗,能夠產生多少個 Token。
輝達執行長黃仁勳所提出的「AI 工廠」概念,精確描述了這套新邏輯:AI 工廠存在的意義,就是以最低成本生產最多 Token,同時把 Token 的輸出速度推向極限。優化目標由單一維度向外擴展,需同時最大化 Token 的總吞吐量,也追求每個請求的 Token 輸出速度。
這個 KPI 的改變,則成了 HBM 命運翻轉的起點。
Token 吞吐量公式,揭開 HBM 需求的第一性原理
fin 將 AI 推理的 Token 吞吐量,拆解為兩個參數的乘積:「同時處理的請求批次數量 × 每個請求的平均 Token 生成速度」追溯這兩個參數各自的瓶頸,答案都指向同一個零件。
批次數量的瓶頸,在於 HBM 的儲存容量。每一個推理請求都攜帶著自己的 KV 快取,也就是模型推理過程中儲存中間狀態的機制,而這份快取必須即時存放在 HBM 之中,以便模型每生成一個 Token 時反覆高速讀取。批次規模越大,HBM 所需的儲存空間就越大,兩者呈線性正比關係。
Token 速度的瓶頸,則在於 HBM 的頻寬。模型解碼階段每產生一個 Token,都需要反覆讀取龐大的啟動權重與 KV 快取,讀取速度直接決定了 Token 的生成效率,而讀取速度的上限,就是 HBM 的頻寬。
他表示,這個關係可以用機場接駁車做比喻:HBM 容量是接駁車的車廂大小,決定一次能載多少乘客;HBM 頻寬是車門的寬度,決定乘客上下車的速度;旅客輸送的總吞吐量,則是車廂大小乘以上車速度的積。由此推導出 AI 推理硬體需求的第一原則:
Token 吞吐量 = HBM 容量 × HBM 頻寬
若要讓每一代 GPU 的 Token 吞吐量維持兩倍的世代成長,HBM 容量與 HBM 頻寬的乘積就必須每代翻倍。
軟體優化解不了題,HBM 需求鎖定在指數軌道上
面對這套推論,市場最常見的反駁是:軟體優化難道不能降低對 HBM 的依賴?他給出的答案是,軟體效率與硬體規格的進步是兩個完全獨立的維度,兩者並不互相取代。這就像 CPU 軟體優化再徹底,仍無法阻止英特爾或 AMD 每一代都必須在標準測試中交出更高的跑分,否則產品就賣不出去。
GPU 的邏輯完全相同:只要全球對 Token 的需求持續擴張,對更高 Token 吞吐量的追求就不會停歇,對 HBM 兩方面進步的需求更不會停止。
更關鍵的是,這股壓力並非來自外部景氣的拉動,而是供應端的內生需求。只要輝達還要販賣下一代 GPU,就必然要向 SK 海力士、三星、美光施壓,要求每一代 HBM 在容量與頻寬上同步躍進,因為 HBM 的天花板,就是 GPU 效能的天花板。
將輝達從 A100 到 Rubin Ultra 各代 GPU 的 Token 吞吐量,與對應的「HBM 容量 × HBM 頻寬」數值繪於同一對數座標圖上,兩條曲線的吻合程度將令人驚訝。這並非歷史巧合,而是系統最佳化的必然解。
HBM 告別週期宿命,市場定價邏輯仍待重估
綜合上述架構層面的推導,HBM 與傳統 DRAM 的本質差異已然清晰。傳統記憶體是晶片產業的附屬品,需求驅動力薄弱,一旦擴產節奏超越需求復甦,週期性崩價便如期而至。
但 HBM 的需求,已被 AI 推理架構的物理邏輯鎖定在指數成長的軌道之上。這與 AI 整體市場的冷熱與總體經濟的景氣循環,都不存在直接的因果關係。
當然,真正的問題並不在需求端,而在供應端:SK 海力士、三星與美光這三大玩家,在面對強勁需求時,能否克制過去幾十年間反覆上演的盲目擴產衝動,避免再度埋下供過於求的週期禍根?這個問題的答案將會是本輪記憶體週期,能否長期延續的關鍵變數。
(記憶體股崩跌還能買嗎?三星證券分析師:週期內修正而非景氣見頂)
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。

