記憶體牛市為何還能再漲五年?三指標看懂 HBM、DRAM、NAND 差在哪?

Crumax
分享
記憶體牛市為何還能再漲五年?三指標看懂 HBM、DRAM、NAND 差在哪?

隨著半導體產業敘事轉向 AI 推理,記憶體與儲存正成為供應鏈中最大的瓶頸。市場也擔憂 HBM、DRAM、NAND SSD 這一輪漲勢,是又一次固定的牛熊週期,還是真的出現了突破性改變?

半導體架構分析人士 fin 對此建立一套三條件框架,分別替 HBM、DRAM、NAND SSD 打分數,從客製化程度結構性需求成長技術迭代速度三個維度逐一檢視,並進一步拆解市場關注的兩大變數:中國長鑫存儲 CXMT 擴產的實際威脅,以及 GPU 架構是否會因為 Transformer 與 KV Cache 被淘汰而動搖 HBM 需求根基。

記憶體為什麼特別容易陷入週期性陷阱?

半導體產業存在週期性,但記憶體的週期與波動性又特別劇烈,外界普遍解釋是因為記憶體具有「商品」特性:「產品無差異化、容易打價格戰、又能囤貨。」

廣告 - 內文未完請往下捲動

然而,fin 認為這個解釋只說對一半。商品屬性本身並不會「製造」週期性,只是一個振幅放大器。真正原因在於記憶體的供給擴產週期太長,長到足以與需求週期脫節。建一座晶圓廠需要三年時間、數百億美元投資,而且決策一旦下達就不可逆。與此同時,需求端卻充滿不確定性,每當出現雲端服務、智慧型手機、疫情線上需求促成新一波成長動能,各廠就會大加碼產能,但通常兩年後成長放緩、供給追上甚至超過需求、價格崩跌,整個產業隨即陷入虧損循環。

理解了週期性的真正根源,下一個問題是:「HBM、DRAM、NAND SSD 這次有沒有不一樣?」

打分規則:擺脫週期性的三大條件

要判斷一項記憶體產品能否部分或大幅擺脫傳統週期性,fin 提出以下三項條件:

  • 客製化程度:產品是否無法互換、產能無法自由轉移,因此必須簽訂長期合約綁定供需雙方。
  • 強勁且持續的需求成長:需求曲線本身是否極度陡峭,讓供給端持續追不上,而非一次性的爆發後又回落。
  • 技術快速迭代:新一代產品是否會迅速淘汰舊一代,讓囤貨與價格戰等傳統打法失去意義。

只要滿足其中一項,就能部分擺脫傳統週期性;滿足兩到三項,就能擺脫大部分週期性,轉化為「漲多跌少」而非「漲多跌深」的傳統週期。

根據這套標準,HBM、DRAM、NAND SSD 的分數各有優劣。

HBM:三項條件達成兩項半,幾乎全數通過

客製化程度:半分通過

從架構上來看,HBM 上層疊起的十幾層 DRAM 晶粒完全遵循 JEDEC 標準,真正客製化的部分僅集中在下層的封裝與基底晶片(base die),但隨著 HBM4 之後的客製化程度有所提升,將加大客戶簽訂長期合約的意願。

再來從三星案例來看,當三星 HBM3E 未能通過輝達驗證,市佔率從約 60% 一路跌到 17% 時,這批產能並沒有變成死庫存,而是直接轉供 Google TPU 與 AMD,代表產能本質上仍可自由轉移。

既能鎖定長期合約但產能又能自由轉移,因此這一項只能算半分。

指數型且持續需求成長:滿分通過

作為 HBM 能夠大幅擺脫週期性的核心理由,其底層邏輯可以濃縮成一個公式:代幣輸出量 (token throughput) = HBM 容量 × HBM 頻寬,而且每一代都呈倍數成長。

打破週期性迷思!一公式拆解 HBM 需求結構:記憶體為何只會繼續上漲?

首先在需求端,每張 GPU 的 HBM 容量年成長率超過 40%,而 DRAM 供給端僅靠 14% 的晶圓量成長與 9% 的密度提升支撐,供給顯然難以追上需求。

接著,在注意力機制(attention)運算階段,KV Cache 對頻寬與容量的需求極高,讓 HBM 取得近乎獨佔的地位。即使 HBM 價格上漲三到五倍,把錢花在 HBM 上而非SRAM、HBF、CXL、PIM 等替代路徑,所換取到的邊際代幣輸出量,仍遠比花在其他硬體上更划算。

基於其他替代方案目前都無法在 KV Cache 與注意力運算這個核心戰場上與 HBM 正面競爭,fin 預期 HBM 的領先地位至少能維持五年以上。

技術快速迭代:滿分通過

傳統 DDR 從 DDR3 走到 DDR5 花了超過十五年,但 HBM 基本上是兩年一代,迭代速度遠超傳統記憶體,近期甚至出現加速趨勢。隨著 HBM 每兩年升級一次,NVIDIA GPU 的速度也呈現近乎指數型成長的軌跡,從每秒 2TB 到 22TB 一路向上,與推理代幣輸出量呈現完美的線性關係。

頻寬演進對數座標(HBM vs DDR vs LPDDR):HBM 的迭代速度遠超傳統 DDR/LPDDR,DDR6/LPDDR6 的迭代節奏也正在加快

隨著 HBM3 等舊產品折舊極快、囤貨價值快速消失,HBM 廠商的競爭邏輯也出現改變:從過去比拼當前產能與市佔率的「數量競爭」,轉向比拼技術穩定性與下一代在輝達平台上驗證份額的「品質競爭」。

加分題:供給端擴產難度持續攀升

除了三大條件,HBM 還有一項隱藏優勢:DRAM 密度微縮速度正在快速放緩。約在 2000 年前後,每片晶圓的 DRAM 位元密度年成長可達 45%,十年前降到 20%,如今只剩 9%。這意味著過去靠技術提升就能讓位元量年增 20% 到 30%,現在更需要實際新建晶圓廠與無塵室才能擴產。

HBM 本身又再加重這個難題:HBM3E 需要約三倍的 DRAM 晶圓量才能產出等量位元,HBM4 因堆疊密度提高,進一步上升到四倍。換算下來,每單位 DRAM 晶圓所能產出的 HBM 位元數正在持續下滑,等同於對供給端形成自然的緊縮效果。

從傳統「盛衰週期」走向「成長週期」:賺多賺少的差別

把 HBM 的三項打分加總,得出兩項半的成績,意味著它正從「傳統週期性」轉化為「成長型週期性」。兩者的差別在於:

  • 傳統週期性:上行週期賺很多,下行週期賠很多。
  • 成長型週期性:上行週期賺很多,下行週期仍能小賺。

只要代幣需求持續呈指數成長,需求就會比傳統週期更可預測,且一旦價格下跌,客戶會立刻傾向增加 HBM 容量以提升代幣輸出量,反而刺激需求回補。再加上 HBM 輕度客製化帶來的長期合約綁定,fin 預期這一輪週期會特別長。

HBM 會不會崩盤?關鍵看 Transformer 與 KV Cache 命運

即使 HBM 目前體質優異,市場仍有一個疑慮:這條依賴 HBM 指數型成長的 GPU 架構演進路徑,有沒有可能因為模型架構革命而中斷?

問題的本質可以回去看先前提及的核心公式,其中 HBM 容量成長的根源正是 KV Cache 的成長。換句話說,如果 KV Cache 在架構上不復存在,HBM 容量指數成長的邏輯就會被連根拔起。因此真正該問的問題其實是:以 Transformer 為代表的注意力機制,以及由此衍生的 KV Cache 機制,會不會被未來的架構淘汰?

從歷史規律觀察,每一次 AI 模型架構革命中,真正被保留下來的,往往是具備某種數學普適性的原始運算(primitive operations)。最具代表性的例子是 FFN(前饋網路),這是 2012 年深度學習時代的產物,卻一路存活到今天的大型語言模型中,至今仍佔據模型參數相當大的比例。

注意力機制很可能也屬於這類會被保留的原始運算,因為它解決的是同樣根本的問題:讓序列中任意兩個位置能按需建立動態連結。一旦這種能力被驗證有效,就很難被完全拋棄。即使未來架構從純 Transformer 演進到混合架構,甚至演進到世界模型(world models),注意力層高機率仍會存在,KV Cache 仍會被需要,而 HBM 仍將是推理運算的核心之一。

DRAM 體檢:僅達成一項,但迎新變數「代理型 AI CPU」

在 DRAM 方面,首先它沒有客製化可言,三項條件中第一項可以直接忽略。但在強力且持續性的成長這一項,隨著代理型 AI CPU 在 2025 年底開始釋放潛力,依附在 CPU 上的 DRAM 需求,正成為 DRAM 指數成長的全新動能。這個成長邏輯可以拆成兩層來看。

DRAM 的需求成長來源與迭代動力(依終端應用拆分):從消費電子轉向代理型 AI CPU 與資料中心

第一層:伺服器 CPU 總可觸及市場(TAM)的爆發性上修

推升 CPU TAM 快速成長的邏輯主要有四點:

  • AI 加速叢集中,CPU 對 GPU 的配置比例正從傳統的 1:4 轉向 1:2,未來可能朝 1:1 邁進。
  • 在 AI 代理工作流程中,CPU 所處理的延遲佔比高達 50% 到 90%,已成為需要同步擴展的瓶頸之一。
  • AI 寫程式大幅提升軟體工程師效率,程式碼量呈數量級成長,軟體 API 呼叫量隨之指數成長,直接推升相關 CPU 工作需求。
  • 沙盒機制被用來確保資料安全與隔離,然而分析型代理(Analytical Agent)必須為此替每個任務複製大量資料庫與用戶情境,造成記憶體與 CPU 核心的嚴重浪費。這個問題預期在五年甚至更長時間內都不會被解決,且難以透過技術優化壓縮。

這四個因素帶動 CPU TAM 預測在短時間內被連續大幅上修:兩個季度前,AMD 財報預估 2030 年 CPU TAM 為 600 億美元;兩個月前,AMD 與 ARM 將預測翻倍上修至 1,200 億美元;一個月前,輝達再度翻倍上修到 2,000 億;上週,Bernstein 進一步將 2030 年 CPU TAM 指引上調到 2,230 億美元。市場普遍認為,這個數字未來被上修到 4,000 億美元基本上沒有太大疑問。

第二層:每個 CPU 核心的 DRAM 使用量快速成長

驅動這一層成長的核心原因在於,AI 代理本質上是有狀態且長時間運行的程式,而不是傳統無狀態的請求與回應模式。傳統網頁與 SaaS 服務在請求處理完畢後,記憶體會立刻被回收;但一個代理任務可能運行一分鐘到一小時,期間訊息歷史、系統提示詞、工作記憶、長期記憶與工具調用結果緩衝區都會持續駐留在 DRAM 中,且因為有狀態性與沙箱隔離需求,這部分記憶體佔用在技術上很難壓縮。

與此同時,情境視窗(context window)長度正呈指數型成長,從 32K 一路推進到 256K、甚至 1M,未來還會持續拉長,每個活躍會話駐留的訊息量也隨之線性膨脹。

fin 將兩層相乘:

  1. 第一層:CPU 伺服器 TAM 看向 2030 至 2031 年,大致呈現 6 倍左右成長。
  2. 第二層:每個 CPU 的 DRAM 配比大致成長 3 到 4 倍(從 4 到 8GB 提升到 16 到 32GB 每核心),即便多數成長可能屬於一次性紅利。

兩個獨立變數相乘之後,伺服器端 DRAM 需求的成長將是指數級的。即使保守估計 2030 年 CPU TAM 為 3000 億美元,每核心 50 美元、16GB 配置,增量至少達到 96EB,相較今年全球 DRAM 總產出僅 47EB、明年也僅約 60EB,仍具有一定的缺口規模。

三項條件重新打分:DRAM 拿到約一項

回到三條件框架,第三項技術迭代速度也出現變化。過去 DRAM 的技術迭代高度依賴消費電子市場,DDR 規格的進步對效能助益有限,因此新一代產品推出時市場反應冷淡,大家寧可等價格下跌再採用。但在可預見的未來,基於矽基消費型(CPU 伺服器)DRAM 用量將遠超碳基消費型(傳統消費電子)DRAM,加上端側 AI 對 DDR 速度的需求同步上升,速度升級的邊際效用大幅提高,DDR6 與 LPDDR6 的迭代節奏明顯加快,市場對新一代產品的採用態度也從觀望轉為搶先導入。

此外,DDR 的供給還要被 HBM 額外抽稅。由於 HBM3E 需要約三倍、HBM4 需要約四倍的 DDR 晶圓量才能產出等量位元,每年約有 3% 到 5% 的 DDR 位元成長被這個「HBM 位元稅」直接吃掉。整體計算下來,未來 DRAM 位元量大致能以每年 24% 成長(14% 來自晶圓量成長、9% 來自密度提升),但扣除 HBM 位元稅後,傳統商品型 DDR 實際年位元成長僅剩約 20%。

CXMT 擴產真的有那麼可怕嗎?

市場高度關注的另一個變數,是記憶體大廠長鑫存儲(CXMT)近年來的快速擴產,擔心其「恣意擴產」會將整個 DRAM 市場拖回傳統週期性的泥沼。

從產能數字來看,CXMT 確實擴張迅速:2025 年月產能約 20 萬片,2026 年北京廠加上新產線最高可貢獻到 32 萬至 35 萬片。在建中的上海廠分兩期推進,合計 2027 年將達到 42 萬片月產能、2028 年達到 50 萬片。

但關鍵在於,CXMT 的 DRAM 位元密度僅約三大廠的一半,因此其 50 萬片月產能,實際產出的 DRAM 位元量只相當於其他廠商的一半,計算時須「減半」處理。套用這個折扣之後,CXMT 對整體 DRAM 產業的衝擊明顯被稀釋:

從 2025 年底到 2028 年底,CXMT 對全產業 DRAM 位元產能年複合成長率(CAGR)的影響大約只有 1.5 個百分點,把整個產業的 CAGR 從約 12.7% 拉高到 14.2%。即使 CXMT 未來能維持目前的擴產節奏,到 2030 年其對全產業等效產能 CAGR 的影響也預期不到 3 個百分點,大致是把成長率從 20% 推升到 23%,並非外界想像的顛覆性衝擊。

從長鑫存儲 CXMT IPO 文件看記憶體鬼故事:中國削價競爭會打擊市場嗎?

另一個限制因素是,CXMT 受限於光刻機設備的缺乏,同時 DDR6 等先進規格的生產難度也較高。

這輪記憶體牛市為什麼至少能撐五年?

即使是成長型週期,也需要解釋為什麼這一輪 DRAM 多頭格局預期能延續至少五年,且目前看不到結束的跡象。fin 認為主要支撐來自以下幾個層面。

一、結構性需求缺口持續擴大

傳統 DRAM 供給每年大致成長 20%,但需求端的成長速度遠高於此。以 2026 年 CPU TAM 600 億美元、每核心平均消耗 8GB DRAM、每核心 30 至 35 美元估算,需求約為 16EB;到 2030 年 CPU TAM 達 4,000 億美元、每核心平均消耗 16GB、每核心價格翻倍以上達 80 美元時,需求將達到 80EB,這部分 DRAM 需求的 CAGR 約為 50%,遠超目前市場的普遍估計。

需要注意的是,DRAM 短缺與 HBM 短缺的性質不同。HBM 直接綁定代幣輸出量,因此直接影響 GPU 的賺錢效率,需求剛性極強;而 DRAM 短缺主要影響代理工作流程的速度,例如 8GB 核心配置可能比 16GB 慢上 30%,部分低價值任務可以容忍延遲,因此需求剛性不如 GPU,但缺口擴大的方向同樣明確。

研究機構 SemiAnalysis 的估算顯示,今年 DRAM 缺口仍是個位數百分比,但明年將超過 10%,且這個缺口在 2030 年之前都沒有縮小的機會。

二、大量「需求儲存」存在、價格難以崩跌

所謂需求儲存,指的是那些因記憶體價格過高而被暫時壓抑、一旦價格回落就會立刻釋放的潛在需求。常見的需求來源包括:

  • 算力或速度的需求:例如輝達原本設計用低成本 GDDR7 打造的 CPX 預填充加速方案,因記憶體價格全面飆漲而失去經濟性,一旦價格回落,這類優化方案便有望重新啟動。
  • 被遞延的低價值任務需求:當記憶體漲價推升代幣價格時,高價值任務優先處理、低價值任務被迫延後,一旦價格下跌,這些需求便會回流。
  • 端側 AI 需求,AI PC 的記憶體配置可能從 24GB 一路攀升至 128GB,蘋果已明確要求最新全規格端側 AI 裝置將記憶體從 8GB 升級到 12GB。

這些需求疊加起來形成極厚的緩衝層,使得即使供給階段性追上,價格也很難出現崩跌式下跌。

三、HBM 與 DRAM 產能可互相轉換,讓整個複合體價格連動

在上行週期中,DRAM 毛利率往往超越 HBM,甚至出現 HBM 漲價反被 DRAM 帶動的現象。今年新簽訂的 HBM4 合約價格,就是直接以當前 DRAM 價格乘以四倍的堆疊倍數計算。

一旦 DRAM 價格下跌、毛利率收斂,由於 HBM 長期合約的透明度能保鎖定利潤,HBM 反而會間接搶佔更多 DRAM 產能,同時也會刺激 GPU 廠商更有動機盡量提升 HBM 容量,間接為 DRAM 價格設下底線。

NAND SSD:便宜才是王道,但生產紀律成隱憂

相較於 HBM 與 DRAM,NAND SSD 的成長動能相對較弱。今年的 SSD 短缺主要原因是主要廠商保持了良好的生產紀律,沒有大舉擴產。年度產能增量主要依靠技術改良,也就是增加 NAND 堆疊層數,而非大規模新建產能。

不過 NAND SSD 仍有三個值得關注的結構性成長來源:

  • KV Cache 卸載(offloading):把從 HBM 溢出的溫冷 KV Cache 卸載到 NAND SSD 上。值得注意的是,這類應用目前甚至還沒有大規模發生,SSD 供給就已經比 DRAM 更緊張,價格漲幅甚至超過 DRAM,一旦明年 Rubin CMX 等新硬體開始放量,結合 KV Cache 卸載的規模化應用,SSD 短缺預期會進一步加劇。
  • AI 影片生成:以 Seedance 為代表的 AI 影片應用,用量正以每年 10 倍到 40 倍的速度成長,目前仍受限於 GPU 短缺導致的算力不足,需求尚未完全釋放,但一旦 GPU 短缺階段過去,AI 影片對 NAND 儲存的需求也將持續相當長一段時間。
  • HBF 路徑(2030 年後可能成形):這條技術路徑在不少投行分析中被寄予厚望,但目前仍有距離。其主要作用僅限於儲存大型模型權重(寫入一次之後僅讀取),且必須與 GPU/HBM 緊密封裝(達到 48TBps 或 96TBps 等級頻寬),否則依賴 PCIe 7 或 8 的傳輸速度將遠遠不夠用。

NAND SSD 最大的優勢在於價格,fin 預期到 2027 年,其價格將僅為每 GB 0.8 美元,約為同期 DRAM 的四十分之一。這種價格優勢讓 NAND SSD 在多層快取架構中具備「萬能替補」的特質,結構性成長來源也相對廣泛:一旦 DRAM 或 HBM 漲價,市場自然會想辦法用更便宜的 SSD 分擔部分功能,以更低成本達到類似效果,因此理論上很難出現「DRAM/HBM 漲、SSD 卻不漲」的情境。

但 NAND SSD 能否真正擺脫傳統週期性,最終仍取決於廠商的生產紀律。市場上唯一可能打破這個默契的廠商是中國的長江存儲(YMTC),只要有一家廠商選擇大規模擴產,整個 NAND 產業就會重新陷入價格戰,遠比 DRAM 容易得多。

三個記憶體產品,誰成功擺脫週期性了?

把三項打分標準套用在上面討論的三種記憶體產品上,可以得出清晰的成績排序:

  • HBM:兩項半,結構性需求與技術迭代雙雙滿分,客製化勉強半分,是目前最有機會把傳統週期性轉化為「成長型週期性」的記憶體品類,且其需求根基(Transformer 與 KV Cache)在可預見的未來大機率不會被架構革命淘汰。
  • DRAM:約一項,客製化幾乎可忽略,但因 agentic CPU 興起,結構性需求成長從無到有,技術迭代速度也因 CPU 伺服器與端側 AI 需求而明顯加快,是這次分析中體質改變最顯著的品類。
  • NAND SSD:結構性成長動能最多,包括 KV Cache 卸載、AI 影片生成與 HBF 路徑等,但產能紀律是變數。價格優勢使其具備跨層替代的彈性。

整體而言,這一輪記憶體漲勢的根基,並非單純的供需錯配或炒作,而是建立在 AI 推理時代代幣輸出量需求結構性改變之上。只要 HBM 容量與頻寬持續被 GPU 架構演進綁定、代理型 AI CPU 對 DRAM 的需求缺口持續擴大、NAND SSD 廠商維持紀律不重演價格戰,這輪超級週期確實有條件走得比市場想像得更久,從「瘋漲暴跌」轉變為「漲多跌少」。

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。