記憶體牛市為何還能再漲五年？三指標看懂 HBM、DRAM、NAND 差在哪？

Crumax

2026/6/26

隨著半導體產業敘事轉向 AI 推理，記憶體與儲存正成為供應鏈中最大的瓶頸。市場也擔憂 HBM、DRAM、NAND SSD 這一輪漲勢，是又一次固定的牛熊週期，還是真的出現了突破性改變？

半導體架構分析人士 fin 對此建立一套三條件框架，分別替 HBM、DRAM、NAND SSD 打分數，從客製化程度、結構性需求成長、技術迭代速度三個維度逐一檢視，並進一步拆解市場關注的兩大變數：中國長鑫存儲 CXMT 擴產的實際威脅，以及 GPU 架構是否會因為 Transformer 與 KV Cache 被淘汰而動搖 HBM 需求根基。

重點摘要：

廣告 - 內文未完請往下捲動

HBM：達成兩項半，結構性需求與技術迭代速度雙雙滿分，客製化勉強半分，是目前最有機會把傳統週期性轉化為「成長型週期性」的記憶體品類，且其需求根基（Transformer 與 KV Cache）在可預見的未來大機率不會被架構革命淘汰。
DRAM：達成一項，但因代理型 AI CPU 興起，結構性需求成長從無到有，技術迭代速度也因 CPU 伺服器與端側 AI 需求而明顯加快，是這次分析中體質改變最顯著的品類。
NAND SSD：結構性成長動能最多，包括 KV Cache 卸載、AI 影片生成與 HBF 路徑等，但產能紀律是變數。價格優勢使其具備跨層替代的彈性。

Table of Contents

記憶體為什麼特別容易陷入週期性陷阱？

半導體產業存在週期性，但記憶體的週期與波動性又特別劇烈，外界普遍解釋是因為記憶體具有「商品」特性：「產品無差異化、容易打價格戰、又能囤貨。」

然而，fin 認為這個解釋只說對一半。商品屬性本身並不會「製造」週期性，只是一個振幅放大器。真正原因在於記憶體的供給擴產週期太長，長到足以與需求週期脫節。建一座晶圓廠需要三年時間、數百億美元投資，而且決策一旦下達就不可逆。與此同時，需求端卻充滿不確定性，每當出現雲端服務、智慧型手機、疫情線上需求促成新一波成長動能，各廠就會大加碼產能，但通常兩年後成長放緩、供給追上甚至超過需求、價格崩跌，整個產業隨即陷入虧損循環。

理解了週期性的真正根源，下一個問題是：「HBM、DRAM、NAND SSD 這次有沒有不一樣？」

評分規則：記憶體是否擺脫週期性的三項指標

要判斷一項記憶體產品能否部分或大幅擺脫傳統週期性，fin 提出以下三項條件：

客製化程度：產品是否無法互換、產能無法自由轉移，因此必須簽訂長期合約綁定供需雙方。
強勁且持續的需求成長：需求曲線本身是否極度陡峭，讓供給端持續追不上，而非一次性的爆發後又回落。
技術快速迭代：新一代產品是否會迅速淘汰舊一代，讓囤貨與價格戰等傳統打法失去意義。

只要滿足其中一項，就能部分擺脫傳統週期性；滿足兩到三項，就能擺脫大部分週期性，轉化為「漲多跌少」而非「漲多跌深」的傳統週期。

根據這套標準，HBM、DRAM、NAND SSD 的分數各有優劣。

HBM：三項條件達成兩項半，幾乎全數通過

客製化程度：半分通過

從架構上來看，HBM 上層疊起的十幾層 DRAM 晶粒完全遵循 JEDEC 標準，真正客製化的部分僅集中在下層的封裝與基底晶片（base die），但隨著 HBM4 之後的客製化程度有所提升，將加大客戶簽訂長期合約的意願。

再來從三星案例來看，當三星 HBM3E 未能通過輝達驗證，市佔率從約 60% 一路跌到 17% 時，這批產能並沒有變成死庫存，而是直接轉供 Google TPU 與 AMD，代表產能本質上仍可自由轉移。

既能鎖定長期合約但產能又能自由轉移，因此這一項只能算半分。

指數型且持續需求成長：滿分通過

作為 HBM 能夠大幅擺脫週期性的核心理由，其底層邏輯可以濃縮成一個公式：代幣輸出量（token throughput） = HBM 容量 × HBM 頻寬，而且每一代都呈倍數成長。

（打破週期性迷思！一公式拆解 HBM 需求結構：記憶體為何只會繼續上漲？）

首先在需求端，每張 GPU 的 HBM 容量年成長率超過 40%，而 DRAM 供給端僅靠 14% 的晶圓量成長與 9% 的密度提升支撐，供給顯然難以追上需求。

接著，在注意力機制（attention）運算階段，KV Cache 對頻寬與容量的需求極高，讓 HBM 取得近乎獨佔的地位。即使 HBM 價格上漲三到五倍，把錢花在 HBM 上而非SRAM、HBF、CXL、PIM 等替代路徑，所換取到的邊際代幣輸出量，仍遠比花在其他硬體上更划算。

基於其他替代方案目前都無法在 KV Cache 與注意力運算這個核心戰場上與 HBM 正面競爭，fin 預期 HBM 的領先地位至少能維持五年以上。

技術快速迭代：滿分通過

傳統 DDR 從 DDR3 走到 DDR5 花了超過十五年，但 HBM 基本上是兩年一代，迭代速度遠超傳統記憶體，近期甚至出現加速趨勢。隨著 HBM 每兩年升級一次，NVIDIA GPU 的速度也呈現近乎指數型成長的軌跡，從每秒 2TB 到 22TB 一路向上，與推理代幣輸出量呈現完美的線性關係。

頻寬演進對數座標（HBM vs DDR vs LPDDR）：HBM 的迭代速度遠超傳統 DDR/LPDDR，DDR6/LPDDR6 的迭代節奏也正在加快

隨著 HBM3 等舊產品折舊極快、囤貨價值快速消失，HBM 廠商的競爭邏輯也出現改變：從過去比拼當前產能與市佔率的「數量競爭」，轉向比拼技術穩定性與下一代在輝達平台上驗證份額的「品質競爭」。

加分題：供給端擴產難度持續攀升

除了三大條件，HBM 還有一項隱藏優勢：DRAM 密度微縮速度正在快速放緩。約在 2000 年前後，每片晶圓的 DRAM 位元密度年成長可達 45%，十年前降到 20%，如今只剩 9%。這意味著過去靠技術提升就能讓位元量年增 20% 到 30%，現在更需要實際新建晶圓廠與無塵室才能擴產。

HBM 本身又再加重這個難題：HBM3E 需要約三倍的 DRAM 晶圓量才能產出等量位元，HBM4 因堆疊密度提高，進一步上升到四倍。換算下來，每單位 DRAM 晶圓所能產出的 HBM 位元數正在持續下滑，等同於對供給端形成自然的緊縮效果。

從傳統「盛衰週期」走向「成長週期」：賺多賺少的差別

把 HBM 的三項打分加總，得出兩項半的成績，意味著它正從「傳統週期性」轉化為「成長型週期性」。兩者的差別在於：

傳統週期性：上行週期賺很多，下行週期賠很多。
成長型週期性：上行週期賺很多，下行週期仍能小賺。

只要代幣需求持續呈指數成長，需求就會比傳統週期更可預測，且一旦價格下跌，客戶會立刻傾向增加 HBM 容量以提升代幣輸出量，反而刺激需求回補。再加上 HBM 輕度客製化帶來的長期合約綁定，fin 預期這一輪週期會特別長。

HBM 會不會崩盤？關鍵看 Transformer 與 KV Cache 命運

即使 HBM 目前體質優異，市場仍有一個疑慮：這條依賴 HBM 指數型成長的 GPU 架構演進路徑，有沒有可能因為模型架構革命而中斷?

問題的本質可以回去看先前提及的核心公式，其中 HBM 容量成長的根源正是 KV Cache 的成長。換句話說，如果 KV Cache 在架構上不復存在，HBM 容量指數成長的邏輯就會被連根拔起。因此真正該問的問題其實是：以 Transformer 為代表的注意力機制，以及由此衍生的 KV Cache 機制，會不會被未來的架構淘汰？

從歷史規律觀察，每一次 AI 模型架構革命中，真正被保留下來的，往往是具備某種數學普適性的原始運算（primitive operations）。最具代表性的例子是 FFN（前饋網路），這是 2012 年深度學習時代的產物，卻一路存活到今天的大型語言模型中，至今仍佔據模型參數相當大的比例。

注意力機制很可能也屬於這類會被保留的原始運算，因為它解決的是同樣根本的問題：讓序列中任意兩個位置能按需建立動態連結。一旦這種能力被驗證有效，就很難被完全拋棄。即使未來架構從純 Transformer 演進到混合架構，甚至演進到世界模型（world models），注意力層高機率仍會存在，KV Cache 仍會被需要，而 HBM 仍將是推理運算的核心之一。

DRAM 體檢：僅達成一項，但迎新變數「代理型 AI CPU」

在 DRAM 方面，首先它沒有客製化可言，三項條件中第一項可以直接忽略。但在強力且持續性的成長這一項，隨著代理型 AI CPU 在 2025 年底開始釋放潛力，依附在 CPU 上的 DRAM 需求，正成為 DRAM 指數成長的全新動能。這個成長邏輯可以拆成兩層來看。

DRAM 的需求成長來源與迭代動力（依終端應用拆分）：從消費電子轉向代理型 AI CPU 與資料中心

第一層：伺服器 CPU 總可觸及市場（TAM）的爆發性上修

推升 CPU TAM 快速成長的邏輯主要有四點：

AI 加速叢集中，CPU 對 GPU 的配置比例正從傳統的 1：4 轉向 1：2，未來可能朝 1：1 邁進。
在 AI 代理工作流程中，CPU 所處理的延遲佔比高達 50% 到 90%，已成為需要同步擴展的瓶頸之一。
AI 寫程式大幅提升軟體工程師效率，程式碼量呈數量級成長，軟體 API 呼叫量隨之指數成長，直接推升相關 CPU 工作需求。
沙盒機制被用來確保資料安全與隔離，然而分析型代理（Analytical Agent）必須為此替每個任務複製大量資料庫與用戶情境，造成記憶體與 CPU 核心的嚴重浪費。這個問題預期在五年甚至更長時間內都不會被解決，且難以透過技術優化壓縮。

這四個因素帶動 CPU TAM 預測在短時間內被連續大幅上修：兩個季度前，AMD 財報預估 2030 年 CPU TAM 為 600 億美元；兩個月前，AMD 與 ARM 將預測翻倍上修至 1,200 億美元；一個月前，輝達再度翻倍上修到 2,000 億；上週，Bernstein 進一步將 2030 年 CPU TAM 指引上調到 2,230 億美元。市場普遍認為，這個數字未來被上修到 4,000 億美元基本上沒有太大疑問。

第二層：每個 CPU 核心的 DRAM 使用量快速成長

驅動這一層成長的核心原因在於，AI 代理本質上是有狀態且長時間運行的程式，而不是傳統無狀態的請求與回應模式。傳統網頁與 SaaS 服務在請求處理完畢後，記憶體會立刻被回收；但一個代理任務可能運行一分鐘到一小時，期間訊息歷史、系統提示詞、工作記憶、長期記憶與工具調用結果緩衝區都會持續駐留在 DRAM 中，且因為有狀態性與沙箱隔離需求，這部分記憶體佔用在技術上很難壓縮。

與此同時，情境視窗（context window）長度正呈指數型成長，從 32K 一路推進到 256K、甚至 1M，未來還會持續拉長，每個活躍會話駐留的訊息量也隨之線性膨脹。

fin 將兩層相乘：

第一層：CPU 伺服器 TAM 看向 2030 至 2031 年，大致呈現 6 倍左右成長。
第二層：每個 CPU 的 DRAM 配比大致成長 3 到 4 倍（從 4 到 8GB 提升到 16 到 32GB 每核心），即便多數成長可能屬於一次性紅利。

兩個獨立變數相乘之後，伺服器端 DRAM 需求的成長將是指數級的。即使保守估計 2030 年 CPU TAM 為 3000 億美元，每核心 50 美元、16GB 配置，增量至少達到 96EB，相較今年全球 DRAM 總產出僅 47EB、明年也僅約 60EB，仍具有一定的缺口規模。

三項條件重新打分：DRAM 拿到約一項

回到三條件框架，第三項技術迭代速度也出現變化。過去 DRAM 的技術迭代高度依賴消費電子市場，DDR 規格的進步對效能助益有限，因此新一代產品推出時市場反應冷淡，大家寧可等價格下跌再採用。但在可預見的未來，基於矽基消費型（CPU 伺服器）DRAM 用量將遠超碳基消費型（傳統消費電子）DRAM，加上端側 AI 對 DDR 速度的需求同步上升，速度升級的邊際效用大幅提高，DDR6 與 LPDDR6 的迭代節奏明顯加快，市場對新一代產品的採用態度也從觀望轉為搶先導入。

此外，DDR 的供給還要被 HBM 額外抽稅。由於 HBM3E 需要約三倍、HBM4 需要約四倍的 DDR 晶圓量才能產出等量位元，每年約有 3% 到 5% 的 DDR 位元成長被這個「HBM 位元稅」直接吃掉。整體計算下來，未來 DRAM 位元量大致能以每年 24% 成長（14% 來自晶圓量成長、9% 來自密度提升），但扣除 HBM 位元稅後，傳統商品型 DDR 實際年位元成長僅剩約 20%。

CXMT 擴產真的有那麼可怕嗎?

市場高度關注的另一個變數，是記憶體大廠長鑫存儲（CXMT）近年來的快速擴產，擔心其「恣意擴產」會將整個 DRAM 市場拖回傳統週期性的泥沼。

從產能數字來看，CXMT 確實擴張迅速：2025 年月產能約 20 萬片，2026 年北京廠加上新產線最高可貢獻到 32 萬至 35 萬片。在建中的上海廠分兩期推進，合計 2027 年將達到 42 萬片月產能、2028 年達到 50 萬片。

但關鍵在於，CXMT 的 DRAM 位元密度僅約三大廠的一半，因此其 50 萬片月產能，實際產出的 DRAM 位元量只相當於其他廠商的一半，計算時須「減半」處理。套用這個折扣之後，CXMT 對整體 DRAM 產業的衝擊明顯被稀釋：

從 2025 年底到 2028 年底，CXMT 對全產業 DRAM 位元產能年複合成長率（CAGR）的影響大約只有 1.5 個百分點，把整個產業的 CAGR 從約 12.7% 拉高到 14.2%。即使 CXMT 未來能維持目前的擴產節奏，到 2030 年其對全產業等效產能 CAGR 的影響也預期不到 3 個百分點，大致是把成長率從 20% 推升到 23%，並非外界想像的顛覆性衝擊。

（從長鑫存儲 CXMT IPO 文件看記憶體鬼故事：中國削價競爭會打擊市場嗎？）

另一個限制因素是，CXMT 受限於光刻機設備的缺乏，同時 DDR6 等先進規格的生產難度也較高。

這輪記憶體牛市為什麼至少能撐五年？

即使是成長型週期，也需要解釋為什麼這一輪 DRAM 多頭格局預期能延續至少五年，且目前看不到結束的跡象。fin 認為主要支撐來自以下幾個層面。

一、結構性需求缺口持續擴大

傳統 DRAM 供給每年大致成長 20%，但需求端的成長速度遠高於此。以 2026 年 CPU TAM 600 億美元、每核心平均消耗 8GB DRAM、每核心 30 至 35 美元估算，需求約為 16EB；到 2030 年 CPU TAM 達 4,000 億美元、每核心平均消耗 16GB、每核心價格翻倍以上達 80 美元時，需求將達到 80EB，這部分 DRAM 需求的 CAGR 約為 50%，遠超目前市場的普遍估計。

需要注意的是，DRAM 短缺與 HBM 短缺的性質不同。HBM 直接綁定代幣輸出量，因此直接影響 GPU 的賺錢效率，需求剛性極強；而 DRAM 短缺主要影響代理工作流程的速度，例如 8GB 核心配置可能比 16GB 慢上 30%，部分低價值任務可以容忍延遲，因此需求剛性不如 GPU，但缺口擴大的方向同樣明確。

研究機構 SemiAnalysis 的估算顯示，今年 DRAM 缺口仍是個位數百分比，但明年將超過 10%，且這個缺口在 2030 年之前都沒有縮小的機會。

二、大量「需求儲存」存在、價格難以崩跌

所謂需求儲存，指的是那些因記憶體價格過高而被暫時壓抑、一旦價格回落就會立刻釋放的潛在需求。常見的需求來源包括：

算力或速度的需求：例如輝達原本設計用低成本 GDDR7 打造的 CPX 預填充加速方案，因記憶體價格全面飆漲而失去經濟性，一旦價格回落，這類優化方案便有望重新啟動。
被遞延的低價值任務需求：當記憶體漲價推升代幣價格時，高價值任務優先處理、低價值任務被迫延後，一旦價格下跌，這些需求便會回流。
端側 AI 需求，AI PC 的記憶體配置可能從 24GB 一路攀升至 128GB，蘋果已明確要求最新全規格端側 AI 裝置將記憶體從 8GB 升級到 12GB。

這些需求疊加起來形成極厚的緩衝層，使得即使供給階段性追上，價格也很難出現崩跌式下跌。

三、HBM 與 DRAM 產能可互相轉換，讓整個複合體價格連動

在上行週期中，DRAM 毛利率往往超越 HBM，甚至出現 HBM 漲價反被 DRAM 帶動的現象。今年新簽訂的 HBM4 合約價格，就是直接以當前 DRAM 價格乘以四倍的堆疊倍數計算。

一旦 DRAM 價格下跌、毛利率收斂，由於 HBM 長期合約的透明度能保鎖定利潤，HBM 反而會間接搶佔更多 DRAM 產能，同時也會刺激 GPU 廠商更有動機盡量提升 HBM 容量，間接為 DRAM 價格設下底線。

NAND SSD：便宜才是王道，但生產紀律成隱憂

相較於 HBM 與 DRAM，NAND SSD 的成長動能相對較弱。今年的 SSD 短缺主要原因是主要廠商保持了良好的生產紀律，沒有大舉擴產。年度產能增量主要依靠技術改良，也就是增加 NAND 堆疊層數，而非大規模新建產能。

不過 NAND SSD 仍有三個值得關注的結構性成長來源：

KV Cache 卸載（offloading）：把從 HBM 溢出的溫冷 KV Cache 卸載到 NAND SSD 上。值得注意的是，這類應用目前甚至還沒有大規模發生，SSD 供給就已經比 DRAM 更緊張，價格漲幅甚至超過 DRAM，一旦明年 Rubin CMX 等新硬體開始放量，結合 KV Cache 卸載的規模化應用，SSD 短缺預期會進一步加劇。
AI 影片生成：以 Seedance 為代表的 AI 影片應用，用量正以每年 10 倍到 40 倍的速度成長，目前仍受限於 GPU 短缺導致的算力不足，需求尚未完全釋放，但一旦 GPU 短缺階段過去，AI 影片對 NAND 儲存的需求也將持續相當長一段時間。
HBF 路徑（2030 年後可能成形）：這條技術路徑在不少投行分析中被寄予厚望，但目前仍有距離。其主要作用僅限於儲存大型模型權重（寫入一次之後僅讀取），且必須與 GPU/HBM 緊密封裝（達到 48TBps 或 96TBps 等級頻寬），否則依賴 PCIe 7 或 8 的傳輸速度將遠遠不夠用。

NAND SSD 最大的優勢在於價格，fin 預期到 2027 年，其價格將僅為每 GB 0.8 美元，約為同期 DRAM 的四十分之一。這種價格優勢讓 NAND SSD 在多層快取架構中具備「萬能替補」的特質，結構性成長來源也相對廣泛：一旦 DRAM 或 HBM 漲價，市場自然會想辦法用更便宜的 SSD 分擔部分功能，以更低成本達到類似效果，因此理論上很難出現「DRAM/HBM 漲、SSD 卻不漲」的情境。

但 NAND SSD 能否真正擺脫傳統週期性，最終仍取決於廠商的生產紀律。市場上唯一可能打破這個默契的廠商是中國的長江存儲（YMTC），只要有一家廠商選擇大規模擴產，整個 NAND 產業就會重新陷入價格戰，遠比 DRAM 容易得多。

三個記憶體產品，誰成功擺脫週期性了？

把三項打分標準套用在上面討論的三種記憶體產品上，可以得出清晰的成績排序：

HBM：兩項半，結構性需求與技術迭代雙雙滿分，客製化勉強半分，是目前最有機會把傳統週期性轉化為「成長型週期性」的記憶體品類，且其需求根基（Transformer 與 KV Cache）在可預見的未來大機率不會被架構革命淘汰。
DRAM：約一項，客製化幾乎可忽略，但因 agentic CPU 興起，結構性需求成長從無到有，技術迭代速度也因 CPU 伺服器與端側 AI 需求而明顯加快，是這次分析中體質改變最顯著的品類。
NAND SSD：結構性成長動能最多，包括 KV Cache 卸載、AI 影片生成與 HBF 路徑等，但產能紀律是變數。價格優勢使其具備跨層替代的彈性。

整體而言，這一輪記憶體漲勢的根基，並非單純的供需錯配或炒作，而是建立在 AI 推理時代代幣輸出量需求結構性改變之上。只要 HBM 容量與頻寬持續被 GPU 架構演進綁定、代理型 AI CPU 對 DRAM 的需求缺口持續擴大、NAND SSD 廠商維持紀律不重演價格戰，這輪超級週期確實有條件走得比市場想像得更久，從「瘋漲暴跌」轉變為「漲多跌少」。

風險提示

加密貨幣投資具有高度風險，其價格可能波動劇烈，您可能損失全部本金。請謹慎評估風險。