内存墙
Memory Wall01 需求层:为什么 AI 算力需要新的内存与存储 > 需求总览与第一性原理
GPU 算力增长速度远快于内存带宽增长速度,内存正在成为限制 AI 性能的核心瓶颈。
GPU 算力每两年翻几倍,但内存带宽每两年只能涨百分之几十。这就像高速公路越拓越宽(算力),但收费站还是那几个(带宽)——再多车也跑不快。
用纵向产业链树拆解 AI 数据中心的内存与存储,从 GPU 内的 SRAM、HBM,到 DRAM、NAND、SSD、HDD,再到制造设备、上游材料、CXL 新架构、代表公司和投资框架。
用纵向产业链树拆解 AI 数据中心的内存与存储,从 GPU 内的 SRAM、HBM,到 DRAM、NAND、SSD、HDD,再到制造设备、上游材料、CXL 新架构、代表公司和投资框架。
从内存墙、存储金字塔和带宽容量权衡理解 AI 为什么需要新的内存与存储。
从 KV 缓存、MoE、训练推理差异和长上下文理解具体需求如何传导到 HBM、DRAM 与 SSD。
把外部存储放回 AI 数据中心资本开支中理解,区分公司披露口径和行业估算口径。
SRAM、HBM、DDR、LPDDR、GDDR 等断电即失的数据工作区,决定计算侧带宽和容量。
NAND、SSD、HDD、持久内存和磁带构成断电不丢数据的容量层。
从 HBM3E、HBM4、TSV、CoWoS、客制化 HBM 和 HBF 理解高带宽内存如何升级。
关注良率、定价、三巨头份额、GPU 绑定和中长期风险。
把 HBM 的测试设备、上游材料和制造瓶颈单独拆出来看。
DDR5、DDR6、RDIMM、LRDIMM、LPDDR 服务器化和 DRAM 周期构成主内存基本盘。
CXL 协议、CXL DRAM、内存池化、控制器与 PHY 是服务器内存扩展的新路线。
理解 Samsung、SK Hynix、Micron、长鑫等玩家在服务器内存中的位置。
3D NAND、SLC/MLC/TLC/QLC/PLC、NAND 价格周期和中国 NAND 构成闪存底层。
NVMe、PCIe Gen5、E1.S/E3.S、QLC SSD 和 SSD 主控组成 AI 数据中心 SSD 产品栈。
KV 缓存卸载、GPU Direct Storage 和 BaM 把 SSD 推向 AI 推理链路。
Sandisk、KIOXIA、Solidigm 等公司帮助把 NAND 周期落到具体标的。
企业级近线 HDD、HAMR 和 SSD 替代边界决定冷数据容量层的生命力。
Seagate 与 Western Digital 是 HDD 容量层的核心上市公司。
磁带、对象存储和 AI 数据归档需求构成低成本长期保存层。
EUV、ArF 浸没式光刻和 ASML 的特殊地位,是先进 DRAM/HBM 节点升级的关键入口。
蚀刻、沉积、CMP、量测、测试和键合设备支撑 DRAM、NAND 与 HBM 制造。
硅片、光刻胶、电子特气、CMP 浆料和清洗液是存储制造的基础耗材。
设备出口管制和国产设备进展决定存储产业链的地区风险与替代空间。
先用地区 × 段位矩阵定位公司,再分别看美股、日韩亚洲和中国存储标的。
SK Hynix、Samsung、Micron 是 HBM、DRAM、NAND 三条主线的核心玩家。
从寡头格局、CXL/HBF 替代、NVIDIA 与 hyperscaler 绑定关系看利润池稳定性。
用稳健、均衡、进攻三类组合和中长期展望,把产业研究落到投资框架。
HBM、NAND、HDD 和存储 Capex 周期的风险需要单独拆开跟踪。
跟踪 HBM 价格、hyperscaler Capex、NVIDIA 指引和技术替代信号。
这是投资宝典的内存与存储专题百科。它把 AI 训练和推理背后的内存带宽、容量、持久存储和冷数据归档需求拆成结构化词条,帮助用户理解 HBM、DRAM、NAND、SSD、HDD、CXL、设备材料和公司图谱之间的上下游关系。
为什么 AI 算力需要新的内存与存储
从 SRAM 到 HDD 的完整体系
AI 时代最稀缺的资源
DDR5、LPDDR、CXL 和服务器内存
从 QLC 到 PCIe Gen5 企业盘
被低估的容量基础
存储产业链的真正瓶颈
段位、地区、组合与风险
01 需求层:为什么 AI 算力需要新的内存与存储 > 需求总览与第一性原理
GPU 算力增长速度远快于内存带宽增长速度,内存正在成为限制 AI 性能的核心瓶颈。
GPU 算力每两年翻几倍,但内存带宽每两年只能涨百分之几十。这就像高速公路越拓越宽(算力),但收费站还是那几个(带宽)——再多车也跑不快。
01 需求层:为什么 AI 算力需要新的内存与存储 > 需求总览与第一性原理
从 SRAM 到 HDD 的多层存储结构,速度、容量、单位价格按相反方向排列,是理解计算机系统设计的基本框架。
存储就像一栋楼。最上面是 GPU 里的“工作台”(SRAM,极小但极快),中间是“办公桌”(HBM、DRAM,够大且够快),下面是“文件柜”(SSD,大但慢),最底下是“地下仓库”(HDD、磁带,极大但极慢)。数据按需要的频率分布在不同楼层。
01 需求层:为什么 AI 算力需要新的内存与存储 > 需求总览与第一性原理
AI 同时需要“够快”和“够大”的内存,但这两件事在物理上很难同时满足,产业链因此被切成不同的子市场。
你既想要一杯能喝下整个游泳池水量的杯子(容量大),又想要一秒钟把游泳池倒进杯子(带宽高)——物理上做不到。所以产业链发展出了不同侧重的产品:HBM 偏带宽、传统 DDR 偏容量、CXL 主打“用便宜方式补容量”。
01 需求层:为什么 AI 算力需要新的内存与存储 > AI 工作负载驱动
长上下文推理让单用户的 Key-Value 缓存膨胀到几十 GB 甚至几个 TB,直接吃光 GPU 的 HBM。
大模型每生成一个字,都要“记住”之前所有字的信息。上下文越长,要记的越多。100 万 token 的对话,记忆量可以达到几十 GB,把一张 H100 的 80GB 显存吃掉大半。
01 需求层:为什么 AI 算力需要新的内存与存储 > AI 工作负载驱动
MoE 模型让“总参数”和“激活参数”脱钩,虽然算力需求没暴涨,但 HBM 容量需求按总参数增长。
MoE 模型像一个有 100 个专家的公司,每次只叫 5 个人开会(激活参数),但 100 个人的工资(全部参数)都要发——也就是说,GPU 必须把全部 100 个专家“养着”,虽然只用 5 个,容量需求按 100 算。
01 需求层:为什么 AI 算力需要新的内存与存储 > AI 工作负载驱动
训练吃容量也吃带宽,推理更吃容量;训练对 SSD 是“批量读写”,推理对 SSD 是“低延迟随机访问”。
训练像是学习一本书,要反复读、做笔记、复习(高带宽 + 大容量);推理像是回答问题,要快速从笔记本翻到对应章节(低延迟 + 随机访问)。两者对内存和存储的要求不一样。
01 需求层:为什么 AI 算力需要新的内存与存储 > AI 工作负载驱动
Agent 长会话和长上下文让“内存”的边界扩展到了 SSD,存储分层重新设计。
过去一个 AI 对话只有几千字,几页纸的事。现在 Agent 可以跑几个月,记住几亿字的对话历史——这种“长期记忆”没法都塞在 GPU 显存里,必须靠 SSD 来当外置大脑。
01 需求层:为什么 AI 算力需要新的内存与存储 > AI Capex 与存储预算
存储在 AI 数据中心 Capex 中的占比仍然偏低(约 5-10%),但增速最快,是被低估的环节之一。
盖一个 AI 数据中心,GPU 是最贵的(占大头),其次是网络、电力、土建。存储看似占比小,但因为 AI 容量需求暴涨,它的增速反而最快——这就像盖楼时占比不大的水管,在新型大楼里需求突然爆发。
02 存储金字塔层:从 SRAM 到 HDD 的完整体系 > 易失性高速内存层
芯片内部最快的存储,直接集成在 CPU/GPU 里,极快但极小且极贵。
SRAM 像是芯片自己的小笔记本,就贴在 CPU/GPU 旁边,读写速度极快(几纳秒),但写不了多少东西(几十 MB 顶天)——因为太贵了。
02 存储金字塔层:从 SRAM 到 HDD 的完整体系 > 易失性高速内存层
专为 GPU 设计的高带宽内存,通过 3D 堆叠 DRAM + 硅通孔 + 宽接口实现 TB/s 级带宽,是 AI 时代最稀缺的资源。
HBM 像是 GPU 的“贴身保镖”——把多片 DRAM 堆叠在一起,用 1024 根线宽的高速通道连到 GPU,带宽是普通 DDR 的 10 倍以上。它是 AI GPU 性能的“咽喉环节”。
02 存储金字塔层:从 SRAM 到 HDD 的完整体系 > 易失性高速内存层
服务器和 PC 主板上的标准内存,容量大、带宽中等、单位成本低。
DDR 是普通电脑、服务器主板上插的那种内存条。它便宜、量大,但带宽比 HBM 差一个数量级。AI 训练服务器仍然需要大量 DDR 来装训练数据集和缓存。
02 存储金字塔层:从 SRAM 到 HDD 的完整体系 > 易失性高速内存层
为移动设备和边缘 AI 设计的低功耗 DRAM,近年也被引入 AI 服务器做“超大容量低功耗内存”。
LPDDR 原本是给手机用的(省电),但 NVIDIA Grace CPU 等新一代 ARM 服务器芯片开始大量使用 LPDDR,因为它在低功耗的同时还能堆出极大容量。
02 存储金字塔层:从 SRAM 到 HDD 的完整体系 > 易失性高速内存层
针对消费级 GPU 设计的高速 DRAM,带宽比 DDR 高,但弱于 HBM。
GDDR 是游戏显卡(RTX 4090、5090 等)上用的显存。它比普通 DDR 快,但比 HBM 便宜——是消费级 GPU 的标配。
02 存储金字塔层:从 SRAM 到 HDD 的完整体系 > 持久存储与冷归档层
SSD 的核心介质,断电不丢失数据,是 DRAM 之下、HDD 之上的关键存储层。
NAND 就是你 U 盘、SSD、手机里的存储芯片。它比 DRAM 慢得多但便宜得多,而且断电后数据不丢——是介于“内存”和“硬盘”之间的关键角色。
02 存储金字塔层:从 SRAM 到 HDD 的完整体系 > 持久存储与冷归档层
基于 NAND 闪存的存储设备,是数据中心和 AI 服务器的标准存储形态。
SSD 是把 NAND 芯片 + 控制器 + 接口打包成一块“硬盘”形态的存储设备。比传统机械硬盘快几十倍,延迟低、随机访问强,但贵一些。
02 存储金字塔层:从 SRAM 到 HDD 的完整体系 > 持久存储与冷归档层
基于磁性盘片旋转的传统存储,容量极大、单位成本低,但延迟和带宽落后 SSD 一个数量级。
HDD 是传统的“机械硬盘”,里面有真的会旋转的盘片。它便宜大碗,但慢——不能用来跑 AI 训练,但用来存“很少访问的冷数据”很合适。
02 存储金字塔层:从 SRAM 到 HDD 的完整体系 > 持久存储与冷归档层
介于 DRAM 和 SSD 之间的新存储层,断电不丢且延迟接近 DRAM,但商业化坎坷。
持久内存的愿望是“既像内存一样快,又像硬盘一样断电不丢”。Intel Optane 是最有名的尝试,但 2022 年被砍掉了。这一层目前没有真正的商业赢家。
02 存储金字塔层:从 SRAM 到 HDD 的完整体系 > 持久存储与冷归档层
存储金字塔的最底层,极慢但极便宜、寿命极长,是云端“对象存储归档层”的物理载体。
磁带就是真的“磁带卷”,像录像带。它读写慢得要命,但存数据特别便宜,而且寿命可以 30 年。云厂商的“归档存储”(AWS Glacier 等)很大一部分就是磁带。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 标准与架构演进
HBM 从 HBM1(2014)到 HBM4(2026)经历了五代演进,每代带宽、容量、堆叠层数都数量级提升。
HBM 不是一成不变的,每两年左右出一代新标准。HBM3 是 H100 用的,HBM3E 是 H200/B100/B200 用的,HBM4 是下一代 Rubin GPU 用的。每代都更快更大。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 标准与架构演进
HBM 实现高带宽的物理基础,通过在 DRAM 芯片上打硅通孔,把多片芯片垂直堆叠并连接。
TSV 就是在硅片上打“垂直电梯”——一根穿过整个芯片的小孔,里面填铜,让上下层芯片之间能通电。HBM 用 TSV 把多片 DRAM 像三明治一样叠起来,这样信号不用绕弯,带宽就上去了。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 标准与架构演进
HBM 必须通过 2.5D 封装(以 TSMC CoWoS 为主)集成到 GPU 旁边,封装产能成为 HBM 出货的隐形瓶颈。
HBM 不能像普通内存那样插在主板上,必须紧贴 GPU——这个“紧贴”靠台积电的 CoWoS 封装实现。问题是 CoWoS 产能比 HBM 还紧张,这就成了整个 AI GPU 出货的瓶颈。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 标准与架构演进
2024 年量产、2025-2026 年主流的 HBM 标准,SK Hynix 拿下 NVIDIA 大单。
HBM3E 是当前 H200、B100、B200 GPU 上用的 HBM。SK Hynix 因为良率最早达标,拿走了 NVIDIA 大部分订单,Samsung 一直在追,Micron 后来居上。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 标准与架构演进
2026 年量产、给 NVIDIA Rubin GPU 用的下一代 HBM,接口从 1024-bit 扩展到 2048-bit。
HBM4 把 HBM 的“高速公路”从 1024 车道扩到 2048 车道,带宽再翻一倍。它是 NVIDIA Rubin、AMD MI400 那一代 GPU 的标配。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 标准与架构演进
为单一大客户(如 NVIDIA、Broadcom)定制 base die 和接口的 HBM 变种,代表 HBM 从标品走向定制的趋势。
大客户不满足于标准 HBM,要求“按我的 GPU 优化”——比如改 base die、改接口协议。这就出现了类似 ASIC 的定制 HBM,毛利更高,但只能卖给单一客户。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 标准与架构演进
2025 年 Sandisk 和 SK Hynix 联合提出的概念,把 HBM 架构搬到 NAND 上做“高带宽闪存”,作为 HBM 容量扩展层。
HBF 的想法是:HBM 太贵了,能不能把 HBM 的“3D 堆叠 + 宽接口”结构搬到便宜的 NAND 上,做一个“次级 HBM”?这样 GPU 可以同时连一组 HBM(快但贵)和一组 HBF(慢但容量大)。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 供给格局与定价权
HBM 12 层和 16 层堆叠的良率是行业核心竞争维度,谁先做到高良率谁就获得定价权。
HBM 堆叠层数越多,出错概率越大,良率越低。SK Hynix 之所以能赚最多,是因为它的良率比 Samsung、Micron 高,所以单位成本低、毛利率高,能拿走 NVIDIA 大部分订单。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 供给格局与定价权
全球 HBM 市场由 SK Hynix(约 50%)、Samsung(约 40%)、Micron(约 10%)三家垄断,2026 年起 Micron 份额预期上升。
HBM 是个高度集中的市场,只有三家公司能做。SK Hynix 第一,Samsung 第二,Micron 第三。Micron 是新晋玩家,靠 HBM3E 12 层迅速追赶。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 供给格局与定价权
SK Hynix 管理层多次确认 HBM 已被预订至 2027 年,这是 HBM 暴利可见性的最强证据。
正常存储是个周期股——涨完会跌。但 HBM 现在不一样,SK Hynix 说“我 2027 年的货都被预订光了”。这意味着至少未来两年价格不会崩,业绩可见性极强。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 供给格局与定价权
GPU 厂商深度参与 HBM 设计,SK Hynix 与 NVIDIA、Samsung 与 AMD、Micron 与多客户的合作模式,使 HBM 从“标品”走向“绑定”。
HBM 现在不是简单卖给 GPU 厂——它是和 GPU 一起设计的。NVIDIA 的工程师和 SK Hynix 的工程师早在 GPU 设计阶段就一起讨论 HBM 配置,这种深度绑定很难被新供应商打破。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 测试与上游材料
HBM 需要在堆叠前后多轮测试以保证良率和可靠性,测试设备厂商是 HBM 链上被忽视的受益者。
每片 HBM 在出厂前要经过多轮测试——堆叠前测、堆叠后测、封装后再测。这些测试需要专门的设备,Advantest、Teradyne 等公司因此受益。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 测试与上游材料
HBM 制造涉及大量精密化学品(光刻胶、CMP 浆料、电镀液等),JSR、信越化学、住友化学等日韩材料厂受益。
做 HBM 需要各种“高级化学品”,像光刻胶(决定线宽精度)、CMP 浆料(抛光用)、铜电镀液(填 TSV 用)等。这些化学品被日本几家公司垄断。
03 HBM 与高带宽内存层:AI 时代最稀缺的资源 > HBM 供给格局与定价权
HBM 当前的暴利可见性虽强,但 2027 年后存在产能过剩、价格下行、需求峰值等多重风险。
HBM 现在是金母鸡,但金母鸡总有疲软的时候。可能的风险:三家厂同时扩产导致 2027 年后供过于求;Mamba 等新架构减少 KV 缓存需求;客户压价等等。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > DRAM 标准与服务器模块
当前服务器和高端 PC 的主流内存标准,带宽是 DDR4 的 2 倍,功耗更低。
DDR5 是现在服务器主板上插的标准内存条。比上一代 DDR4 快一倍,容量也更大,AI 服务器都用它做“系统主内存”。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > DRAM 标准与服务器模块
JEDEC 正在制定的下一代 DDR 标准,预计 2027-2028 年量产,带宽再翻一倍。
DDR6 是 DDR5 的下一代。预计 2027-2028 年商用,带宽达到 100+ GB/s 单通道,但会是个长周期切换,因为服务器升级慢。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > DRAM 标准与服务器模块
服务器专用的高密度、高可靠性内存模组,与桌面 DIMM 不同,有寄存器和负载缓冲。
服务器内存条比桌面电脑的复杂——多了一些“缓冲芯片”用来支持更大容量、更稳定。RDIMM 是基础版,LRDIMM 是为更大容量优化的版本。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > DRAM 标准与服务器模块
NVIDIA Grace CPU 采用 LPDDR5X 而非 DDR5,改变了服务器内存的传统形态。
NVIDIA 自己的 ARM 服务器 CPU(Grace)用的是手机级别的低功耗内存(LPDDR5X),不是传统服务器 DDR5——这开创了一种新的“低功耗高容量”路线。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > CXL 与内存池化架构
基于 PCIe 物理层的新一代 CPU-内存-加速器互连协议,实现“内存池化”和“内存扩展”,2024 年开始规模商用。
CXL 是一种让 CPU 能通过 PCIe 连接“外置内存”的协议。这样服务器不再被主板内存插槽限制,可以用 CXL 加几个内存扩展卡,容量大大增加,而且不同服务器之间还能共享内存池。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > CXL 与内存池化架构
基于 CXL 协议的内存扩展模组,形态从 DIMM 变成类似 SSD 的 E3.S/E1.S 卡。
CXL DRAM 不是插在传统内存槽,而是像 SSD 一样插在 PCIe 槽。它可以让服务器在不增加内存槽的情况下扩展容量,而且不同服务器之间可以共享。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > CXL 与内存池化架构
通过 CXL 把多台服务器的内存汇聚成“共享池”,按需分配,提升整体内存利用率。
数据中心里,A 服务器内存满了 B 服务器还闲着——这浪费严重。内存池化的想法是把所有服务器的内存放到一个“公共池子”里,谁需要谁拿,大幅提升利用率。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > DRAM 公司与地区格局
服务器 DRAM 市场由 Samsung(约 45%)、SK Hynix(约 35%)、Micron(约 20%)三家垄断。
跟 HBM 一样,普通服务器内存也是三家公司——Samsung、SK Hynix、Micron。份额相对均衡一些,但 Samsung 仍然是老大。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > DRAM 公司与地区格局
中国唯一规模化的 DRAM 厂,正在突破 DDR5、向 HBM 进军,是 DRAM 全球格局最大的潜在变量。
长鑫是中国唯一一家能量产 DRAM 的公司,正在快速追赶,虽然技术节点还落后三巨头 2-3 代。但如果它继续突破,DRAM 行业的格局会被打破。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > DRAM 公司与地区格局
DRAM 历史上是典型周期股,价格大涨大跌,但 HBM 时代周期属性被削弱。
DRAM 历来是“过山车”——景气时大家抢着买,价格涨;过剩时跌得也猛。但 HBM 现在改变了这个故事,因为 HBM 已经锁单到 2027 年。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > CXL 与内存池化架构
Astera Labs 是 CXL 控制器和 retimer 芯片的领头公司,2024 年上市后成为 AI 内存连接标的。
CXL 内存要工作,需要专门的“接口芯片”做协议转换。Astera Labs 是这个细分市场的领头羊,从 PCIe retimer 起家,现在做 CXL 内存控制器、内存交换机。
04 DRAM 与主内存层:DDR5、LPDDR、CXL 和服务器内存 > CXL 与内存池化架构
连接 CPU/GPU 和 DRAM 的接口芯片,Cadence、Synopsys 提供 IP,Rambus 等公司提供产品。
CPU 和内存之间要通信,必须有“翻译员”——这就是内存控制器和 PHY(物理层接口)。这些 IP 由 Cadence、Synopsys 提供,有时也由 Rambus 等公司直接做芯片。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > NAND 技术与价格周期
把 NAND 存储单元从平面排列改成垂直堆叠,通过增加层数(而非缩小线宽)持续提升密度。
早期 NAND 是平面的(像田字格),工艺微缩后越来越难。3D NAND 把存储单元像“楼”一样竖起来叠,200 层、300 层、400 层这样往上堆,密度持续翻倍。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > NAND 技术与价格周期
NAND 每个单元存储的比特数,从 1 到 5,密度越高、成本越低、寿命越短。
每个 NAND 存储单元像个“小水杯”。早期一个杯子只能存“满 / 空”两种状态(SLC,1 比特)。后来工程师让一个杯子能区分“满/3/4/2/4/1/4/空”四种状态(MLC,2 比特),再后来八种(TLC,3 比特)、16 种(QLC,4 比特)、32 种(PLC,5 比特)——密度翻倍,但区分越来越难,寿命也越来越短。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > 企业 SSD 产品形态
为闪存设计的 PCIe 协议,延迟和并发能力远超传统 SATA/SAS,是企业 SSD 的事实标准。
NVMe 让 SSD 直接挂在 PCIe 总线上,不再走传统硬盘的 SATA 协议。这样 SSD 延迟从毫秒级降到微秒级,并发请求能力提升一两个数量级——这是数据中心 SSD 性能的关键。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > 企业 SSD 产品形态
AI 数据中心当前主流的 SSD 形态,单盘带宽 14 GB/s,低延迟、高 IOPS。
PCIe Gen5 是 PCIe 接口的第五代,带宽是上一代 Gen4 的两倍。AI 服务器都用 Gen5 SSD,因为 AI 工作负载对存储吞吐量要求极高。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > 企业 SSD 产品形态
专为数据中心设计的新一代 SSD 物理形态,取代传统 U.2,密度更高、散热更好。
传统 2.5 寸 SSD 形态是参考机械硬盘设计的,数据中心服务器越来越觉得不合适——又厚又难散热。EDSFF 推出了 E1.S 和 E3.S 等新形态,长得像内存条,密度高、可热插拔,逐渐成为主流。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > 企业 SSD 产品形态
30TB 起步、122TB 顶配的 QLC 企业级 SSD,正在替代 HDD 在 AI 数据中心的冷热温存储位置。
QLC 技术让 SSD 单盘容量飙升到几十 TB——Solidigm 已经推出 122TB 单盘 SSD。这种盘读取快、容量大,正在抢 HDD 的市场。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > 企业 SSD 产品形态
管理 NAND、跑 FTL、做 ECC 和加密的核心 ASIC,决定 SSD 性能和差异化。
SSD 不只是 NAND 芯片,还需要一个“大脑”——控制器芯片,负责管理数据放在哪、错误怎么纠、磨损怎么平均。这部分决定了 SSD 的性能和体验。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > AI 推理与 GPU 直连 SSD
把不活跃的 KV 缓存从 GPU HBM 卸载到 NVMe SSD,降低推理成本、支持更长上下文。
GPU 显存太贵装不下所有 KV 缓存,工程师想办法把不常用的 KV 移到 SSD,需要时再换回来。这样推理可以支持更多用户、更长上下文。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > AI 推理与 GPU 直连 SSD
绕过 CPU 让 GPU 直接读写 NVMe SSD 的技术,大幅降低存储访问延迟。
传统上 GPU 要读 SSD,得先让 CPU 帮忙——绕一圈。GPUDirect Storage 让 GPU 跳过 CPU 直接和 SSD 通信,延迟和带宽都大幅改善,适合 AI 训练大数据集。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > NAND 与 SSD 公司图谱
2025 年 2 月从 Western Digital 分拆独立上市的纯 NAND/SSD 公司,与 KIOXIA 合资生产 BiCS Flash。
Sandisk 不是新公司,但 2025 年它从 WD 重新独立上市了——现在它是个纯做 NAND 和 SSD 的公司,跟日本 KIOXIA 是合资制造伙伴,产品涵盖消费和企业。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > NAND 与 SSD 公司图谱
全球第二大 NAND 厂(按出货位元),2024 年底在东京上市,跟 Sandisk 是合资制造伙伴。
KIOXIA 是从东芝拆出来的存储公司,日本最大的 NAND 厂。它和 Sandisk 共享日本工厂——一个铜板的两面。2024 年底它在东京上市了。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > NAND 与 SSD 公司图谱
SK Hynix 在 2021 年收购的 Intel NAND 业务,现作为独立子公司运营,专注企业 SSD。
Intel 当年也做 NAND,2020 年决定退出,把 NAND 业务卖给了 SK Hynix。SK Hynix 把它独立运营,改名 Solidigm,专做企业 SSD,在大容量 QLC 市场领先。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > NAND 技术与价格周期
NAND 跟 DRAM 一样是周期股,2024-2026 年处于上行周期,合约价持续上涨。
NAND 价格也是周期性的——景气时大家抢着买、价格涨;过剩时降价。2024 年开始 NAND 进入新一轮涨价,因为 AI 企业 SSD 需求暴增,而厂商前几年减产。
05 NAND 闪存与 SSD 层:从 QLC 到 PCIe Gen5 企业盘 > NAND 技术与价格周期
中国唯一规模化的 NAND 厂,2022 年因美国制裁被打断,正在艰难重建。
长江存储是中国 NAND 自主化的核心,曾经做到 232 层(全球领先水平),但 2022 年美国制裁后受到重创,设备和上游被卡。现在仍在努力重建,但进度慢。
06 HDD 与冷存储层:被低估的容量基础 > HDD 产品与容量技术
为数据中心设计的高容量、高可靠性 HDD,容量 12-32TB,是云存储的容量主力。
数据中心用的 HDD 跟你家电脑里的不一样——容量更大(20-30TB)、可靠性更高、可以 7×24 小时不停转。它们承担“温数据”和“冷数据”的存储任务。
06 HDD 与冷存储层:被低估的容量基础 > HDD 产品与容量技术
HDD 的下一代核心技术,通过激光加热磁性介质提升存储密度,Seagate 已量产,WDC 跟进。
HDD 容量提升的物理瓶颈是磁记录密度——磁颗粒做太小会自己翻转。HAMR 用激光加热磁性表面,让磁颗粒能更稳定地排列,从而支持更小的颗粒、更高的密度。
06 HDD 与冷存储层:被低估的容量基础 > HDD 双雄公司图谱
全球第一大 HDD 厂(按容量出货),2024 年率先量产 HAMR,业务高度集中于数据中心 HDD。
Seagate 是 HDD 老大,现在几乎是个“纯数据中心 HDD”公司——消费业务很小。HAMR 是它的核心技术筹码,率先量产。
06 HDD 与冷存储层:被低估的容量基础 > HDD 双雄公司图谱
2025 年分拆 Sandisk 后,Western Digital 成为纯 HDD 公司,与 Seagate 并列双雄。
Western Digital 原来既做 HDD 又做 NAND/SSD,2025 年把 NAND/SSD 部分(Sandisk)分拆出去后,现在 WDC 就是个纯 HDD 公司了。
06 HDD 与冷存储层:被低估的容量基础 > HDD 产品与容量技术
SSD 在性能、功耗、密度上全面胜过 HDD,但每 TB 价格仍是 HDD 的 3-5 倍,完全替代尚未发生。
大家都说 SSD 会替代 HDD,但实际上 SSD 每 TB 价格还是 HDD 的 3-5 倍。在“读多写少 + 容量为王”的归档场景,HDD 仍然便宜得多。SSD 在 AI 训练热数据场景胜出,在冷数据场景还没完全替代。
06 HDD 与冷存储层:被低估的容量基础 > 冷归档与对象存储架构
存储金字塔最底层,$/TB 极低、寿命 30 年,云厂商归档存储的核心载体。
磁带就是真磁带,像录像带的卷盘。读取很慢(几分钟才能把磁带送到读取头),但便宜得离谱,而且寿命长达 30 年。云厂商的“长期归档”(AWS Glacier、Azure Archive)很多就是磁带。
06 HDD 与冷存储层:被低估的容量基础 > 冷归档与对象存储架构
云端横向扩展的存储架构,底层由 HDD/SSD/磁带组成,是 AI 训练数据集的标准存储形态。
对象存储就是“互联网级别的大文件柜”。AWS S3 是典型代表,后端是几千万块 HDD/SSD 组合而成,前端是统一的 API。AI 训练数据集都在这种系统里存。
06 HDD 与冷存储层:被低估的容量基础 > 冷归档与对象存储架构
大模型训练后的原始数据集、合成数据、checkpoint 历史等都需要长期归档,推动归档存储增长。
训练一个 GPT-5 用的数据集,训练完不会扔——可能下次训练 GPT-6 还要用,或者监管要求保留。这些数据可能几 PB 甚至几十 PB,放在 SSD 太贵,放磁带最合算。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 光刻与图形化设备
DRAM 进入 1a/1b nm 节点的关键设备,ASML 独家供应,是 DRAM 产业最大的物理瓶颈。
EUV 光刻机是世界上最复杂的机器,全世界只有荷兰 ASML 一家能造。它用 13.5 纳米的极紫外光线在硅片上“画”芯片图案,精度比头发丝还细几千倍。DRAM 现在做到 1a/1b nm 必须用它。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 光刻与图形化设备
DRAM 和 NAND 制造的主力光刻设备,2-7nm 节点都依赖它,ASML 和尼康提供。
ArF 浸没式是 EUV 之前的主流光刻技术,用 193nm 波长的紫外光 + 水浸的方法做高精度图案。DRAM 在 EUV 普及之前主要用它,现在仍是 NAND 制造的主力。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 制程、测试与键合设备
3D NAND 高深宽比刻蚀和 HBM TSV 刻蚀的核心设备,Lam Research 在 3D NAND 刻蚀垄断。
刻蚀机就是用等离子体把硅片上不要的部分“啃掉”。3D NAND 要叠 200+ 层,得在每一层精确刻一个深孔,这种“深孔刻蚀”技术 Lam Research 最强。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 制程、测试与键合设备
在硅片上沉积各种薄膜的设备,Applied Materials、Tokyo Electron 主导。
芯片不是一块铁皮,而是几百层不同材料叠出来的。每一层都要用沉积设备“喷涂”一层薄膜——金属层、绝缘层、半导体层。Applied Materials 是这个领域的老大。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 制程、测试与键合设备
在每一层薄膜沉积后用 CMP 抛平,是芯片多层结构的必备工艺,Applied Materials 主导。
每沉积一层薄膜,表面就不平了,继续做下一层会出错。CMP 就是“打磨”——用化学液体 + 物理磨盘把表面磨平。每个芯片要做几十次 CMP。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 制程、测试与键合设备
检查每一步工艺质量、找出缺陷的设备,KLA 在量测和缺陷检测市场垄断。
芯片做完每一步都要检查,看有没有缺陷、尺寸对不对。这种“检查”设备非常复杂,KLA 是这个市场的老大,几乎垄断。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 制程、测试与键合设备
HBM、DRAM、NAND 都要测试,Advantest 和 Teradyne 是 ATE 两大巨头。
每片存储芯片出厂前都要测试——能不能正常工作、容量对不对、速度达标没。这种“自动化测试”设备 Advantest 和 Teradyne 两家垄断。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 制程、测试与键合设备
HBM 堆叠和 3D NAND 上下层连接的核心设备,BESI 在 Hybrid Bonding 市场垄断。
HBM 是把多片 DRAM 像三明治一样叠起来,这“叠”和“连”的工艺叫键合。BESI 是这个领域的隐形冠军,只做这一件事。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 半导体材料与化学品
芯片制造的起点材料,日本 Shin-Etsu 和 SUMCO 全球垄断 60%+。
芯片从一片“圆硅饼”开始,这片硅饼叫硅片或晶圆。世界上能做最高品质硅片的只有几家日本公司。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 半导体材料与化学品
光刻工艺的核心耗材,日本 JSR、TOK、信越化学等垄断 80%+ 全球市场。
光刻时,先在硅片上涂一层“光敏胶水”,光照到的地方变化、没照到的地方不变。这种胶水(光刻胶)技术壁垒极高,日本几家公司垄断。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 半导体材料与化学品
芯片制造的化学耗材,Linde、Air Liquide、Air Products 等工业气体巨头供应。
做芯片要用各种特殊气体——刻蚀气、沉积气、清洁气。这些“电子级”气体纯度要求极高,工业气体公司(Linde、Air Liquide)是主要供应商。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 半导体材料与化学品
CMP 工序和湿法清洗的耗材,Entegris、Versum/Merck、Fujimi 等供应。
CMP 抛光时用一种带磨料颗粒的“浆糊”,叫 slurry。每片晶圆要用一定量。还有各种“清洗液”也是高纯度化学品。这些都是半导体材料厂的稳定业务。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 出口管制与国产设备
美国持续收紧对中国半导体设备出口,DRAM 设备(EUV、ArF 浸没、部分蚀刻和沉积)受限,影响中国 DRAM/HBM 自主化。
美国不希望中国发展先进半导体,所以禁止 ASML、Lam、AMAT 这些美荷日设备厂卖最先进的设备给中国。这是影响中国 DRAM/NAND 自主化的最大变量。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 出口管制与国产设备
北方华创、中微公司、上海微电子等正在突破存储设备国产化,但 EUV 仍无可替代方案。
在美国制裁压力下,中国半导体设备产业正在加速发展。北方华创做沉积和蚀刻,中微做蚀刻,上海微电子做 DUV 光刻——但 EUV 仍然是死结。
07 制造设备与上游材料层:存储产业链的真正瓶颈 > 光刻与图形化设备
ASML 是 DRAM 进入先进节点的唯一通道,垄断 EUV、高端 ArF 浸没和 High-NA EUV。
ASML 是半导体设备里最特殊的——它做的 EUV 光刻机全球独家,没有替代品。DRAM 厂想做 1a/1b nm 节点,必须从 ASML 买 EUV;中国厂买不到,就只能停留在 14-18nm。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 公司矩阵与地区全景
同时按地区和价值链位置定位公司,避免只说“某家公司做存储”这种粗糙分类。
看存储公司不能只看国家,也要看它吃的是上游设备和材料的钱、中游存储介质的钱,还是下游系统集成的钱。这个矩阵帮助用户快速定位公司所处位置。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 公司矩阵与地区全景
美股提供从设备(AMAT、LRCX、KLA)、芯片(MU、SNDK)到系统(STX、WDC、PSTG、NTAP)的完整存储链投资标的。
在美股能买到存储产业链的完整代表——上游设备、中游芯片、下游系统都有。这是中国和欧洲投资者无法企及的覆盖度。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 公司矩阵与地区全景
Samsung、SK Hynix、KIOXIA 是全球前三 DRAM/NAND 厂,日本设备和材料厂(TEL、Advantest、Shin-Etsu)垄断关键环节。
存储行业的真正核心在亚洲——韩国管 DRAM 和 NAND 的量产,日本管设备和材料。中国正在追赶。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 公司矩阵与地区全景
中国在设备和系统环节有突破,但核心存储芯片(DRAM、NAND)自主化仍处早期。
中国 A 股能买到的存储标的主要是上游设备(北方华创、中微)和下游系统(浪潮、紫光),核心芯片(DRAM、NAND)厂还没上市(长鑫、长江存储)。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 核心存储龙头
全球第二大 DRAM 厂、HBM 龙头,NVIDIA 主供应商,是 AI 时代最确定的存储受益标的。
SK Hynix 是 HBM 第一名,因为 HBM3E 良率最早过关,拿走 NVIDIA 大部分订单。2024-2026 年是它的黄金时代。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 核心存储龙头
全球最大综合存储厂,DRAM 第一、NAND 第一,HBM 第二,但被多元业务稀释。
三星是存储全才——DRAM 第一、NAND 第一、HBM 第二。但它太大太杂,手机、显示器、芯片代工都有,所以“AI 存储”叙事被稀释。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 核心存储龙头
美股唯一的纯 DRAM/NAND 标的,HBM 后来居上,是表达存储链投资的核心美股工具。
Micron 是美股唯一的存储芯片公司——既做 DRAM 又做 NAND,HBM3E 量产稍晚但追得快。它是美国投资者最容易买到的存储标的。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 竞争格局、替代路径与客户绑定
DRAM 三寡头(Samsung、SK Hynix、Micron)、NAND 五寡头、HDD 双寡头,存储是半导体行业集中度最高的细分。
存储行业经过多年整合,现在 DRAM 三家、NAND 五家、HDD 两家——非常集中。这种“寡头格局”是存储利润周期的基础。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 竞争格局、替代路径与客户绑定
CXL 内存池可能蚕食 DRAM、HBF 可能挤压 HBM 容量端、Mamba 类新架构可能降低 KV 缓存需求。
存储行业有几个潜在的“颠覆点”:CXL 可能让普通服务器不需要那么多 DRAM;HBF 可能让 HBM 容量需求减少;Mamba 模型可能让 KV 缓存需求降低。这些都是中长期风险。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 竞争格局、替代路径与客户绑定
NVIDIA 和四大超大规模云(Microsoft、Google、Amazon、Meta)是存储链最关键的客户,认证决定存储厂家命运。
存储厂卖谁、卖给谁,大量取决于“NVIDIA 选谁”和“hyperscaler 用什么”。SK Hynix 之所以暴利,就是因为 NVIDIA 选了它。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 竞争格局、替代路径与客户绑定
中国在 NAND 上比 DRAM 进度更快,但都受美国制裁影响;HBM 自主化仍在早期。
中国 NAND 自主化(长江存储)比 DRAM(长鑫)起步早,本来 2022 年已经做到 232 层,但美国制裁打断了节奏。现在两家都在艰难重建。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 组合框架与长期展望
选择确定性高、业务多元、估值合理的存储核心标的,适合表达“AI 存储长期趋势”。
稳健组合不追最弹性,而是找“AI 存储确定性最高 + 估值不离谱”的组合。这种组合适合大资金、长期持有。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 组合框架与长期展望
在稳健龙头基础上加入弹性更高的中游和下游标的,兼顾确定性和弹性。
均衡组合在稳健龙头之外,加入一些“AI 存储弹性更高、但确定性也尚可”的标的——比如 Sandisk、Seagate、Advantest 这种。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 组合框架与长期展望
选择小市值、上游材料、新技术替代等弹性最高但风险更大的标的。
进攻组合像放大镜,涨的时候很快,跌的时候也痛。适合小仓位研究型投资。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 风险框架
HBM 当前暴利依赖 NVIDIA 单一客户、产能锁定、定价权,任何一项变化都可能改变利润分配。
HBM 现在赚钱,但不是没风险——NVIDIA 客户集中度过高、2027 年后可能产能过剩、新技术替代、客户压价等都是潜在威胁。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 风险框架
NAND 价格在 2024-2026 年大涨,2027 年后可能因为厂商扩产和消费需求疲弱而反转。
NAND 现在涨价,但它历来是周期股——涨完会跌。涨价周期里 Sandisk、KIOXIA 涨得多,周期反转时也会跌得猛。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 风险框架
HAMR 是 HDD 行业的最后一搏,如果 QLC SSD 价格下降速度快于 HAMR 容量增长,HDD 在 2030 年后可能加速消亡。
HDD 厂商现在还赚钱,但中长期被 SSD 替代是大势所趋。HAMR 能延缓多久,取决于 QLC SSD 降价多快。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 风险框架
存储行业资本开支周期是判断行业景气度的领先指标,过度扩产会引发周期反转。
存储行业历来“涨价时大家扩产、扩完产能过剩、价格暴跌”。判断这个周期是存储投资的核心。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 信号跟踪
跟踪 HBM 季度合约价、占 DRAM 收入比、与普通 DRAM 价差,是判断 HBM 景气度的核心指标。
跟 HBM 投资要密切关注几个指标:HBM 价格、HBM 占总 DRAM 收入比、HBM 与普通 DRAM 价差倍数。这些指标的变化预示 HBM 利润周期。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 信号跟踪
Microsoft、Google、Amazon、Meta、Oracle 的季度 Capex 是 AI 存储需求的源头指标。
存储需求最终来自数据中心建设。跟踪四大超大规模云的季度 Capex 指引,等于跟踪 AI 存储链的水龙头。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 信号跟踪
NVIDIA 是 HBM 最大单一客户,其季度指引和 GTC 大会信号直接决定 HBM 景气。
NVIDIA 一打喷嚏,HBM 就感冒。它的财报、GTC 大会、产品 roadmap 都是 HBM 投资的“必读情报”。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 信号跟踪
Mamba/SSM 类新架构、CXL 内存池、HBF 等替代路径的产业化进展,是存储链中长期风险跟踪重点。
存储行业当前的好日子建立在“Transformer 永恒 + KV 缓存永远膨胀”的假设上。如果 Mamba 等新模型成功,或者 CXL 取代部分 DRAM,行业格局会改写。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 组合框架与长期展望
按确定性和弹性,把存储链投资分成稳健、均衡、进攻三类组合思路。
存储链投资有三种思路,根据你的风险偏好选择:稳健(SK Hynix、Micron、AMAT、ASML)、均衡(Sandisk、Seagate、Advantest、BESI)、进攻(KIOXIA、Astera Labs、国产替代)。
08 公司图谱与投资框架层:段位、地区、组合与风险 > 组合框架与长期展望
存储链是“AI 卖铲子”链条中最确定的一条,中长期受益于 AI 基础设施扩张、数据爆炸、长上下文与 MoE 趋势,但需警惕周期反转和技术替代。
存储是 AI 时代被低估的“卖铲子”赛道——确定性高、利润可见、寡头格局稳定。但它仍然是周期股,长期持有需要在每个周期高点降仓位。