
AI 算力增长不只意味着更多 GPU、AI 加速卡和服务器,也会同步放大存储需求。训练需要持续读取海量数据、写入 checkpoint 和保存模型版本;推理需要加载模型权重、维护 KV cache、访问向量数据库和保存用户上下文;数据保存则涉及原始语料、清洗数据、日志、生成内容、审计记录和备份。你判断 AI 基础设施投资时,不能只看 GPU 出货,还要看 HBM、DRAM、企业级 SSD、近线 HDD、对象存储和数据平台能否支撑真实工作负载。

AI 算力增长会带动存储需求,因为 AI 系统不是只有计算,还需要持续搬运、暂存、写入和保存数据。GPU 越多,数据管道越不能拖慢训练;模型越大,权重、上下文和中间状态越多;应用越普及,推理日志、用户交互和生成内容越多。因此,AI 基础设施不是“GPU 单点扩容”,而是算力、内存、网络和存储的同步扩容。
一个完整 AI 系统通常包括数据采集、数据清洗、训练、微调、评估、部署、推理、日志记录和数据留存。训练阶段需要把数据从数据湖、对象存储、SSD 或并行文件系统中不断送入 GPU;推理阶段需要快速读取模型权重、处理上下文、访问检索系统;业务运行后还要保存用户请求、模型输出、反馈数据和审计记录。NVIDIA 在讨论 AI training and inferencing 存储扩展时强调,容量、性能、网络硬件和数据传输协议都要提前统筹,而不是等到 GPU 部署完之后再补。
算力、内存和存储的关系可以理解为三层结构:
| 层级 | 典型组成 | 主要作用 | 常见瓶颈 |
|---|---|---|---|
| 算力 | GPU、TPU、AI accelerator、ASIC | 执行矩阵计算和模型推理 | 算力不足、能耗高 |
| 内存 | HBM、GDDR、DDR5、LPDDR、CXL memory | 存放模型权重、中间状态和缓存 | 容量不足、带宽不足 |
| 存储 | NVMe SSD、企业级 SSD、对象存储、近线 HDD | 保存训练数据、checkpoint、日志和归档 | 吞吐不足、延迟高、成本高 |
GPU 很快,但系统不一定快。如果训练数据无法及时送到 GPU,GPU 会等待数据;如果 checkpoint 写入过慢,训练会被暂停;如果推理上下文无法留在合适的存储层,用户等待时间会变长。AI 集群越大,单个环节的瓶颈越容易被放大。过去很多企业把存储看作成本中心,但在 AI 场景下,存储已经成为影响 GPU 利用率、推理吞吐、数据治理和长期成本的基础设施。
AI 算力增长带动存储需求,本质上是因为 AI 工作负载会把“数据进入计算系统”和“计算结果长期保存”都变成刚性需求。训练需要高吞吐读取和持续写入,推理需要低延迟访问和上下文管理,数据保存需要容量、成本和治理能力。只增加 GPU 而忽视存储,可能导致昂贵算力等待数据,或者让推理服务在高并发下成本快速上升。判断 AI 基础设施是否健康,不能只看 GPU 数量,还要看 HBM、DRAM、SSD、HDD、网络和数据平台是否能匹配算力增长。

AI 训练需要大量存储,因为模型训练不是一次性读取数据,而是反复读取、打乱、分批、预处理和写入结果。数据集越大,训练轮次越多,checkpoint 越频繁,存储吞吐、并发读写和网络带宽就越重要。训练阶段的核心问题不是“能不能存下数据”,而是“能不能持续、稳定、高吞吐地把数据送到 GPU”。
训练数据通常有多种形态:原始文本、图片、视频、代码、语音、传感器数据、企业文档;经过清洗后,还会形成 cleaned data、tokenized data、feature data、training batches 等中间数据。Dell 在解释 AI model training 与存储交互时,将流程拆成加载训练数据、预处理数据、在 GPU 上训练模型三个关键阶段。每个阶段都会访问存储,只是访问模式不同。
训练阶段还有一个容易被低估的存储需求:checkpoint。大模型训练时间长、成本高,不能等训练完成后才保存结果。系统通常需要定期写入模型权重、优化器状态和恢复点,用于故障恢复、实验对比、模型版本管理和继续训练。SNIA 在 AI 存储资料中提到,训练会使用批量数据更新模型权重,并周期性写入 checkpoint 以便恢复。checkpoint 越大、写入越频繁,对 SSD、并行文件系统和网络的压力越明显。
训练阶段常见存储需求可以分成四类:
| 训练环节 | 存储需求 | 关键指标 | 常见介质 |
|---|---|---|---|
| 数据读取 | 反复读取训练集和样本批次 | 吞吐、并发读取、数据加载速度 | NVMe SSD、对象存储、并行文件系统 |
| 数据预处理 | 清洗、切分、tokenize、增强 | 读写混合性能、CPU/GPU 协同 | SSD、缓存层、数据湖 |
| checkpoint 写入 | 保存模型权重和恢复点 | 写入速度、可靠性、恢复时间 | 企业级 SSD、并行文件系统 |
| 实验留存 | 保存版本、参数、日志和评估结果 | 容量、可追溯性、成本 | 对象存储、HDD、归档存储 |
为了减少数据移动瓶颈,AI 训练也在推动存储架构升级。NVIDIA 的 GPUDirect Storage 可以在本地或远程存储与 GPU memory 之间建立直接数据路径,减少 CPU 中转对数据移动的影响。它说明一个趋势:当 GPU 变得更快,传统“存储—CPU—内存—GPU”的数据路径可能变成瓶颈,训练系统需要让数据更直接、更高效地进入加速器。
AI 训练带动存储需求,不只是因为训练数据集变大,更因为训练过程会不断读取数据、写入 checkpoint、保存模型权重和保留实验版本。算力集群越大,GPU 越不能被数据读取拖慢;训练时间越长,checkpoint 和版本管理越重要。企业级 SSD、并行文件系统、高速网络、对象存储和数据湖都会被纳入训练链路。训练阶段最重要的判断标准不是“容量够不够”,而是“存储系统能否让 GPU 少等待、训练少中断、实验可复现”。

AI 推理也会带动存储和内存需求,因为推理不是轻量任务。每一次用户请求都需要加载模型权重、处理输入上下文、生成输出,并维护中间状态。用户越多、上下文越长、模型越大,并发越高,HBM、DRAM、SSD、向量数据库和缓存系统的压力就越明显。训练是模型构建阶段,推理才是 AI 应用大规模运行后的持续负载。
IBM 将 AI inference 解释为训练后使用 AI 模型处理新数据和请求的过程。这个过程看起来只是“输入问题、输出答案”,但系统内部会经历 prompt 输入、prefill、decode、token generation、response output 等环节。模型权重要被加载,输入上下文要被处理,输出 token 要逐步生成。只要用户数增加,推理系统就会从单次计算问题变成持续服务问题。
推理阶段最关键的存储变量之一是 KV cache。KV cache 用来保存 Transformer 模型处理上下文时产生的 key/value 中间状态,它可以减少重复计算,但会占用大量内存。NVIDIA 在讨论大规模 LLM 推理时举例,Llama 3 70B 和 Llama 4 Scout 109B 以 FP16 加载大约需要 140GB 和 218GB memory,单用户 128k token 上下文的 KV cache 对 Llama 3 70B 约消耗 40GB memory,并会随用户数线性增长。
KV cache 让推理从“算力问题”变成“内存和存储分层问题”。在理想情况下,最热的缓存保留在 HBM 中;当 HBM 不够时,部分缓存可能被放到 CPU DRAM、CXL memory、NVMe SSD 或远程存储。NVIDIA Dynamo 提到,使用 KV Cache offloading 可以支持更长上下文、降低 GPU memory 占用、提升并发并减少重复计算。这类技术说明,推理侧的瓶颈已经不只是 GPU 算力,还有缓存容量、访问延迟和成本结构。
推理阶段还会被 RAG 和 AI agent 放大。RAG 需要访问企业文档、向量数据库、搜索索引和外部知识库;AI agent 还会记录计划、工具调用结果、任务状态和历史上下文。推理服务越接近真实业务,访问的数据越分散,存储系统就越需要同时支持低延迟、高并发、权限控制和持续更新。
| 推理需求 | 典型场景 | 主要压力 | 相关存储层 |
|---|---|---|---|
| 模型权重加载 | 大模型上线、弹性扩容 | 容量、读取速度 | HBM、DRAM、SSD |
| KV cache | 长上下文、多轮对话、高并发 | HBM 容量、缓存命中率 | HBM、DRAM、CXL、NVMe SSD |
| RAG 检索 | 企业知识库、客服、搜索增强 | 低延迟、索引更新 | 向量数据库、SSD、对象存储 |
| Agent 状态 | 工具调用、任务规划、上下文记忆 | 状态管理、持久化 | 数据库、对象存储、日志系统 |
| 用户日志 | 质量评估、风控、再训练 | 写入、留存、治理 | 对象存储、HDD、归档 |
推理阶段不是“训练结束后存储需求就下降”。相反,当 AI 应用进入大规模用户服务,模型权重、KV cache、长上下文、多轮对话、RAG 检索和 agent 状态会持续消耗 HBM、DRAM、SSD 和数据平台资源。训练偏向高吞吐和大规模写入,推理更偏向低延迟、高并发和上下文管理。AI 应用越普及,推理侧存储需求越可能持续增长,尤其是在长上下文、企业知识库和多 agent 工作流成为常态之后。
数据保存是 AI 存储需求中容易被低估的一环,因为 AI 系统不只消耗旧数据,也会不断产生新数据。训练会产生 checkpoint、模型版本和评估结果;推理会产生用户请求、模型输出、反馈数据和日志;企业部署还需要审计、备份、权限管理和合规留存。算力越多,AI 运行越频繁,长期保存的数据量就越大。
AI 数据生命周期通常包括 raw data、clean data、training data、model weights、checkpoints、inference logs、generated content、audit records 和 backup。训练数据保存主要服务于模型训练、复现、版本管理和再训练;推理数据保存主要服务于用户体验优化、质量评估、安全审计和业务分析。两类数据都需要保存,但访问频率、价值密度和合规要求不同。
IBM 在解释 AI storage 时强调,AI 存储要在规模化数据、高性能、低延迟和受控访问之间取得平衡。这个描述很重要,因为 AI 数据不是全部放在高速 SSD,也不是全部放在低成本 HDD。不同数据应根据访问频率、延迟要求、成本和治理要求分层保存。
| 数据类型 | 访问频率 | 主要用途 | 适合存储层 |
|---|---|---|---|
| 热数据 | 很高 | 当前训练批次、在线推理上下文、实时索引 | HBM、DRAM、NVMe SSD |
| 温数据 | 中等 | 近期 checkpoint、常用语料、向量索引 | 企业级 SSD、对象存储 |
| 冷数据 | 较低 | 历史语料、归档日志、备份、低频内容 | 近线 HDD、对象存储、归档 |
| 治理数据 | 按需访问 | 审计、追踪、权限、合规记录 | 对象存储、不可变快照、备份系统 |
企业保存 AI 数据,不只是为了以后训练更多模型,也为了复现结果、排查问题、保护数据和满足治理要求。Dell 关于 AI workload cyber-resilience 的内容指出,训练和推理数据集可能分散在多个存储系统,并且会在 AI 生命周期中动态演化,因此 AI datasets protection 对完整性和可用性很关键。对企业来说,丢失模型版本、训练样本来源或推理日志,可能会影响问题定位、合规审计和业务连续性。
数据保存还会带来成本约束。热数据需要低延迟和高性能,但并不是所有数据都值得长期占用昂贵 SSD。历史日志、备份、视频语料和低频访问内容更适合放在低成本容量层。Western Digital 在 2026 财年三季度表示,训练、推理、agentic AI 到 physical AI 几乎都会产生需要持久、低成本保存的数据,HDDs 因此成为 AI 数据保存链条中的重要容量底座。
数据保存是 AI 存储需求的第三条主线,也是最容易被“GPU 叙事”掩盖的部分。训练和推理会不断产生数据,企业还需要保存模型版本、checkpoint、日志、生成内容、审计记录和备份。不同数据的价值、访问频率和成本约束不同,因此 AI 存储会走向分层架构:高性能 SSD 负责热数据,对象存储和企业级 SSD 承接温数据,近线 HDD 和归档系统承担大容量长期保存。安全与治理能力则决定这些数据是否能被稳定复用。
AI 算力增长不是只带动一种存储硬件,而是带动完整存储层级。HBM 和 DRAM 解决离 GPU 最近的带宽和延迟问题,企业级 SSD 解决训练吞吐、checkpoint、RAG 和推理缓存问题,HDD 与对象存储解决大容量、低成本和长期保存问题。不同存储硬件受益的环节不同,相关公司和股票也不能简单归为同一种 AI 需求。
HBM 和 DRAM 是离 GPU 最近的高价值存储。训练大模型需要高带宽内存支持大规模矩阵计算,推理服务也需要在模型权重、激活和缓存之间保持高效访问。Micron 提到,其 AI memory and storage 产品组合覆盖 HBM、SSD、LPDDR、数据中心和边缘 AI 场景,说明 AI 对存储的拉动并不局限于单一产品。Micron 在 COMPUTEX 2026 还表示,HBM4 36GB 12H 在特定条件下可提升 LLM inference throughput,说明高带宽内存与 token 生成效率存在直接关系。
企业级 SSD 处在 GPU、数据管道和推理服务之间。训练需要高速读取数据和写入 checkpoint;推理需要访问向量数据库、RAG 资料、模型文件和 KV cache 分层;数据工程需要处理持续增长的数据集。NVMe SSD、PCIe Gen5/Gen6 SSD、QLC enterprise SSD、NVMe-oF 和 GPUDirect Storage 都是围绕“更快、更稳定、更靠近 GPU”的方向演进。Micron 对 AI data center 的描述中,也将 AI training 和 inference 都纳入 memory 与 storage solutions 的应用范围。
HDD 和对象存储则更偏向容量底座。AI 训练数据、视频语料、推理日志、备份和历史版本并不总是需要毫秒级访问,但需要长期、低成本、可管理地保存。Seagate 2026 财年三季度公布 revenue of $3.11 billion,同时披露非 GAAP 毛利率为 47.0%,反映出近线 HDD 和数据中心需求对行业景气的支撑。
| 存储环节 | 主要作用 | AI 工作负载 | 受益逻辑 |
|---|---|---|---|
| HBM | 高带宽、低延迟,靠近 GPU | 训练、推理、长上下文 | 模型更大、token 生成更多 |
| DDR5/DRAM | CPU 侧内存、缓存、系统数据 | 推理服务、数据处理 | 并发增加、上下文管理增加 |
| 企业级 SSD | 高吞吐、低延迟、随机读写 | 训练数据、checkpoint、RAG、KV offload | 数据管道和缓存压力增加 |
| 对象存储 | 弹性容量、数据湖、治理 | 原始语料、清洗数据、日志 | 数据生命周期拉长 |
| 近线 HDD | 低成本大容量、长期保存 | 备份、归档、历史训练数据 | AI 数据长期留存增加 |
AI 算力增长会带动完整存储层级,而不是单一硬件。HBM 和 DRAM 解决距离 GPU 最近的带宽问题,企业级 SSD 解决训练吞吐、checkpoint、RAG 和推理缓存问题,对象存储和 HDD 解决大规模数据留存问题。你看 AI 存储产业链时,需要把“训练、推理、保存”与“内存、SSD、HDD、数据平台”对应起来。不同公司、产品和股票所受益的环节不同,不能把所有存储需求都简单理解成同一种 AI 概念。
判断 AI 存储需求是真增长,不能只看“AI 概念热不热”或“GPU 出货高不高”,而要看训练、推理和数据保存三个工作负载是否同步增长。如果训练集规模、推理 token 量、并发用户、上下文长度、RAG 调用、日志留存和云厂商资本开支都在上升,存储需求更可能是真实增长;如果只是渠道补库存或短期抢货,价格波动可能更快反转。
第一,看工作负载。训练侧要观察数据集规模、GPU 利用率、checkpoint 频率、数据读取吞吐;推理侧要观察 tokens per second、TTFT、KV cache、batch size、并发数;保存侧要观察数据增长量、日志留存周期、备份策略和治理要求。NVIDIA 在长上下文推理优化中提到,随着 KV cache grows,缓存命中率、延迟和 HBM 使用都会受到影响,这说明真实推理负载会直接改变内存和存储需求。
第二,看采购与价格是否匹配。真实需求通常会体现在企业级 SSD 订单、近线 HDD 出货、HBM 和 DRAM 价格、供应商 backlog、长约和云厂商资本开支中。如果只有单季度价格上涨,但库存也在快速回升,可能是补库存;如果工作负载增长、长期采购和产品升级同时出现,真实需求的可信度更高。
第三,看成本约束。AI 存储需求不会无限增长,企业会在性能、成本、能耗、合规和可管理性之间做选择。KV cache compression、分层存储、冷热数据分离、模型量化、数据去重和选择性保存,都是控制成本的方式。NVIDIA Research 对 KV cache compression 的讨论也说明,压缩方法能改善长上下文推理的内存压力,但实际部署还会遇到生产基础设施限制。
| 判断维度 | 真需求信号 | 短期波动信号 |
|---|---|---|
| 训练 | 数据集扩大、GPU 利用率提升、checkpoint 增加 | 单次项目采购后需求减弱 |
| 推理 | token 量增长、并发提升、上下文变长 | 短期测试流量,不形成长期服务 |
| 数据保存 | 日志、备份、审计和数据治理需求增加 | 临时数据堆积,后续快速清理 |
| 采购 | 长约、持续订单、产品结构升级 | 渠道补库存、重复下单 |
| 价格 | 高端产品供给紧张且订单可见 | 价格过快上涨但库存回升 |
| 成本 | 分层存储和优化技术同步推进 | 预算收紧导致采购延后 |
如果你关注 AI 存储相关股票或 ETF,除了判断产业需求,也需要把交易成本纳入实际收益评估。美股交易成本通常不只包括佣金,还可能包括平台费、外部机构费、交易活动费、订单执行差异和结算相关费用。以 美股交易费用 为例,Biya 美股交易佣金为 0 美元,平台费、外部机构费及其他费用以费用中心和订单页面展示为准。相关服务是否可用,取决于用户所在地、身份验证结果、平台规则及适用法律法规;交易前仍应核对订单页、账单明细和当地监管要求。
判断 AI 存储需求,要看工作负载、采购、价格、库存和成本是否相互验证。真正的增长会在训练数据、推理 token、长上下文、RAG 调用、日志留存、企业级 SSD、近线 HDD 和数据中心资本开支中持续体现;短期库存波动则可能表现为价格先涨、渠道补货、库存回升和订单放缓。AI 存储需求的长期方向很重要,但投资和产业判断更需要关注节奏:哪些需求已经进入生产环境,哪些只是试点,哪些已经被价格和估值提前反映。
如果你持续关注 AI 基础设施、存储芯片、企业级 SSD、HDD、半导体 ETF、美股和港股相关标的,可以用 Biya 跟踪多资产行情、交易记录和账单变化。AI 算力和存储需求的判断不是一次性结论,训练、推理、数据保存、云厂商资本开支和企业订单都会持续变化。你也可以结合 美股信息查询 观察相关公司和行业变化,再根据自身所在地区、身份验证结果、平台规则和适用法律法规确认服务可用性。公开市场信息和费用结构仅供参考,不构成投资建议;实际交易前应充分了解订单类型、费用结构、波动风险和自身承受能力。
AI 算力增长会增加存储需求,因为训练、推理和数据保存都依赖数据读取、暂存、写入和长期留存。GPU 增加后,如果数据无法及时进入计算系统,算力利用率会下降,因此存储是 AI 基础设施的一部分。
AI 训练更重视高吞吐读取、checkpoint 写入和分布式数据管道;AI 推理更重视模型权重加载、KV cache、低延迟访问和高并发上下文管理。两者都需要存储,但瓶颈指标不同。
KV cache 会保存模型处理上下文时产生的中间状态,长上下文、多轮对话和高并发用户都会让 KV cache 增长。如果 HBM 不够,系统可能需要借助 DRAM、CXL memory 或 SSD 做分层缓存。
AI 数据保存不能只用高速 SSD,因为并不是所有数据都需要低延迟访问。训练热数据和在线推理需要高速存储,历史语料、日志、备份和归档更适合低成本大容量存储,如对象存储和近线 HDD。
普通投资者应观察训练数据规模、推理 token 量、企业级 SSD 订单、近线 HDD 需求、内存价格、库存和云厂商资本开支。如果多个指标同步增长,真实需求的可信度更高。
AI 存储需求增长不等于相关股票一定上涨。股价还受估值、库存、价格周期、竞争格局、客户集中度和市场预期影响。交易前应结合财报、订单、费用结构和自身风险承受能力判断。
*本文仅供参考,不构成 BiyaPay 或其子公司及其关联公司的法律,税务或其他专业建议,也不能替代财务顾问或任何其他专业人士的建议。
我们不以任何明示或暗示的形式陈述,保证或担保该出版物中内容的准确性,完整性或时效性。