
HBM 供应紧张,核心不是“内存厂少生产一点”,而是 AI 算力需求、先进 DRAM 晶圆、TSV 堆叠、CoWoS 封装、良率爬坡和大客户长约同时卡住。你如果关注 AI 芯片、存储股、半导体周期或美股科技产业链,就不能只看 GPU 订单,还要看 HBM3E、HBM4、先进封装和客户锁量如何共同决定最终交付能力。

HBM 供应紧张的第一层原因,是 AI 服务器从“计算中心”变成了“计算加内存带宽中心”。大模型训练、推理、长上下文、KV Cache 和多模态任务都需要持续把数据喂给 GPU 或 AI ASIC;如果内存带宽跟不上,再强的计算核心也会等待数据。你可以把 HBM 理解成 AI 加速器旁边的高速数据通道,它不是普通服务器 DRAM 的简单升级,而是高端 AI 芯片性能的一部分。
这一点可以从主流 AI 加速器规格看出来。NVIDIA H200 使用 141GB HBM3E,并提供 4.8TB/s 内存带宽;AMD Instinct MI300X 则配置 192GB HBM3,峰值内存带宽约 5.3TB/s。也就是说,AI 芯片竞争已经不是只比算力,还要比每颗加速器可以带多少 HBM、带宽多高、能效是否足够好。
| 需求场景 | 为什么需要 HBM | 对供应的影响 |
|---|---|---|
| 大模型训练 | 参数和梯度传输频繁 | 单卡 HBM 容量和带宽上升 |
| 大模型推理 | KV Cache 占用大量内存 | HBM 从训练扩展到推理 |
| AI ASIC | 定制芯片也需要高速内存 | 客户来源不再只有 GPU 厂商 |
| 多模态模型 | 图像、视频、文本数据更复杂 | 带宽压力继续增加 |
HBM3E 到 HBM4 的升级,还会进一步放大这种需求。SK hynix HBM4 采用 2,048 个 I/O 端口,带宽较上一代提升,并改善功耗效率;Micron HBM4 36GB 12H 产品则强调超过 2.8TB/s 的带宽。规格越高,单颗 AI 芯片消耗的高端内存资源越多,供应链也越难快速放量。
小结:HBM 紧张不是短期炒作,而是 AI 服务器架构变化带来的结果。你判断 HBM 供需时,不能只问“内存厂有没有扩产”,还要问 AI GPU、AI ASIC、推理集群和下一代平台是否继续提高 HBM 容量与带宽。只要 AI 芯片性能越来越依赖 memory bandwidth,HBM 就会从配套零部件变成关键战略资源。

HBM 扩产慢,是因为它不是普通 DRAM 换个包装就能出货。HBM 需要先进 DRAM 裸片、TSV 硅通孔、微凸点、堆叠、键合、封装、测试和客户认证一起成功。任何一个环节良率不稳定,最终可交付 HBM 都会低于理论产能。你看到的“扩产计划”,往往要经过设备安装、工艺调试、良率爬坡和客户验证,才会变成真正出货。
HBM 的基本流程可以简化为:
这也是为什么 HBM 扩产会挤压普通 DRAM。TrendForce 预计,前三大供应商的 HBM 晶圆投片占 DRAM 总投片比例 将从 2025 年底约 18%,升至 2026 年底约 22%,并在 2027 年底达到约 30%;但 HBM bit supply 占 DRAM bit supply 的比例同期仅约 8%、9% 和 13%。这说明 HBM 非常“吃晶圆”,但转换成有效 bit 供应并不高。
| 资源类型 | HBM 扩产占用方式 | 可能影响 |
|---|---|---|
| DRAM 晶圆 | 高端制程和投片转向 HBM | DDR5、服务器 DRAM 供应变紧 |
| 工程团队 | 需要先进封装和良率经验 | 新产线爬坡速度受限 |
| 测试资源 | 高带宽、高可靠性验证更复杂 | 交付周期拉长 |
| 客户认证 | 必须适配 GPU/ASIC 平台 | 产能不等于立即出货 |
Micron 在 2026 财年 Q3 prepared remarks 中也提到,绿色地新厂扩建规模大、复杂且耗时,还受到建设周期、熟练工人、许可和能源基础设施限制。这类表述说明,HBM 紧张背后不是厂商不愿意扩产,而是先进半导体制造本身很难在几个季度内完成供给跃迁。
小结:HBM 的产能瓶颈不是单点问题,而是晶圆、工艺、堆叠、良率、测试和客户认证叠加后的结果。你看到一家公司宣布资本开支上升,并不代表 HBM 供应马上宽松。真正有用的观察指标,是 HBM wafer starts、yield ramp、客户认证进度和最终交付量,而不是单纯的扩产口号。

HBM 供应紧张的第二个关键,是先进封装跟不上。HBM 不能像普通内存条那样插在主板上,它要和 GPU die 或 AI ASIC die 放在同一个高密度封装系统里,通过中介层实现超宽接口连接。也就是说,哪怕 HBM 裸片已经生产出来,如果 CoWoS、interposer、ABF substrate 或测试产能不足,AI 加速器仍然不能按时交付。
TSMC CoWoS®-S 的介绍中明确提到,这类封装用于 AI 和超级计算等高性能场景,可在大型 silicon interposer 上集成逻辑 chiplet 和 HBM cubes。这里的核心不是“最后组装”,而是系统级集成:GPU/ASIC、HBM、RDL、硅中介层、基板和散热结构必须协同工作。
| 先进封装组成 | 作用 | 为什么会卡供给 |
|---|---|---|
| GPU/ASIC die | 提供计算能力 | 先进制程产能有限 |
| HBM stack | 提供高带宽内存 | 堆叠良率和认证复杂 |
| Interposer | 连接逻辑芯片与 HBM | 面积变大后制造更难 |
| ABF 基板 | 承载高端封装 | 上游材料和交期受限 |
| 测试环节 | 验证性能与可靠性 | 大封装测试时间更长 |
TrendForce 指出,AI 需求自 2023 年快速上升后,3nm–2nm 晶圆和 2.5D/3D 先进封装都出现瓶颈,尤其是 CoWoS 短缺 已经延伸到设备、基板、封装材料等环节。后续扩产会缓解部分压力,但 TrendForce 对 全球 2.5D 封装紧缺 的判断是,严重短缺预计到 2027 年才开始缓和。
所以,HBM 分析不能只盯着 SK hynix、Samsung、Micron 三家内存厂。你还要同时看 TSMC、OSAT、基板厂、测试设备、热管理和客户平台导入节奏。先进封装越复杂,供应链越像一个木桶;最短的那块木板,可能不是 HBM 裸片,而是 CoWoS 产能或基板交付。
小结:HBM 要真正进入 AI 服务器,必须先和 GPU/ASIC 完成 2.5D advanced packaging。CoWoS、interposer、ABF 基板和测试能力不足时,HBM 即使生产出来,也不能马上转化为 AI 芯片出货。你判断 HBM 拐点时,应把存储产能和封装产能放在同一张图里看。
HBM 长约会加剧市场紧张,因为它把未来几年产能提前分配给核心客户。云厂商、GPU 厂商和 AI ASIC 客户最怕的不是短期贵一点,而是产品路线图被供应链打断。因此,大客户愿意提前锁定 HBM、DRAM、NAND 和封装资源,供应商也愿意用长期协议换取收入可见性和扩产信心。对中小客户来说,剩余可分配供应自然更少。
Micron 在 2026 财年 Q3 业绩材料 中披露,其已签署 16 份 Strategic Customer Agreements,并称多年期协议会提升业绩耐久性和可预测性。更详细的 prepared remarks 还提到,这些协议通常覆盖 2026 年到 2030 年,并采用 take-or-pay 结构,客户承诺购买特定数量。这样的安排会让供应商更敢于投资,但也会让公开市场可获得供给变少。
| 长约条款 | 对客户的意义 | 对供应商的意义 | 对市场的影响 |
|---|---|---|---|
| 多年期采购 | 锁定产品路线图 | 提高收入可见性 | 未来产能提前分配 |
| take-or-pay | 获得供应确定性 | 降低扩产风险 | 现货弹性下降 |
| 价格区间 | 降低预算不确定性 | 稳定毛利预期 | 价格波动被部分锁定 |
| 客户认证绑定 | 确保平台适配 | 提升客户黏性 | 新客户切入更难 |
长约不等于“人为制造短缺”,更准确的理解是:当行业已经供不应求时,强势客户会先把未来产能锁住。剩下的客户可能面对更长交期、更弱议价权和更高采购不确定性。HBM 市场尤其明显,因为客户不只是买内存,还需要与 GPU/ASIC 平台共同设计、验证和排产。
这也解释了为什么你经常看到“某供应商产能已被预订”“某客户提前锁量”等信息。它们不是简单的销售新闻,而是产业链进入战略资源分配阶段的信号。HBM 越关键,客户越不愿意依赖短周期采购;供应商越确定需求,越愿意把产能给付款能力强、认证深度高、路线图清晰的大客户。
小结:客户长约不是 HBM 短缺的唯一原因,但会显著改变供需节奏。它提高了大客户的供应确定性,也提高了供应商扩产信心;同时,未提前锁量的客户会更难拿到优先供应。你分析 HBM 价格和库存时,应关注长约覆盖比例、价格区间、take-or-pay 条款和客户平台认证,而不是只看现货报价。
HBM 市场集中度高,意味着少数供应商的良率、认证和产能节奏会影响全球供应。当前能够大规模供应 HBM 的主要是 SK hynix、Samsung 和 Micron。你不需要把三家公司简单排成“谁一定赢”,更重要的是看谁在 HBM3E、HBM4、先进封装合作和大客户认证上更快形成可交付能力。
SK hynix 2026 市场展望 引用 Counterpoint Research 数据称,SK hynix 在 2025 年 Q2 HBM 出货份额为 62%,并认为 HBM3E 仍将是 2026 年旗舰产品,HBM4 份额逐步提升。这说明 HBM 不是一个完全开放竞争的普通 DRAM 市场,领先厂商会因为客户关系、量产经验和封装协同形成阶段性优势。
Samsung 的变量在于客户认证和产品迭代节奏。Samsung HBM 强调 TSV-based stacking、高吞吐和 AI/HPC 工作负载,但在实际产业判断中,你仍需要看具体代际产品是否进入大客户平台、是否形成稳定出货、是否获得足够封装资源。Micron 的变量则在于 HBM4、HBM4E 和高容量服务器内存的同步爬坡,其 HBM4 高量出货信息已经显示其在下一代平台中提高存在感。
| 供应商 | 核心看点 | 主要变量 |
|---|---|---|
| SK hynix | HBM3E 份额、HBM4 量产准备 | 领先优势能否延续到 HBM4 |
| Samsung | DRAM 制造规模和 HBM 产品线 | 大客户认证和良率爬坡 |
| Micron | HBM4、HBM4E 和长约客户 | 先进封装产能与交付速度 |
对于投资者来说,供应商格局决定了 HBM 紧张会如何转化为利润。高集中度有利于议价能力,但也会让市场对单一公司的良率、客户关系和资本开支非常敏感。任何一家供应商突破量产瓶颈,都可能缓解局部供给;任何一家供应商认证延迟,也可能让紧张状态延续。
小结:HBM 供应节奏高度依赖少数厂商,而不是普通商品市场那样快速新增参与者。你看 SK hynix、Samsung、Micron 时,应重点比较 HBM3E/HBM4 良率、客户认证、封装合作、长约覆盖和资本开支执行。谁能把技术领先转化为稳定出货,谁就更能影响全球 HBM 供需平衡。
HBM 供应紧张会同时影响存储价格、AI 服务器交付和半导体投资判断。短期看,供需紧张会支撑高端存储议价能力;中期看,扩产、良率提升和客户自研 ASIC 会改变供需斜率;长期看,AI 资本开支是否持续增长,决定 HBM 繁荣能否穿越周期。你不能只看“缺货”两个字,还要看缺货是否已经被估值充分反映。
TrendForce 对 HBM 合约价格 的判断是,随着 HBM 代际升级、die size 增大和需求上升,供应商在 2027 年价格谈判中可能拥有更强话语权。这个逻辑也会传导到普通 DRAM,因为 HBM 投片比例上升会占用先进 DRAM 资源,服务器 DDR5、RDIMM、LPDDR 等产品也可能受到间接影响。
| 观察指标 | 代表含义 | 对判断的作用 |
|---|---|---|
| HBM 投片比例 | 厂商资源是否继续转向 HBM | 判断普通 DRAM 是否被挤压 |
| CoWoS 月产能 | AI 芯片能否最终交付 | 判断封装瓶颈是否缓解 |
| HBM4 客户认证 | 下一代平台导入速度 | 判断新增供给质量 |
| 长约覆盖比例 | 未来供应是否被锁定 | 判断现货弹性 |
| DRAM 合约价 | 价格是否外溢到普通内存 | 判断周期强度 |
| AI 资本开支 | 需求是否继续扩张 | 判断长期景气度 |
如果你准备根据 HBM、AI 芯片或美股半导体产业链做交易判断,除了关注股价弹性,也需要关注真实交易成本。美股交易成本通常不只包括佣金,还可能包括平台费、外部机构费、交易活动费等。比如 Biya 美股交易费用 说明中,美股交易佣金为 0 美元,平台费、外部机构费及其他费用以费用中心和订单页面展示为准。交易前核对费用结构,比只看“0 佣金”更稳妥。
你还需要区分产业逻辑和投资收益。HBM 紧张可能提升部分供应商利润,但股票价格还会受到估值、市场预期、客户集中度、地缘政策、反垄断诉讼、供应扩张和 AI 资本开支变化影响。供应紧张是真实产业变量,不等于股价一定上涨;产能扩张是真实改善方向,也不等于价格马上下跌。
小结:HBM 紧张会支撑高端存储议价能力,并影响 AI 服务器交付节奏,但投资判断不能停留在缺货新闻。你应同时跟踪 HBM3E/HBM4 出货、CoWoS 扩产、长约价格、DRAM 合约价、AI 资本开支和估值位置。只有需求持续、供应释放慢、价格仍有支撑时,产业紧张才更可能转化为财务弹性。
如果你长期跟踪 HBM、AI 芯片、GPU、存储股和美股半导体产业链,可以把研究重点放在“公开资料 + 财报数据 + 费用核对 + 风险控制”四件事上。你可以通过 Biya 关注美股与港股相关资产,也可以用 美股信息查询 跟踪半导体公司基础信息。相关服务是否可用,取决于用户所在地、身份验证结果、平台规则及适用法律法规;交易前也应充分理解订单类型、费用结构和价格波动风险。公开市场信息只能帮助你建立判断框架,不构成投资建议。
HBM 供应短期内很难完全宽松,关键要看 HBM4 良率、DRAM 投片、CoWoS 扩产和客户长约节奏。如果先进封装到 2027 年才逐步缓解,HBM 供需也可能呈现阶段性紧张,而不是突然反转。
HBM 短缺可能推高普通 DRAM 价格,因为 HBM 会占用先进 DRAM 晶圆、工程资源和洁净室空间。不过普通 DRAM 价格还受 PC、手机、服务器库存、合约价和客户采购节奏影响,不能只看 HBM 一个变量。
CoWoS 产能不足会影响 HBM 交付,因为 HBM 必须与 GPU 或 AI ASIC 通过 2.5D 封装集成。即使 HBM 裸片已经完成生产,只要 interposer、基板、封装或测试环节不足,最终 AI 加速器仍可能延迟出货。
HBM 长期供货协议意味着供应商收入可见性提高,大客户也能获得更稳定的产能分配。但这不等于相关股票没有风险,投资者仍要看协议价格、履约义务、客户集中度、扩产速度和估值是否已经反映乐观预期。
HBM4 量产会增加高端供给,但不一定马上让市场宽松。新一代产品初期通常面临良率爬坡、客户认证、封装资源和大客户优先分配问题,因此 HBM4 可能先提高性能上限,再逐步改善实际供应。
普通投资者可以跟踪六类信号:供应商财报中的 HBM 指引、HBM 投片比例、CoWoS 月产能、HBM4 客户认证、DRAM 合约价和 AI 服务器订单。交易决策还应结合费用、估值、风险承受能力和当地监管要求。
*本文仅供参考,不构成 BiyaPay 或其子公司及其关联公司的法律,税务或其他专业建议,也不能替代财务顾问或任何其他专业人士的建议。
我们不以任何明示或暗示的形式陈述,保证或担保该出版物中内容的准确性,完整性或时效性。

