HBM躺赚时代终结？一种容量暴涨16倍的闪存新怪物正在强行砸碎“内存墙”

2026-05-29 16:31

全球前哨·2026年5月24日 · 技术内参

全球前哨编辑部 2026年5月24日 · 原创首发 HBF vs HBM

产业交锋的终点不是跑分，而是极致的物料平衡与资产核算。 行业研究员Eugene Ng披露的核心研究数据撕开了大模型推理时代的隐秘痛点：AI推理本质上是读密集型、容量受限的任务。当长上下文、海量KV缓存将高带宽存储器（HBM）的每GB成本推向病态高度时，使用NAND闪存颗粒替代DRAM、基于类似3D堆叠与TSV（硅通孔）技术的HBF（高带宽闪存）轰然入局，目标直指大模型就近放置的良率红线。

长期以来，AI训练与推理被强行锁死在昂贵的基于DRAM架构的HBM总线上。由于DRAM工艺本身的物理极限、极度复杂的堆叠良率缺损，导致HBM始终处于卖方寡头垄断的溢价泥潭中。而HBF在工艺底层通过高密度的NAND闪存替代DRAM，在每个堆叠中榨取出了惊人的**512 GB**海量容量，而即将步入产线的HBM4单堆叠容量仅为48-64 GB。这意味着，整个大型模型的参数权重可以全部就近放置在GPU物理封装内部，彻底切断了过去因溢出到较慢SSD而引发的总线延迟灾难。

高密贴片与先进封装晶圆多层堆叠工艺现场

先进封装线的TSV（硅通孔）工艺对多层晶圆的对齐公差要求达到了物理极限。HBF虽然在单次访问延迟上劣于HBM，但其利用了极其成熟的NAND高层数堆叠产线，避开了DRAM复杂的电容电荷保持期瓶颈，实现了工业级的大规模量产。

双核交锋层级：训练与推理分流引发的存储格局解构

根据冷峻的行业资产核算，HBF的出现绝非要全盘蚕食HBM的市场份额，而是在大模型商业化落地的转折点上，进行场景级的分流与精算：

层级一：读密集型推理层（HBF的主场）容量与成本刚性

核心数据：每GB成本低10-20倍 / 单堆叠容量高达 ~512 GB

随着全球AI计算的重心加速从“训练”向“推理服务（LLM Serving）”漂移，处理长上下文窗口和高吞吐量批处理时，内存容量的优先级已超越纯粹的超低延迟。HBF通过大规模NAND并行技术，堆叠出高达1.6 TB/s+的带宽。它不是要把HBM扫地出门，而是要在混合配置中接管“冷数据”与庞大的模型权重，彻底打破推理层面的“内存墙”。

层级二：超低延迟解码层（HBM的刚性阵地）延迟风控

拒绝假合格的混合配置

核心数据：死守“热数据”解码 / 频繁KV缓存更新的硬核低延迟

纯HBF配置由于闪存的固有物理特性，无法抹平高访问延迟。因此，在频繁进行KV更新以及模型解码期间的激活状态下，基于DRAM的传统HBM依然是不可逾越的护城河。混合配置（HBM + HBF）将成为未来大模型推理算力节点的最优物料平衡状态。

前哨洞察：打破三巨头寡头垄断，供应链韧性不相信虚妄的跑分

行业真正的病态在于，过去市场盲目崇拜纯DRAM架构下的吞吐跑分，进而默认了SK海力士、三星和美光三家巨头对AI高端内存市场的绝对统领。HBF的工艺切换，本质上是为更多的NAND玩家（如闪迪SanDisk、铠侠Kioxia等）敞开了一扇无摩擦准入的大门。从车间和供应链安全的宏观视角审视，不片面追求纸面指标、承认延迟公差并用容量换生存空间的做法，才能在实体产业的长跑中构筑起多层次、更有韧性的宏大生态。这才是真正清醒的工业资产核算。

全球前哨 · 哨所终局

HBF并不是HBM的替代者，而是大模型推理在成本和良率倒逼下衍生出的“工业现场纠偏”。这种异构存储组合，正在给整个半导体制造行业带来10倍速的格局刷新。

全球前哨世界变化太快。全球前哨，帮你提前发现。2026年5月24日 · 芯片存储基建解构 · 转载请注明来源