HBM躺赚时代终结?一种容量暴涨16倍的闪存新怪物正在强行砸碎“内存墙”
全球前哨·2026年5月24日 · 技术内参
全球前哨编辑部 2026年5月24日 · 原创首发 HBF vs HBM
产业交锋的终点不是跑分,而是极致的物料平衡与资产核算。 行业研究员Eugene Ng披露的核心研究数据撕开了大模型推理时代的隐秘痛点:AI推理本质上是读密集型、容量受限的任务。当长上下文、海量KV缓存将高带宽存储器(HBM)的每GB成本推向病态高度时,使用NAND闪存颗粒替代DRAM、基于类似3D堆叠与TSV(硅通孔)技术的HBF(高带宽闪存)轰然入局,目标直指大模型就近放置的良率红线。

长期以来,AI训练与推理被强行锁死在昂贵的基于DRAM架构的HBM总线上。由于DRAM工艺本身的物理极限、极度复杂的堆叠良率缺损,导致HBM始终处于卖方寡头垄断的溢价泥潭中。而HBF在工艺底层通过高密度的NAND闪存替代DRAM,在每个堆叠中榨取出了惊人的**512 GB**海量容量,而即将步入产线的HBM4单堆叠容量仅为48-64 GB。这意味着,整个大型模型的参数权重可以全部就近放置在GPU物理封装内部,彻底切断了过去因溢出到较慢SSD而引发的总线延迟灾难。

先进封装线的TSV(硅通孔)工艺对多层晶圆的对齐公差要求达到了物理极限。HBF虽然在单次访问延迟上劣于HBM,但其利用了极其成熟的NAND高层数堆叠产线,避开了DRAM复杂的电容电荷保持期瓶颈,实现了工业级的大规模量产。
双核交锋层级:训练与推理分流引发的存储格局解构
根据冷峻的行业资产核算,HBF的出现绝非要全盘蚕食HBM的市场份额,而是在大模型商业化落地的转折点上,进行场景级的分流与精算:
层级一:读密集型推理层(HBF的主场)容量与成本刚性
核心数据:每GB成本低10-20倍 / 单堆叠容量高达 ~512 GB
随着全球AI计算的重心加速从“训练”向“推理服务(LLM Serving)”漂移,处理长上下文窗口和高吞吐量批处理时,内存容量的优先级已超越纯粹的超低延迟。HBF通过大规模NAND并行技术,堆叠出高达1.6 TB/s+的带宽。它不是要把HBM扫地出门,而是要在混合配置中接管“冷数据”与庞大的模型权重,彻底打破推理层面的“内存墙”。
层级二:超低延迟解码层(HBM的刚性阵地)延迟风控
拒绝假合格的混合配置
核心数据:死守“热数据”解码 / 频繁KV缓存更新的硬核低延迟
纯HBF配置由于闪存的固有物理特性,无法抹平高访问延迟。因此,在频繁进行KV更新以及模型解码期间的激活状态下,基于DRAM的传统HBM依然是不可逾越的护城河。混合配置(HBM + HBF)将成为未来大模型推理算力节点的最优物料平衡状态。
前哨洞察:打破三巨头寡头垄断,供应链韧性不相信虚妄的跑分
行业真正的病态在于,过去市场盲目崇拜纯DRAM架构下的吞吐跑分,进而默认了SK海力士、三星和美光三家巨头对AI高端内存市场的绝对统领。HBF的工艺切换,本质上是为更多的NAND玩家(如闪迪SanDisk、铠侠Kioxia等)敞开了一扇无摩擦准入的大门。从车间和供应链安全的宏观视角审视,不片面追求纸面指标、承认延迟公差并用容量换生存空间的做法,才能在实体产业的长跑中构筑起多层次、更有韧性的宏大生态。这才是真正清醒的工业资产核算。
全球前哨 · 哨所终局
HBF并不是HBM的替代者,而是大模型推理在成本和良率倒逼下衍生出的“工业现场纠偏”。这种异构存储组合,正在给整个半导体制造行业带来10倍速的格局刷新。
全球前哨世界变化太快。全球前哨,帮你提前发现。2026年5月24日 · 芯片存储基建解构 · 转载请注明来源
原文标题 : HBM躺赚时代终结?一种容量暴涨16倍的闪存新怪物正在强行砸碎“内存墙”
最新活动更多
-
5月30日立即报名>> 2026激光行业应用创新发展蓝皮书火热招编中!
-
5月31日立即申报>>> 维科杯•OFweek 2026激光行业年度评选
-
7月29日立即报名>> OFweek 2026集成电路制造工艺创新应用论坛
-
精彩回顾立即查看>> 开发前服,优化项目投资价值 筑牢落地关键防线
-
精彩回顾立即查看>> 【直播】 智测未来·2026海克斯康春季产品创新日
-
精彩回顾立即查看>> 百年约克,赋能绿色高效产线


分享










发表评论
登录
手机
验证码
手机/邮箱/用户名
密码
立即登录即可访问所有OFweek服务
还不是会员?免费注册
忘记密码其他方式
请输入评论内容...
请输入评论/评论长度6~500个字
暂无评论
暂无评论