订阅
纠错
加入自媒体

HBM躺赚时代终结?一种容量暴涨16倍的闪存新怪物正在强行砸碎“内存墙”

2026-05-29 16:31
全球前哨
关注

全球前哨·2026年5月24日  ·  技术内参

全球前哨编辑部 2026年5月24日 · 原创首发 HBF vs HBM

产业交锋的终点不是跑分,而是极致的物料平衡与资产核算。 行业研究员Eugene Ng披露的核心研究数据撕开了大模型推理时代的隐秘痛点:AI推理本质上是读密集型、容量受限的任务。当长上下文、海量KV缓存将高带宽存储器(HBM)的每GB成本推向病态高度时,使用NAND闪存颗粒替代DRAM、基于类似3D堆叠与TSV(硅通孔)技术的HBF(高带宽闪存)轰然入局,目标直指大模型就近放置的良率红线。

长期以来,AI训练与推理被强行锁死在昂贵的基于DRAM架构的HBM总线上。由于DRAM工艺本身的物理极限、极度复杂的堆叠良率缺损,导致HBM始终处于卖方寡头垄断的溢价泥潭中。而HBF在工艺底层通过高密度的NAND闪存替代DRAM,在每个堆叠中榨取出了惊人的**512 GB**海量容量,而即将步入产线的HBM4单堆叠容量仅为48-64 GB。这意味着,整个大型模型的参数权重可以全部就近放置在GPU物理封装内部,彻底切断了过去因溢出到较慢SSD而引发的总线延迟灾难。

高密贴片与先进封装晶圆多层堆叠工艺现场

先进封装线的TSV(硅通孔)工艺对多层晶圆的对齐公差要求达到了物理极限。HBF虽然在单次访问延迟上劣于HBM,但其利用了极其成熟的NAND高层数堆叠产线,避开了DRAM复杂的电容电荷保持期瓶颈,实现了工业级的大规模量产。

双核交锋层级:训练与推理分流引发的存储格局解构

根据冷峻的行业资产核算,HBF的出现绝非要全盘蚕食HBM的市场份额,而是在大模型商业化落地的转折点上,进行场景级的分流与精算:

层级一:读密集型推理层(HBF的主场)容量与成本刚性

核心数据:每GB成本低10-20倍 / 单堆叠容量高达 ~512 GB

随着全球AI计算的重心加速从“训练”向“推理服务(LLM Serving)”漂移,处理长上下文窗口和高吞吐量批处理时,内存容量的优先级已超越纯粹的超低延迟。HBF通过大规模NAND并行技术,堆叠出高达1.6 TB/s+的带宽。它不是要把HBM扫地出门,而是要在混合配置中接管“冷数据”与庞大的模型权重,彻底打破推理层面的“内存墙”。

层级二:超低延迟解码层(HBM的刚性阵地)延迟风控

 拒绝假合格的混合配置

核心数据:死守“热数据”解码 / 频繁KV缓存更新的硬核低延迟

纯HBF配置由于闪存的固有物理特性,无法抹平高访问延迟。因此,在频繁进行KV更新以及模型解码期间的激活状态下,基于DRAM的传统HBM依然是不可逾越的护城河。混合配置(HBM + HBF)将成为未来大模型推理算力节点的最优物料平衡状态。

前哨洞察:打破三巨头寡头垄断,供应链韧性不相信虚妄的跑分

行业真正的病态在于,过去市场盲目崇拜纯DRAM架构下的吞吐跑分,进而默认了SK海力士、三星和美光三家巨头对AI高端内存市场的绝对统领。HBF的工艺切换,本质上是为更多的NAND玩家(如闪迪SanDisk、铠侠Kioxia等)敞开了一扇无摩擦准入的大门。从车间和供应链安全的宏观视角审视,不片面追求纸面指标、承认延迟公差并用容量换生存空间的做法,才能在实体产业的长跑中构筑起多层次、更有韧性的宏大生态。这才是真正清醒的工业资产核算。

全球前哨 · 哨所终局

HBF并不是HBM的替代者,而是大模型推理在成本和良率倒逼下衍生出的“工业现场纠偏”。这种异构存储组合,正在给整个半导体制造行业带来10倍速的格局刷新。

全球前哨世界变化太快。全球前哨,帮你提前发现。2026年5月24日 · 芯片存储基建解构 · 转载请注明来源

       原文标题 : HBM躺赚时代终结?一种容量暴涨16倍的闪存新怪物正在强行砸碎“内存墙”

声明: 本文由入驻维科号的作者撰写,观点仅代表作者本人,不代表OFweek立场。如有侵权或其他问题,请联系举报。

发表评论

0条评论,0人参与

请输入评论内容...

请输入评论/评论长度6~500个字

您提交的评论过于频繁,请输入验证码继续

暂无评论

暂无评论

    半导体 猎头职位 更多
    文章纠错
    x
    *文字标题:
    *纠错内容:
    联系邮箱:
    *验 证 码:

    粤公网安备 44030502002758号