YC科技资讯网

高带宽闪存:面向AI数据中心与边缘计算的全新存储技术

人工智能(AI)正势不可挡地席卷整个计算领域。尽管目前全球仅约七分之一的数据中心具备承载AI工作负载的能力,但到2030

人工智能(AI)正势不可挡地席卷整个计算领域。尽管目前全球仅约七分之一的数据中心具备承载AI工作负载的能力,但到2030年,这一比例预计将接近70%¹。AI正从超大规模数据中心迁移至企业级数据中心,并进一步部署至网络边缘——边缘AI应用预计在2030年底将创造近665亿美元的价值²。数据是这一全新计算时代的驱动力。海量数据必须高速传输至需求迫切且快速扩展的AI计算基础设施中。

然而,海量内容库正在让传统存储架构不堪重负,其固有的架构劣势也彻底显现。数据中心内存(DRAM 及专用高带宽内存HBM)在密度、存储容量与可扩展性方面,逐渐难以应对大型AI模型日益增长的需求。与此同时,超大规模计算厂商正面对DRAM与HBM攀升的生产成本、提升的设计复杂度及增加的能耗。在企业级数据中心与边缘AI应用场景中,这一挑战更为严峻 —— 受限于更小的物理空间,此类场景难以承受持续上涨的内存成本与功耗。

同时,AI推理也带来了一些亟待解决的问题。作为当下主流的AI工作负载,AI推理在数据管理方面的要求与AI训练截然不同:推理需要存储规模持续扩大的AI模型,而基于HBM与DRAM的内存方案已难以满足这些新需求,其在容量与成本可扩展性上存在明显短板。面对这些显著差异的内存特性,市场亟需一种专为AI推理优化的内存技术。

为何DRAM与HBM无法满足AI推理工作负载需求?

要理解为何仅DRAM与HBM并不适合AI的长期部署,可参考以下弊端³。这些问题起初只是细微隐患,但若不加以解决,将随时间推移不断扩大,最终动摇以AI为核心的下一代存储架构根基。

密度瓶颈:DRAM容量扩展已陷入停滞,而支撑AI推理所需的容量需求却持续攀升。³

与AI推理不匹配:DRAM在低时延、随机访问方面的优势,对AI推理而言并不适用。AI推理的访问模式具备确定性,借助数据预取等技术对时延有更高的包容度。³

面向AI推理优化的内存架构特性

规模达1,200亿美元的DRAM产业⁴正面临上述深层矛盾。鉴于超大规模服务商在AI基础设施领域的支出有望在2030年底达到6.7万亿美元⁵,该产业迫切希望稳固自身在数据中心领域的既有地位。

如果现在正是彻底重新打造一款贴合应用需求的全新存储解决方案的时机,而非让应用去适配现有存储,结果会如何?一款为AI优化的存储级内存应具备以下特性:

更大规模且可扩展的内存容量,专为推理工作负载配置更高的内存密度(GB/mm²)高带宽,满足AI推理需求更低的系统级功耗高性价比指标(美元/ TB)

高带宽闪存意指AI数据中心

高带宽闪存(HBF™)是一款颠覆性的新型内存架构,专为支持推动新一代AI计算而设计。HBF满足了高级计算及数据密集型应用对容量、能耗、吞吐量及可扩展性的核心要求。相较于HBM,HBF在保持同等带宽的前提下,提供了更高的容量与存储密度,更贴合AI推理的发展趋势。作为一种持久性存储介质,HBF在断电时仍能保留数据,且具备热稳定性,可支持高温运行环境⁶。

为实现这些优势,HBF通过优化高带宽特性与推理内存属性,对NAND闪存进行了高效重构。采用外围电路直接键合到存储阵列(CBA)晶圆技术,进一步提升了能效与带宽。

HBF重塑面向AI应用的NAND闪存

相较于传统NAND闪存,HBF通过并行架构、先进逻辑缩放工艺与定制化堆叠技术,实现更低时延与超高的读取带宽,让大语言模型以接近DRAM的速度流式读取数据⁶。

HBF还支持大型KV缓存,可高效处理冗长复杂的用户提示词,以及客户专属与领域专属数据,助力提升AI推理准确率。

以内存为中心的AI延伸至企业级场景与网络边缘

由于受密度、成本与功耗限制,HBM通常无法用于边缘与移动环境,而HBF可凭借更大存储容量,实现处理更复杂AI推理任务的价值。这为智能手机等边缘设备打开了应用空间,帮助其能够实时决策并执行各类复杂任务。凭借持久性存储的特性,HBF支持从历史查询中无缝调取过往上下文,以解决新问题。

HBF的优势可同样延伸至企业级计算场景。这类场景的用户规模远小于超大规模数据中心,而依托HBM的大型GPU集群成本过高。通过采用搭载HBF的加速方案,小型企业有望对大型预训练模型进行调优,以支持领域专属应用需求。

优化的存储解决方案突破AI计算增长的阻碍

在我们身边,数据中心与边缘AI设备正自主运行,支撑从“晚餐食谱”查询到“突破性科学发现”的各类任务。网站托管、企业数据管理等常规任务,正逐步让位于依托机器学习、深度学习与数据分析来生成实用洞察的智能工作负载。

如今的数据中心与边缘存储亟需重新规划,以支撑大规模推理模型执行预测与生成任务。相较于HBM,HBF在具备显著容量优势的同时,可提供AI推理应用所需的高吞吐量⁶。作为可扩展的全新系统级存储技术,HBF有助于减少性能瓶颈,加快现代数据中心与边缘网络中AI应用的洞察生成速度。

###

参考文献

1 B. Srivathsan 、M. Sorel 、 P. Sachdeva,联合 A. Bhan 、 H. Batra 、 R. Sharma 、 R. Gupta 以及 S. Choudhary,麦肯锡咨询公司,《AI 算力:扩容数据中心以满足日益增长的需求》(2024 年 10 月)

2 Grand View Research,《边缘 AI 市场规模、份额及趋势分析报告 —— 按组件(硬件、软件、服务)、终端行业(消费电子、智慧城市、汽车)、地区及细分领域预测,2025—2030》

3 S. Legtchenko 、I. Stefanovici 、R. Black 、A. Rowstron 、J. Liu 、P. Costa 、B. Canakci 、D. Narayanan 、X. Wu,微软研究院,《受控保留内存:面向 AI 时代的全新内存品类》,康奈尔大学(2025 年 1 月)

4Fortune Business Insights,《DRAM 市场规模、份额及行业分析……》(2026 年 2 月)

5 J. Noffsinger、M. Patel、P. Sachdeva、联合A. Bhan、H. Chang以及M. Goodpaster,麦肯锡咨询公司,《计算成本:一场7 万亿美元规模的数据中心扩张竞赛》(2025 年 4 月)

6 HBF 技术资料页,闪迪,《闪迪发布面向 AI 的未来存储架构:高带宽闪存(HBF)》(2025 年 7 月)