YC科技资讯网

几十GB大模型秒加载!助力Token吞吐飙升,忆联AM6D1 SSD击...

随着AI大模型从云端向终端加速落地,本地部署大语言模型(LLM)正成为开发者和企业的刚需——无需依赖网络、无延迟响应、数

随着AI大模型从云端向终端加速落地,本地部署大语言模型(LLM)正成为开发者和企业的刚需——无需依赖网络、无延迟响应、数据隐私零泄露,且可灵活微调模型参数。然而,当模型参数膨胀至百亿甚至千亿级,Token吞吐量便成为衡量本地AI体验的核心指标:从模型加载到首个Token生成,再到连续推理过程中的Token流畅度,每一个环节都依赖于存储性能。

以Qwen3-235B-A22B为例,其109.25GB的庞大体量,若存储带宽不足,不仅模型加载耗时数分钟,更会导致Token生成卡顿、推理延迟飙升,让本地AI形同虚设。传统PCIe 4.0 SSD早已捉襟见肘,而高端PCIe 5.0产品又普遍存在成本高、功耗大的痛点。

正是在这样的市场需求驱动下,国产存储领军企业忆联推出了兼顾性能与成本的AM6D1 DRAMLess PCIe 5.0 SSD。那么,它在实际测试中表现如何,能否实现“秒加载、高吞吐”?我们一测究竟。

产品规格

接口:PCIe 5.0 x4

主控:PCIe 5.0 4通道主控

闪存:3D堆叠TLC闪存芯片

缓存:N/A

板型:M.2 2242/M.2 2280

可选容量:512GB、1TB、2TB

板型:M.2 2242/M.2 2280

耐久度:200TBW(512GB)、400TBW(1TB)、800TBW(2TB)

基于PCIe 5.0 DRAMLess高性价比解决方案

由于需要达成高速度、低成本与低功耗的目标,忆联AM6D1 PCIe 5.0固态硬盘与那些基于8通道主控芯片、独立缓存的PCIe 5.0产品不同,它采用PCIe 5.0 4通道DRAMLess主控,相比8通道方案有效降低了SSD的功耗、发热量与成本。同时这款产品支持ASPM L1.2低功耗模式,在深度休眠模式下的标称功耗可降至3mW以下,能够显著延长笔记本电脑、游戏掌机等移动设备的电池续航时间。DRAMLess无独立缓存主控芯片的采用还意味着,无须配备价格高高在上的内存颗粒,固态硬盘将通过HMB主机高速缓冲技术,占用少量系统内存作缓存来临时保存已从闪存读取的数据、要写入闪存的数据,以及地址映射表,从而有效提升SSD的I/O性能——其标称顺序读写速度分别可达11400MB/s、10900MB/s,随机4K读写性能分别为1600K IOPS、1150K IOPS。

▲本次我们对M.2 2242板型的忆联AM6D1 PCIe 5.0固态硬盘2TB产品进行了测试

同时该产品还采用了高性能、高密度的3D堆叠TLC闪存颗粒。目前忆联AM6D1 PCIe 5.0固态硬盘有512GB、1TB与2TB三种容量,以及M.2 2242、M.2 2280两种板型供用户选择,可以分别适配移动平台与台式机。

▲忆联AM6D1 PCIe 5.0固态硬盘2TB产品上只有1颗主控、1颗闪存芯片与1颗PMIC电源管理芯片。

▲忆联AM6D1 PCIe 5.0固态硬盘2TB的PCB背面没有任何元器件

接下来我们特别搭建了基于AMD锐龙9 9950X、32GB DDR5 6000双通道内存、X870E主板与Radeon RX 9070XT显卡的测试平台,对忆联AM6D1 PCIe 5.0固态硬盘2TB进行了测试。需要提及的是,在进行3DMark存储性能测试、PCMark完整系统盘测试时,为更好地发挥固态硬盘的随机性能,我们则换用基于酷睿i9-14900K、Z790主板与GeForce RTX 5070显卡的英特尔平台。

▲像ROG主板这类产品拥有相关扣具,也能在台式机主板上轻松安装忆联AM6D1 M.2 2242板型的产品。

测试平台

主板:ROG CROSSHAIR X870E DARK HERO主板

处理器:AMD锐龙9 9950X

内存:DDR5 6000 CL28 32GB内存套装

硬盘:忆联AM6D1 PCIe 5.0固态硬盘2TB

显卡:蓝宝石RX 9070XT极地OC显卡

电源:ROG THOR 1200W

操作系统:Windows 11 25H2

超越标称规格

首先从基准测试来看,凭借采用高性能PCIe 5.0 4通道DRAMLess主控、3D堆叠TLC闪存颗粒,忆联AM6D1 PCIe 5.0固态硬盘2TB的确有非常不错的表现。在CrystalDiskMark测试中,它的顺序读取速度突破了11400MB/s的标称规格,测试成绩为11481.24MB/s。其顺序写入速度则达到10961.49MB/s,也超过了10900MB/s的标称顺序写入速度,相比PCIe 4.0 SSD的确有很大的提升。

▲忆联AM6D1 PCIe 5.0固态硬盘2TB的CrystalDiskMark测试成绩

在随机性能测试中,忆联AM6D1 PCIe 5.0固态硬盘2TB在随机4K Q32T16读写测试中的成绩分别达到6737.16MB/s、7335.72MB/s。换算过来,其随机4K读写性能分别可达1664K IOPS、1790K IOPS。而这款固态硬盘的标称随机4K读写性能分别为1600K IOPS、1150K IOPS,其读取成绩小幅超越标称规格,写入性能则大幅超过标称的1150K IOPS。

▲以IOPS为单位显示的CrystalDiskMark测试成绩

仅需10.52s载入32B模型,不到55s载入235B大模型

目前大语言模型已经成为用户越来越离不开的生产工具。在本地部署、应用大语言模型时,通常有两大特点:这类模型会占用很大的存储空间;同时,在载入、调用大模型时,也需要固态硬盘具有较高的读取速度,才能快速地将模型数据传输给内存与显存,以减少载入耗时。首先,我们在仅有32GB内存配置的环境下,体验了DeepSeek-R1-Distill-Qwen-32B模型,该模型容量为19.97GB。由于模型容量接近20GB,所以加载这个模型之后留给系统的可用内存并不多,很可能会影响电脑的运行速度。不过,好在凭借忆联AM6D1 PCIe 5.0固态硬盘2TB强劲的传输性能,它仅需10.52s就能将模型数据传输到内存中,且测试平台以9.01tok/s的词元生成速度完成用户的任务。

▲借助忆联AM6D1 PCIe 5.0固态硬盘2TB,测试平台载入32B模型耗时仅需10.52s。

接下来,我们加大难度,通过采用128GB DDR5 6000内存,来测试搭配忆联AM6D1 PCIe 5.0固态硬盘2TB载入Qwen3-235B-A22B大模型的表现,这款模型的容量高达109.25GB。它是一个拥有235B总参数和22B激活参数的MoE(混合专家)模型,在代码、数学和通用能力等基准测试中与DeepSeek-R1、OpenAI-o1、OpenAI-o3-mini、Grok-3和Gemini-2.5-Pro等顶级模型相比拥有极具竞争力的表现。

▲忆联AM6D1 PCIe 5.0固态硬盘2TB只需要53.99s就能载入容量达109.25GB的Qwen3-235B-A22B大语言模型

结果同样令人满意,尽管模型容量高达109.25GB,但借助忆联AM6D1 PCIe 5.0固态硬盘2TB较高的读取速度,测试平台只需53.99s就能载入该模型。我们使用该模型来撰写一首14行英文诗,也能实现5.42tok/s的词元生成速度,让普通电脑具备使用超大规模参数大语言模型的能力。

4K分辨率下也能带来秒开游戏的体验

鉴于像忆联AM6D1 PCIe 5.0固态硬盘这类兼顾性能、功耗与成本的产品,在未来也很可能被台式机游戏电脑、游戏本与游戏掌机采用,那么它的游戏性能表现如何呢?首先在《最终幻想14:拂晓之途》中,忆联AM6D1 PCIe 5.0固态硬盘2TB载入5个场景的总耗时仅有5.683s,单个场景的加载耗时大多不到1s。在4K分辨率、最高画质设置下能取得这样的成绩难能可贵,其耗时甚至低于很多采用2.5K分辨率或1080p分辨率进行测试的固态硬盘,不少产品在该测试中的总耗时达6.5s~8s。

▲在游戏《最终幻想14:拂晓之途》的4K分辨率设置下,忆联AM6D1 PCIe 5.0固态硬盘2TB载入5个场景的总耗时仅5.683s。

在支持DirectStorage技术的《Forspoken魔咒之地》测试中,忆联AM6D1 PCIe 5.0固态硬盘2TB在7个场景中的最长加载时间也不到2s,只有1.989s,其中3个游戏场景的加载耗时甚至不到1s。比如测试中第1个场景的加载耗时只有0.59s,第7个场景的加载耗时只有0.927s,加载速度极快。这主要得益于DirectStorage技术可以将SSD上的游戏数据直接发送给GPU进行处理,无须再经过处理器中转。总体来看,在《最终幻想14:拂晓之途》《Forspoken魔咒之地》中,忆联AM6D1 PCIe 5.0固态硬盘带来的就是秒开游戏的体验。

▲在游戏《Forspoken魔咒之地》的4K分辨率设置下,忆联AM6D1 PCIe 5.0固态硬盘2TB在部分场景中的加载时间不到1s。

PCMark 10、3DMark专业测试表现突出

如前文所述,以上测试都是基于AMD锐龙9 9950X处理器的平台进行的。考虑到还有不少整机使用英特尔处理器,且英特尔处理器可以更好地发挥出SSD的随机读写性能,因此我们还在基于英特尔酷睿i9-14900K处理器的英特尔平台上,运行了考察日常应用性能的PCMark 10完整系统盘测试、聚焦产品游戏表现的3DMark存储性能测试。

而忆联AM6D1 PCIe 5.0固态硬盘2TB的PCMark 10完整系统盘测试总分高达5642,平均传输带宽为880.57MB/s,优于不少同样基于PCIe 5.0 DRAMLess主控的PCIe 5.0固态硬盘,以及高端PCIe 4.0固态硬盘。在我们的测试中,后面两类产品的得分大多在4900~5200分之间。

▲忆联AM6D1 PCIe 5.0固态硬盘2TB的PCMark 10完整系统盘测试总分高达5642,超越不少同样基于PCIe 5.0 DRAMLess主控的PCIe 5.0固态硬盘。

3DMark存储性能测试中,忆联AM6D1 PCIe 5.0固态硬盘2TB同样有优秀的表现,其总分高达5893分,平均传输带宽达993.85MB/s。而高端PCIe 4.0 SSD在3DMark存储性能测试中则难以超过4500分,我们测过的同类PCIe 5.0 DRAMLess固态硬盘得分未超过5200,平均传输带宽仅873.05MB/s。

▲忆联AM6D1 PCIe 5.0固态硬盘2TB的3DMark存储性能测试高达5893分

全盘读写性能测试

那么忆联AM6D1 PCIe 5.0固态硬盘在长期使用,进行超大容量数据的表现如何呢?我们使用Txbench进行了全盘读写测试。首先在全盘顺序读取测试中,SSD轻松地完成了任务,全盘平均顺序读取速度高达14116.17MB/s,远超标称的11400MB/s顺序读取速度。全盘顺序写入测试中,我们发现AM6D1 PCIe 5.0固态硬盘2TB的SLC缓存容量较大,SLC固定容量缓存设置在574GB左右。在这个容量范围内写入,其写入速度能保持在10900MB/s~11000MB/s。

▲忆联AM6D1 PCIe 5.0固态硬盘2TB的全盘平均顺序读取速度可达14116.17MB/s,读取完2TB数据时的温度仅30℃。

▲忆联AM6D1 PCIe 5.0固态硬盘2TB的固定SLC缓存容量设置在574GB左右

最终其全盘平均顺序写入速度能达到2208.65MB/s。我们认为其全盘平均写入性能在SSD中属于较好的水准,不少固态硬盘因为SLC缓存容量小、全盘平均顺序写入速度往往不到2000MB/s。

▲忆联AM6D1 PCIe 5.0固态硬盘2TB的全盘平均顺序写入速度可达2208.65MB/s,写入2TB数据后的温度为57℃。

SSD功耗测试

在进行全盘读写测试的同时,我们也对这款产品的功耗进行了测量。首先当电脑进入到睡眠状态时,由于所用功耗测量仪最小只能显示到10mW,而忆联AM6D1 PCIe 5.0固态硬盘2TB在睡眠状态下的标称功耗只有3mW,因此功耗测量仪直接给出了0.00W的显示结果。

▲由于所用功耗测量仪最小只能显示10mW,忆联AM6D1 PCIe 5.0固态硬盘2TB在睡眠状态下,我们的功耗显示仪给出了0.00W的数值。

在最重要的负载功耗上,忆联AM6D1 PCIe 5.0固态硬盘2TB的表现也很优秀,其进行全盘顺序读取时的功耗在2.79W~2.82W之间波动,最大功耗不超过2.82W。在全盘顺序写入场景下,其功耗控制也相当优秀,满载功耗仅略高于高性能PCIe 4.0固态硬盘。

▲进行全盘顺序读取时,我们捕捉到的忆联AM6D1 PCIe 5.0固态硬盘2TB最大读取功耗为2.82W。

写在最后

综合全文测试不难发现,忆联AM6D1 PCIe 5.0 SSD正是为破解AI大模型本地部署存储瓶颈而生的理想方案。面对庞大的大语言模型文件,它以11400MB/s+的传输速度、突破1600K IOPS的随机性能,将32B模型加载压缩至10.52s,235B超大模型载入仅需53.99s,让本地AI应用告别漫长等待。其DRAMLess无缓存架构+4通道主控设计,兼顾高性能与低能耗,适配从台式工作站到AI笔记本、掌机的全场景部署需求。配合2TB大容量与M.2 2242/2280双板型兼容性,该产品能完美满足各类计算平台的大模型存储、多任务调度与隐私数据本地化的核心诉求。忆联AM6D1以PCIe 5.0时代的平衡之道,将成为本地部署大语言模型的首选存储基石,从而实现超大规模AI能力在终端设备的高效落地。