为什么说 WD_BLACK SN8100 不止于快?

阿里云教程2个月前发布
12 0 0

之前入手了 SN7100 2TB 后,体验不错,不过毕竟是 DRAMless 架构,在高载环境下理论上是和带缓存版的 SSD 有不足的,所以还是希望找个带缓存的 SSD 作为系统主盘使用,恰好日前Sandisk推出了WD_BLACK SN8100,所以就搞了个 2TB,顺带测试了一下,适逢 618 期间,供大家参考。

众所周知,西部数据在 2024年的时候宣布把固态存储业务分拆出来,由之前收购的 Sandisk(闪迪)重新执掌,这个拆分在今年 2 月份的时候完成,在此之后,闪迪将完全负责固态存储业务,像这次我这个 SN8100 2TB 的完整名称是 WD_BLACK SN8100 2TB,虽然带着 WD(西部数据)的字样,但实则已经完全是闪迪的产品线了。

WD_BLACK SN8100 细节介绍

WD_BLACK SN8100(为了方便下面采用简称 SN8100 )目前有 1TB、2TB、4TB 三个版本,据闻今年稍后还会推出 8TB 版本,能满足大部分 PC 平台用户对容量的需求。

为什么说 WD_BLACK SN8100 不止于快?

SN8100 采用了 M.2 2280(宽度 22mm、长度 80mm)型制,可以在绝大多数支持 NVME SSD 的 PC 主板上安装,它提供了 PCIE G5 支持,顺序读取带宽带宽可以高达 14.9GB/s(Sandisk 官方资料),要想充分发挥其性能提议在支持 PCIE 5.0 的 M.2 插槽上安装,当然它本身也能在 PCIE 4.0 的 M.2 插槽上正常使用,只是性能没法充分完全发挥。

SN8100 使用的主控是来自闪迪定制的Silicon Motion(慧荣科技)最新的 SM2508,采用台积电 6nm 制程生产,具有高性能低功耗的特点,支持 PCIE 5.0 和 NVME 2.0 标准,内部包含了 4 个 ARM Cortex-R8 CPU 内核,可以支持 8 个 NAND 通道,每个通道的速率可以达到3600 MT/s,官方资料里表明可以提供高达 14.5GB/s 和 13.6GB/s 的连续读写带宽和每秒 250 万 IOPS 随机性能,是 PCIE 4.0 世代产品的两倍。

在功耗方面,SM2508 最高只有 3.5 瓦,达到了上一代 1.7 倍的能耗比,和 12nm 制程的旧品相比,SM2508 的功耗降低了 50%,SSD 整体能耗可以控制在 7 瓦以下。

在闪存颗粒方面,SN8100 采用了和铠侠联合研发的 218 层 BiCS8 TLC CBA NAND 闪存,CBA(CMOS directly Bonded to Array)和长存的 Xtacking 类似,厂商可以选择为闪存和逻辑电路选择最合适的制程来生产,实现最佳的位元密度和传输速度。

为什么说 WD_BLACK SN8100 不止于快?

目前越来越多的许多用户已经知道,NAND 闪存实则是一种有点反直觉的芯片技术:越精密的制程,反而可能会对 NAND 闪存构成负面因素。

在 NAND 闪存里是依靠存储 Cell 的电平值来判断存储的位值,如果说位值数为 n 的话,每个存储 Cell 里需要维持 2^n 电平,像 TLC 就是每个存储 Cell 里存放 3 个二进制位值,就需要维持 2^3 或者说 8 个电平值。

制程越先进,每个存储 Cell 中能用于维持电平值的电荷就越少,判别电平值的难度就越大,速度也越难提升,所以透过提升半导体制程来增加 NAND 存储能力这个路径已经很大程度上被抑制了。

由于增加电平值会显著增加判读电平值的难度,因此像 TLC 的下一步 QLC 在存储密度上实则并未如表面数字那样提升 33%,有些 QLC 实现相对 TLC 来说也就是 20% 的存储密度提升。

如今 NAND 闪存提升密度的主要方式基本不再是依赖提升制程,更多的是靠 3D (堆叠)NAND来实现。

例如闪迪/铠侠的 BiCS 8 就采用的 CBA 技术,采用了多层存储阵列晶圆+逻辑电路晶圆堆叠。

为什么说 WD_BLACK SN8100 不止于快?

为什么说 WD_BLACK SN8100 不止于快?

为什么说 WD_BLACK SN8100 不止于快?

上图是 闪迪/铠侠 2025 年论文(332 层,I/O 4.8GT/s)中的一张插图,可以清楚地表明 CBA 技术的原理——上面的是采用 NAND 闪存兼容制程生产的 NAND 闪存矩阵晶圆切割下来的闪存阵列芯片,而底下这层是使用逻辑电路优化的制程生产的晶圆切割下来的 CMOS 芯片,把两者键合在一起后就是 CBA 技术。

为什么说 WD_BLACK SN8100 不止于快?

闪迪/铠侠的 CBA 并非简单地把逻辑电路和存储矩阵晶圆键合在一起,还做了 X 方向和 Y 方向的优化。

为什么说 WD_BLACK SN8100 不止于快?

为什么说 WD_BLACK SN8100 不止于快?

大家可以看到,在多层存储堆叠的情况下,为了实现和逻辑电路的通信,存储层会被刻蚀或者说“修剪”为所谓的台阶式,也就是 Stairsteps。

BiCS8 的 CBA 在这里透过增加布线密度和连接区域到 word-line 复杂性的方式,实现更高的等效尺寸缩减,是 BiCS 8 在 Y 方向缩减尺寸的重大手段。

虽然基于 BiCS8 的颗粒也能直接以 3D QLC 模式运作,并且也有针对企业级 SSD 的 Ultra QLC 产品线,但是面向电子消费的 SN8100 颗粒依然是选择速度、容量最佳化的 TLC 模式,2TB 版本的耐久度(5 年使用或者总写入字节数)可以达到 1200 TBW。

在随附软件方面,闪迪提供了 Acronis True Image 和 WD_BLACK Dashboard,前者是我近 10 年来最常用的硬盘数据备份、恢复软件,手头的 Windows PE 必定带 Acronis True Image 我才安心。WD_BLACK Dashboard 是一个超级出色的 SSD 工具箱,在里面你可以进行 SSD 固件更新、SMART 状态检测、全盘擦除等操作。

为什么说 WD_BLACK SN8100 不止于快?

为什么说 WD_BLACK SN8100 不止于快?

闪迪 从 WD 拆分后依然保持和铠侠的联合研发,按照上图所示,它们已经在ISSCC 2005 上联合展示了 3xx 层的未来 BiCS 闪存技术,而联合研发技术已经规划到了 BiCS11,预计闪存堆叠层数会达到 400 层以上,由此可见 闪迪/铠侠研发能力还是相当不错的。

除了和铠侠的合作外,闪迪还正在和 IMEC 合作研发相变存储技术路线的 3D Matrix Memory(三维矩阵内存),不过这个项目主要面向太空军事和企业级应用,和我们消费者端暂时关系不大。

SN8100 的首发(1TB-4TB)系列采用了单面芯片布局,可以在所有 M.2 2280 场合中安装使用,相较之下上一代的 4TB 版 SN850X 是双面芯片布局,在一些场合(例如某些笔记本或者 mini PC)上使用可能会受限(例如散热、安装方面),而 SN8100 首发系列没有这个限制,这点很值得笔记本用户思考。

为什么说 WD_BLACK SN8100 不止于快?

SN8100 使用的 218 层 BiCS8 TLC 实则和稍早之前的 SN7100 是同款,都是运行于 3600MT/s,最大的不同除了采用 SM2508 主控还有就是使用了额外的 DRAM 内存芯片存放元数据,采用 DRAM 存放元数据能让 SSD 在大量存储空间被占用的情况下依然保持稳定的性能表现,而无缓存或者说 HMB 架构的 SSD 的稳定性能持续能力相对较弱,两者在价格、性能、耐用度方面有各自优势。

相对于 SN7100 而言,SN8100 由于采用了本地 DRAM 架构实现更好的稳态性能,但是随之而来的是在 PCIE 5.0 4X 模式下的闲置功耗是 1.5 瓦左右,在以 PCIE 5.0 X4 模式下全速写入操作时功耗在 7.5 瓦左右,而上一代的 SN850X 在 PCIE 4.0 X4 模式下全速写入操作功耗大约是 6.9 瓦左右,思考性能的因素,SN8100 在能耗比方面有显著提升。

对于依然只支持 PCIE 4.0 m.2 的笔记本电脑来说,使用 SN8100 相对 SN850X 等上一代 M.2 SSD 来说依旧是一个很好的选择,由于 PCIE 4.0 模式下实测 SN8100 的耗电基本上是减半的。

性能实测

测试平台:

CPU: Intel Core i9 13900K

主板:华硕 ROG STRIX Z790-Gaming

内存:DDR4-6400 16X2 32GB

操作系统:Windows 11 24H2

CrystalDiskMark

Default+Mix

图表 1 SN8100

为什么说 WD_BLACK SN8100 不止于快?

图表 2 SN850X

Realworld+Mix

为什么说 WD_BLACK SN8100 不止于快?

图表 3 SN8100

为什么说 WD_BLACK SN8100 不止于快?

图表 4 SN850X

CrystalDiskMark 是一个开源硬盘驱动器测试工具,本质上是微软 Windows 内置 Diskspd 的图形界面,已经有差不多 18 年历史了,大家都对它很熟悉,测试时选择了 NVME SSD 模式,测试数据类型为随机数。

备注:目前 Intel 13 代平台的 PCIE 5.0 NVME 顺序读写性能是要比 AMD Ryzen 9000 系列稍低一些,例如 AMD平台的 CDM 顺序读写性能可以达到14900/14000 MB/s的水平,不过其他数据 Intel 平台则要好不少。

从实测结果来看:

在 Default+Mix 或者说默认+读写混合测试中,SN8100 的连续 1M 读取性能为 14.3 GB/s,是 SN850X 的两倍以上,随机 4K Q1T1 带宽是 SN850X 的 1.43 倍。

在 Realworld+Mix(模拟现实世界+读写混合)测试中,SN8100 的连续 1M 读取性能为 9.4 GB/s,是 SN850X 的 1.82 倍以上,随机 4K IOPS 值是 SN850X 的 1.43 倍左右,4K 随机响应速度为为 30.38 微秒,比 SN850X 快 30%。

AS SSD Benchmark

为什么说 WD_BLACK SN8100 不止于快?

为什么说 WD_BLACK SN8100 不止于快?

AS SSD Benchmark 的历史稍晚于 CrystalDiskMark,它测试的是不可压缩数据,能将测试结果转换为简单的可比得分。

从测试得分来看,SN8100 的读取、写入、总分分别是 SN850X 的 1.8 倍、1.2 倍和 1.52 倍,连续写入方面 SN8100 是 SN850X 的 1.93 倍,不过 4K 的时候提升相对较少。

IOMeter(SINA PTS SSS 2.0)客户端级 IOPS 性能测试

SNIA 是一个全球性的非盈利机构,会员有 Intel、AMD、IBM、镁光、铠侠等超过 185 个行业公司和组织,统筹了不少存储技术标准的指定,例如 NVME-oF 等,该机构有一个名为 Solid State Storage (SSS) Performance Test Specification (固态存储性能测试规范,简称 PTS)的性能测试标准,是一个针对企业和大众客户的固态硬盘测试标准,其中的测试流程超级规范,我这里决定参照这个规范(SNIA PTS 2.0.1)的企业级客户类型 IOPS 测试流程进行测试。

要了解 SNIA 的 SSD 测试方法论我们需要知道一些前置知识,第一让我们看看下面这张图。

为什么说 WD_BLACK SN8100 不止于快?

这是一张典型的 SSD 从开箱状态(FOB 或者说新盘状态)开始测试工作负载,测试可以看到有短暂的高性能状态,随后会经过 Transition(变换)状态,最终进入稳态,SNIA 的 IOPS 测试结果只取进入稳态区的测试结果。

例如上图中,型号 D8 的 SLC SSD 就是进入了稳态区,此时它在稳态区的 IOPS 结果是可以被接纳的,而暗红色的的 D4 MLC SSD 在上图中一直都在波动,即使到上图的右侧结束也依然不会被接纳,需要继续进行负载相依预训练,直到之后进入稳态区。

备注:有些人会把变换状态称之为“离散”,在 SNIA PTS 测试规范中,这个区域的测试测试结果不具意义。

接下来,你需要了解的是预训练、稳态窗口等概念,后面提供的测试步骤会提及这些概念。

SNIA PTS 除了 IOPS 外还有多种测试,但是我觉得其中最有参考价值的还是 IOPS。

SNIA PTS 测试步骤:

  • 净化(使用安全擦写指令让全盘恢复至新盘状态);
  • 预训练;

步骤一:单次 WIPC(负载无关预训练),以 128 KiB 大小对测试目标设备执行相当于两倍容量的连续写入操作,操作的空间范围为格式化后的全盘 100%。

为什么说 WD_BLACK SN8100 不止于快?

OIO/Thread(Queue Depth ),测试人员决定,对企业版一般用 QD=32,对大众用户版一般用 QD=16;

Thread Count:相当于 IOMETER 里的 Woker,可以由测试人员决定,企业版一般是 4,消费者一般用 2;

数据模板:完全随机。

由于 IOMeter 缺乏指定写入 LBA 两倍的能力,在使用 IOMeter 来实际执行测试(测试模板见上图所示)的时候,需要用 HDtune 观察硬盘写入量。

IOMeter 对于已经分区的硬盘本身就会先写入一个分区大小一样的填充文件,这个写入操作是用每次 64KiB 大小以连续写入的方式执行,我在 HDTune 里持续观察接下来执行测试模板(128KiB 100% 连续写入)达到之前 64KiB 一样的 IO 数就可以算作完成 WIPC。

步骤二:进行多回合的 WDPC(负载相关预训练),每回合 WDPC 均需要以多种测试模板执行连续写入操作,企业级测试标准要求测试空间范围为格式化后全盘的 100%。

为什么说 WD_BLACK SN8100 不止于快?

PTS 1.1 开始,除了 4KiB R0W100 外,稳态窗口判断加入了额外两种测试模板(64 KiB R65W35 和 1024KiB R100W0),这是由于有些硬盘对 RND 4 KiB 有额外的优化,会使得 RND 4 KiB 比其他模板更快进入稳态。

PTS 1.2 开始去掉了分段和不同容量占比的稳态测试;

PTS 2.0 企业版和消费者或者说大众客户版的 WDPC 都只需要执行一次(一次包含多个回合,每个回合包含 56 个测试模板),但是 PTS 2.0大众客户版本的测试空间范围(AR)占比为 75% 以及允许开启写入缓存(WCE),而企业版要求 100% 空间范围以及关闭写入缓存;

OIO:同 WIPC;

Thread Count:同 WIPC。

这一步,每一个测试模板(不同数据块大小以及读写比例)需要跑 1 分钟,每个回合包含 56 个测试模板,我们一共测试 25 个回合,合计要 1400 分钟或者说 23.3 小时,是一个超级消耗时间和硬盘损耗的测试。

步骤三:整理 WDPC 的数据,观察稳态窗口的斜率是否落在稳态标准范围内,使用符合稳态标准的数据作为最终的 IOPS 测试结果,如果不符合的话,那就再跑 10 回合(相当于 10 小时),直到 SSD 进入稳态。

当然 SNIA PTS 测试规范里还说了,倘若 25 回合后依然还没进入稳态的话,可以直接取最后一回合的数据作为最终的结果。

顺带一提的是,除了 IOMETER 外,还可以使用 FIO 进行 PTS 规范测试,而且某种程度上说,PTS 和 FIO 是高度匹配的,FIO 拥有完成 PTS 测试标准所需要的所有设置和开关,网上也有大量使用 FIO 完成 PTS 的脚本范例,甚至 SNIA PTS 标准制定者当年就是用 linux 脚本写了个 PTS SSS 企业版 IOPS 脚本。

我当然有使用过 FIO 了,而且在网上能找到的 FIO PTS 脚本都跑过,但是根据我的对比,还是 IOMeter 比较适合 Windows 下测试。

这里放上 WD_BLACK SN8100 2TB 的 4KiB 100% 随机写入、64 KiB 65% 随机读取+35%随机写入、1MiB 100% 顺序写入三种 PTS 2.0 规定的稳态观察窗口结果。

为什么说 WD_BLACK SN8100 不止于快?

为什么说 WD_BLACK SN8100 不止于快?

为什么说 WD_BLACK SN8100 不止于快?

从三个稳态观察窗口可以看到,在 21-25 回合的时候,SN8100 已经完全进入稳态,此时取用第 25 回合测试结果作为最终结果完全符合 SNIA PTS-C SSS 测试规范要求。

作为对比,这里加上 SN7100 和 SN850X 的结果作为对比。

为什么说 WD_BLACK SN8100 不止于快?

为什么说 WD_BLACK SN8100 不止于快?

为什么说 WD_BLACK SN8100 不止于快?

和 HMB 架构的 SN7100 相比,SN8100 和 SN850X 在这个测试中都显示出了超级出色的表现,SN8100 在稳态下提供了 65393 IOPS 的 100% 随机 4KiB 读取性能,在 100% 连续 1MiB 写入时提供了 304 IOPS,相较之下,SN850X 分别是 41066 IOPS 和 168 IOPS,而 SN7100 则分别是 IOPS 和 49 IOPS,三款 SSD 在这个状态(满盘+稳态)下的性能差距还是比较明显的。

PCMark10 完全存储性能测试

前面我们测试的都是偏设备级或者说底层测试,接下来我们将使用 PCMark10 进行应用级测试。PCMark10 采集了多个应用的真实存储轨迹,包括 Windows 10 启动引导、Adobe 创作应用、微软Office、游戏、光盘镜像 ISO 文件复制、图片文件复制等,对于这些子项目 PCMark 10 使用了缩写来代表,如下图所示:

为什么说 WD_BLACK SN8100 不止于快?

按照 PCMark10 的白皮书,PCMARK10 的完整系统驱动器基准测试包含了上述的 23 个测试子项目(轨迹),每个轨迹都跑 3 遍,一般情况下整个测试大约需要 1 小时。

为什么说 WD_BLACK SN8100 不止于快?

真实世界轨迹存储回放的差距有时候会和大家的实际略有出入,由于这种测试得出的是纯粹的存储性能,而现实世界中,例如 Window 10 启动、游戏启动,除了存储导致的时间等待以外,还有不少时间会用于各种计算(例如系统状态查询、初始化、解压缩等等)。

从测试结果来看,WD_BLACK SN8100 2TB 在存储轨迹重放时的性能(几何均值)是 SN850X 的两倍左右或者说 HMB 架构的 SN7100 2TB 的 1.52 倍。

测试总结

从测试结果来看,Sandisk(闪迪)WD_BLACK SN8100 2TB 的性能超级出色,在多个测试中做到了上一代产品 WD_BLACK SN850X 2TB 的两倍性能。

为什么说 WD_BLACK SN8100 不止于快?

在 pSLC(伪 SLC) 能力方面,WD_BLACK SN8100 2TB 采用了二级 pSLC 设计,从测试来看其首个转折点是在 664 GB 处,相当于 1/3,这是一块 TLC SSD,意味着它的 pSLC 策略是全盘空间都被允许被用作 pSLC,好处是可以让写入性能在更大的空间里得以保持。

在pSLC(852 GB)结束后,SN8100 会进入一个波动期,由于此时开始需要把 pSLC 逐渐转为 TLC 模式,不过此时的写入均值为 1.8 GiB/s,依然要略强于 SN850X,我觉得这个 pSLC 策略目前来说还是不错的。

相对于目前我正在用的 SN7100 来说,SN8100 的性能要快 50% 以上,而且由于有 DRAM 缓存,拥有更好的磨损均衡管理能力,更适合作为有频繁读写的操作系统主盘和数据热盘(例如修图师、剪辑师存放当前工程项目的素材盘)使用。

SN8100 提供了裸片和马甲版供选择,我觉得选择裸片版本最好。第一 SN8100 的首发版(最高 4 TB)都是单面盘,很适合笔记本电脑上使用,如果在笔记本上用的话,那自然是裸片版了。如果是台式机上的话,目前主板上的散热片一般也是要比那个马甲版的散热片更大,有些还有热管,当然马甲版的好处是一体化的散热片,更加结实,我觉得最适合外接 m.2 坞站的时候使用。

相对于其他品牌的 PCIE 5.0 DRAM SSD 来说,SN8100 性能相当能打,而且由于 BCiS 8 和 SM2508 的组合,在功耗方面表现超级出色(全速写入 7.5 瓦左右),而功耗是我选择 SSD 时的三个(耐用度、发热/功耗、性能)最重大的坐标点之一,它在很大程度上对耐用度和性能有直接影响,当然这只是我的个人见解,仅供参考。

(附上 SN8100 知乎好物推荐链接)

© 版权声明

相关文章

暂无评论

none
暂无评论...