全闪存阵列
由固态存储介质构成的设备
全闪存阵列是完全由固态存储介质(通常是NAND闪存)构成的独立的存储阵列或设备,这些系统是用于增强可能包含磁盘阵列的环境的性能,或者用于取代所有传统的硬盘存储阵列。
系统优势
全闪存,顾名思义,在存储子系统中用固态硬盘(SSD)或其他闪存介质代替传统硬盘(HDD)。最显而易见的特性在于它的高IOPS。通常而言,单一脚本中,全闪存阵列可以提供50到100万IOPS,延迟在1毫秒以下。
闪存介质的威力通过一组数据可以看得非常清晰,通过在普通存储阵列中增加一个薄片的闪存,如占总容量2%到5%的比例,那么平均的IOPS值就可以加倍,读延迟可以从10毫秒减少到3到5毫秒。虽然闪存介质价格不菲,但10%到20%的价格增加换来两倍的性能提升,还是有赚翻了的感觉。
衡量标准
全闪存阵列的衡量标准须从以下三个重要因素来考量:IOPS(每秒输入/输出数)、IO延迟和吞吐率。根据的应用程序,无论是IOPS还是吞吐率都至关重要。小数据块I/O密集型应用特别关注IOPS,而对于大数据块密集型的应用,核心关注的指标就是吞吐率。此外,在所有的应用场景下,延迟时间都是至关重要的。闪存盘和传统的硬盘驱动器有非常多的不同点;它们在使用,失效策略和管理方式上均不相同。
缺点
全闪存阵列可以解决目前企业数据中心的大多数性能问题。但是这种效率是有代价的。因此,全闪存存储阵列的供应商正在寻找方法,通过自动精简配置、重复数据删除和压缩等各种各样的存储效率提升技术来最大限度地运用这些系统。
全闪存阵列的缺陷
除了这些表面的优势,SSD也绝非完美的驱动器,有其自身的缺陷。最为明显的是闪存的有限写操作周期,SSD最终会损耗殆尽。通常,SLC闪存的耐久度大约为100,000次写周期;MLC闪存则少了一个数量级,每个数据单位只有大约10,000次。除了这些,数据的存储和读取也并不完全可靠。厂商方面应用了许多技术来扩展使用周期,包括损耗平衡、纠错编码、坏数据块重新映射以及过量配置。
SSD的响应时间同样有可能不一致。数据写入SSD时会送到整个驱动器上以确保每个独立单元均匀磨损。这一流程称为损耗平衡。随着新数据的写入,各单元块会被重新标记回收。随着一块SSD达到较高的利用率或写操作,该回收过程可能会因为无效数据区域的覆盖操作延缓响应时间。很显然,这种情形是低延迟环境中所不可取的。
全闪存阵列不支持企业功能
全闪存阵列不能支持企业级功能,比如重复数据删除、复制、快照、自动精简配置等等。为了解决这个问题,一些厂商建议在全闪存阵列上层添加一层软件解决方案,来提供企业级的数据服务、读写效率和数据保护。
为此,有一些厂商对传统的控制器进行重新设计,使得其能提供企业级功能,以处理闪存技术的特殊行为和性能,并称其为全闪存阵列选项。
随着全闪存阵列控制器的不断发展与日趋成熟,你将会看到它们能够支持企业级功能。这也是全闪存阵列支持企业级功能最有效的方法。
扩展
纵向扩展
和纵向扩展磁盘阵列一样,纵向扩展全闪存系统在单独一组控制器上运行所有I / O。但是全闪存系统的控制器设计是用于支持闪存所能达到的更高IOPS的,因此性能瓶颈不再是一个问题。另外,闪存存储密度(每机架千兆字节量)比旋转式磁盘高得多,因此纵向扩展全闪存阵列的容量不太可能像纵向扩展磁盘阵列那样很快耗尽。
横向扩展
与横向扩展旋转磁盘阵列一样,横向扩展全闪存阵列将一个控制器和存储介质放置在相同的模块配置当中,使它们可以将系统容量扩展到当前的最高水平。这种分布式控制器架构也使得系统能够支持更多的工作负载,因为每个模块都可以独立处理I/ O。
主要影响
全闪存阵列正在改变大型企业中大多数应用装配存储的方式。尽管和硬盘相比,全闪存阵列每TB的价格要高,但全闪存阵列性能显著提升意味着全闪存阵列提供了与以往有所不同的虚拟数据中心运作方式。
在SAN网络中使用全闪存阵列的目的是能够快速访问被频繁使用的数据。典型的虚拟集群针对磁盘性能低下的解决方案是在SAN中增加更多的磁盘。每块磁盘提供的IOPS大约是150,当前系统对全闪存阵列的要求仍然很高,在SAN中增加更多磁盘的结果就是主存储层配置了过多的全闪存阵列存储容量。全闪存阵列和主存储层的存储容量相比,全闪存阵列热点数据的量通常很少,全闪存阵列是一种很不错的在高速存储上存储有限数据的选择。
最新的全闪存阵列单元能够压缩数据,全闪存阵列能够将有效容量变为原来的三到六倍,全闪存阵列提供了大量的增长空间。即使是这样,全闪存阵列将未被经常被访问的数据迁移到二级存储上的需求一直存在。全闪存阵列二级存储能够接收来自全闪存的压缩数据,因此同样能够获得三到六倍的全闪存阵列存储容量。全闪存阵列使用压缩可以重新调整现有的第一级或第二级存储,全闪存阵列能够延长设备使用寿命,在今后的几年都不需要在购买全闪存阵列二级存储了。
全闪存阵列对虚拟机群的影响并不仅限于存储容量与性能。虚拟化IO问题一直存在。全闪存阵列磁盘存储上分布着多个虚拟实例,全闪存阵列在某些情况下每个实例的IO可能会非常低。运行LAMP堆栈通常意味着每个实例的IO较低,但创建多个实例可能会引发启动风暴。
全闪存阵列在虚拟化桌面配置中我们经常会遇到启动风暴,因此很多公司打算在虚拟基础设施中使用全闪存阵列也就不足为奇了。全闪存阵列提供了非常高的性能,启动风暴仅仅是网络争用而不再存在IOPS问题了。在很多情况下,意味着问题已经被解决了。
全闪存阵列读写速度要比磁盘阵列快很多。全闪存阵列读或写操作大概只需要50微秒,而磁盘阵列至少需要3毫秒。应用在全闪存阵列上运行的速度更快,给定job所需要的服务器资源也就相应地减少了。具体减少的资源与应用等待IO的数量有关,不同应用的差异可能非常大。
全闪存阵列在极端情况下,全闪存阵列高速使内存数据库成为了可能。全闪存阵列性能提升可能高达100倍。尽管可以在本地SSD硬盘中存储变更,全闪存阵列但数据完整性以及可用性目标通常要求在假定数据被提交前提供网络副本。低延迟全闪存阵列让这一切变成了现实,全闪存阵列在数据库集群中可以直接取代分布式存储。
存活
全闪存阵列在虚拟集群中不存在激烈的竞争。启动风暴源于创建包含桌面操作系统及应用的全闪存阵列虚拟实例。全闪存阵列浪费了DRAM空间并导致了启动风暴。更好的方式是迁移到容器模式而不是采用传统的虚拟化。使用容器,全闪存阵列任一物理服务器只有一个镜像副本,全闪存阵列所有实例共享该只读副本。这节省了大量的DRAM空间而且每台服务器能够运行更多的实例,全闪存阵列节省了服务器成本。
我们还会在全闪存阵列虚拟服务器中存储本地实例。所有全闪存阵列实例共享SSD而且为镜像及数据提供高速存储。尽管全闪存阵列没有通过网络进行实时备份存在重大缺陷,但全闪存阵列大数据应用能够得到真正的性能提升。全闪存阵列扩展该存储类型到vSAN中增加了创建分布式全闪存阵列的可能性,全闪存阵列SSD能够被集群中的任一服务器访问。该方法是否比全闪存阵列要好仍旧没有结论。
全闪存阵列发展迅速是因为其融入现有SAN网络的风险很低,全闪存阵列能够立刻提升性能,而且全闪存阵列不需要进行重大改变。另一方面,全闪存阵列容器以及vSAN和以往相比代表着翻天覆地的变化,这意味着全闪存阵列将会继续主导市场。
最新修订时间:2023-11-10 07:56
目录
概述
系统优势
衡量标准
参考资料