超融合HCI

深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
点击可切换产品版本
知道了
不再提醒
HCI6.10.0(R1)
{{sendMatomoQuery("超融合HCI","aSAN关键特性")}}

aSAN关键特性

更新时间:2024-05-09
  1. 数据条带化

aSAN利用条带化技术获得最大程度上的I/O 并发能力。条带化技术是将一块连续的数据切分成很多个小的数据块,然后并发地存储到不同物理硬盘上,实现对数据进行写入或读取时可以获得最大程度上的I/O 并发能力,从而获得优异的性能。

如下图所示,经过条带化处理的数据可以并发地写入到三块磁盘,而未经条带化处理的数据每次只能写入到一块磁盘中,因此数据经过条带化后的写入性能则是未经条带化的写入性能的3倍。

  1. 分片

aSAN通过数据分片技术对单个qcow2文件按照固定单位大小进行切分成若干个颗粒度更小的分片。让数据在存储卷中分布更加地均衡,数据管理更加灵活。

  1. 多副本机制:支持2副本、3副本

同时支持2副本及3副本策略,针对承载重要业务系统的虚拟机,用户可以选择配置3副本策略,进一步提高数据的可靠性。支持2副本虚拟机与3副本虚拟机相互转换,实现高可靠与高性能之间的最佳平衡。

平台内置常用存储策略,用户根据业务系统的特点,新建虚拟机时可选择相应的存储策略;同时用户可依据业务系统特性,以虚拟机为粒度配置更精细的存储策略,配置更为灵活。包含以下四个属性:

副本数:可靠指标,依照业务重要程度,可选择两副本或三副本。

智能分层QoS:性能指标,可选择高性能、默认性能、低性能。

条带数:性能指标,根据硬盘当前存储状态,系统自动设置条带数或自定义。

聚合副本:性能指标,为了保证IO本地化,提高读性能,聚合副本默认开启。

  1. 存储快照

支持存储快照功能,在对虚拟机创建快照时,系统会将源虚拟磁盘设置为只读,并生成对应数量的新磁盘文件(即快照空间)。

快照创建完成后,该虚拟机的所有新增数据和对源数据的修改都将写入到新生成的快照空间,并将源虚拟磁盘和快照空间逻辑地址的对应关系写入映射表。

屏幕快照 2019-10-21 下午7.37.53

快照创建后,虚拟机对数据的读取存在两种情况:

若读取的数据是快照创建之前已有的数据,且创建快照后未进行修改,则从源虚拟磁盘中读取。

若读取的数据是快照创建之后新增/修改的数据,则从快照空间读取。

该快照方式具有以下优点:

采用写时重定向(ROW)方式实现快照,快照后虚拟机性能不受影响。

删除快照后可释放存储空间(发起快照残留文件清理任务)。

支持一致性组快照, 保证Oracle RAC及分布式业务的一致性:

支持将Oracle RAC中的虚拟机或承载同一业务系统的多个虚拟机添加为一致性组,对一致性组创建快照,保证组内所有虚拟机在同一时刻创建快照。

当一致性组内的虚拟机出现故障时,组内的虚拟机利用一致性组快照可回滚到一致的状态。

支持定时快照, 简化运维,数据更可靠:

支持对单个虚拟机和一致性组自定义定时快照策略。

快照频率可以选择按小时、天、周,同时为避免频繁快照占用大量存储资源,可设置快照自动清理策略,系统会自动合并快照点,有效利用存储空间。

在开发测试场景下,定时快照能很大程度上简化运维工作、提高数据可靠性。

  1. 虚拟机克隆

在全量克隆虚拟机的基础上,同时支持链接克隆与快速全量克隆虚拟机。

链接克隆生成的虚拟机始终依赖源镜像启动和运行,数据发生增改时才会记录并重定向到新的镜像上。具有虚拟机启动快、数据非独立,节省存储空间、克隆完成后,性能仍会有影响等特点。

快速全量克隆生成的虚拟机前期依赖源镜像,可秒级启动,虚拟机启动后仍持续克隆数据,最终数据会完整无依赖。具有虚拟机启动快、数据最终独立、克隆完成后性能完全无影响等特点。

可灵活选择虚拟机克隆方式,默认推荐快速全量克隆方式。

  1. 主机多卷

深信服超融合在一个集群中,支持通过选择不同主机组建多个存储子卷,既满足了用户对不同业务的容量和性能隔离的需求,并且可以使得业务在不同的存储子卷进行切换,进而实现同一个业务在不同阶段的不同性能需求。

  1. 磁盘多卷

按主机划分多个卷至少6主机起步才能支持,对于承载业务节点较小的小集群,无法按主机划分为多个卷,可以采用按硬盘划分多个卷。

如下图所示,从3主机起步,aSAN支持按硬盘的粒度,划分为2个卷,相较按主机划分存储卷,降低了多卷的部署门槛。当客户存在高性能和大容量两种不同类型业务,可以按硬盘划分为2个卷:1个闪存卷 + 1个混合卷,闪存卷用来跑高性能业务,混合卷用来跑大容量业务。

  1. 延伸卷

通过延伸集群的方案实现双活数据中心,该方案必须部署仲裁节点,解决脑裂问题,保证数据可靠性,超融合主机组建一个集群,平均部署到2个机房,每个机房配置成一个故障域,每个故障域保存一个副本,数据会被同时写入2个副本,任意一个机房故障,数据不丢失。

  1. 仲裁机制

数据脑裂通常是由于网络发生故障,数据的多个副本出现隔离,无法及时相互同步信息,并且副本各自孤立地写入不同的数据,导致副本之间数据不一致,各自副本存在对方不存在的数据。aSAN引入仲裁副本来避免数据脑裂发生。仲裁副本是一种特殊的副本,它只有少量的校验数据,占用的实际存储空间很小。

  1. 数据平衡

随着分布式存储运行过程中,主机间的各磁盘也可能使用的不均匀。当发现卷内最高和最低的磁盘容量使用率之差超过一定阈值时,aSAN会以分片为单位计算出源端磁盘上的各个分片其即将落入的目的端磁盘的位置。目的端磁盘的个数可以是多个,位置可以是本主机内的其他磁盘或者其他主机内的磁盘。

  1. 数据重建

aSAN通过数据重建功能,在组件(磁盘或主机)发生故障后,将以故障组件上数据的另一副本作为修复源,以分片为单位在目的组件上重建出新的副本,恢复副本的完整性,实现系统自愈。

  1. 虚拟iSCSI技术

aSAN具备虚拟iSCSI技术,可以创建虚拟iSCSI硬盘,并且支持从虚拟存储通信网口接入。

  1. 异构存储管理

超融合平台支持添加FC存储、iSCSI存储作为外置存储,让虚拟机的存储位置放到FC存储或者iSCSI存储上,并实现虚拟机HA功能。

超融合平台支持添加NFS作为虚拟机的备份位置。

超融合平台支持添加服务器系统盘之外的本地磁盘或服务器上磁盘组建RAID之后的逻辑磁盘作为虚拟机的存储位置,但不支持虚拟机HA功能。

  1. 磁盘亚健康扫描与修复

aSAN通过坏道主动扫描功能,及时发现潜藏的坏道,避免数据长期处于“单副本”状态。

aSAN发现坏道后,会立即触发坏道数据修复,从另一副本读取数据修复至坏道盘的保留扇区,及时恢复数据副本的冗余。

aSAN主动预先将坏道过多(或SSD寿命即将用尽)的硬盘上所有数据迁移至其他健康的硬盘上,始终保持副本的冗余度。

硬盘出现卡顿、变慢、拥塞等异常情况时,会影响性能,此时通过亚健康盘隔离和读写源切换保证性能的连续性。

  1. 坏道预测

深信服通过收集分析大量客户真实使用场景中坏道硬盘的SMART数据、性能参数与硬盘日志信息,结合先进的算法训练模型,自主研发出高精确度的坏道预测功能,通过大量差异业务场景测试,aSAN坏道预测准确率高达95%以上。

  1. 容量预测

aSAN可以根据客户集群的容量使用情况动态预测出未来90天内的容量增长趋势。在容量预测界面,用户可以切换查看不同的存储卷裸容量、实际使用容量与动态预测曲线,并在界面提示用户预计xx天后,使用容量将达到容量告警阈值(90%)。

  1. SSD寿命预测

aSAN收集分析集群中SSD硬盘IO数据,计算出SSD硬盘的剩余寿命,并结合上层业务压力显示预计SSD剩余可用时长,按照预测结果划分“健康”、“风险”、“高风险”三个寿命等级,提示用户及时更换集群中寿命告急的SSD硬盘。

  1. 基于SPDKTurbo加速

当前HCI平台支撑着客户的关键业务,包括数据库应用、大数据分析、人工智能和机器学习等。这些应用对存储IO性能的要求很高,因为存储IO的性能水平直接关系到业务处理的迅速性和最终的用户体验。为了追求极致的IO性能,HCI平台引入了SPDK解决方案,这一举措在虚拟机IO性能测试以及运行IO密集型业务方面,显著提升了性能上限。

SPDKStorage Performance Development Kit )一种用于构建高性能存储应用程序的工具包。超融合在虚拟化层使用 SPDK-vHost 技术使虚拟机运行在用户态,使 IO 流可以绕过内核直接访问硬件,从而减少虚拟化调度引发的性能开销。

通过基于 SPDK-vHost Turbo 加速技术将虚拟机大块混合读写的平均时延从 4ms 降低到 2ms ,吞吐效率提升 50% 左右。小块 IOPS 提升 20% 以上,性能大幅领先。

SPDK接入虚拟存储的流程做了深度优化,单深度IO直接在轮询线程上下文访问虚拟存储,减少了一次线程切换开销;多深度IOIO切换到流水线线程上;大块IO按照128KB切分为多个IO请求并发处理。经过IO性能测试对比,与原HCI方案虚拟机相比,性能提升20%~50%,信创场景下,提升最高达200%

改造SPDK框架,适配虚拟机的双实例检测、高可用和原地热升级等高级功能,保证了TURBO虚拟机的平滑体验。

普通虚拟机和TURBO虚拟机可以同时存在,支持进行相互转换,可以根据虚拟机实际业务来选择虚拟机是否使用SPDK,在性能和功能上取得平衡。

  1. RDMA网络:

传统的网络协议栈(如TCP/IP)并不是针对高性能应用场景设计的,系统调用和内存复制等操作都会带来巨大的性能开销,面对现今各行业对于网络低时延日益增长的需求,显然难以提供高效的通信支持。RDMA(Remote Direct Memory Access,远程直接内存访问)是一种最早应用于高性能计算领域的网络通信协议,这种通信技术允许计算机之间直接传输数据到对方内存而无需操作系统介入处理。可以显著减少数据传输时的延迟,提高网络通信的效率。目前,RDMA以其零拷贝、内核旁路、CPU卸载和低延迟的特性而被广泛应用于存储网络、大数据和云计算等领域。

RDMA被应用于虚拟存储平台的存储私网,主要部署存储客户端和服务端进程中,用于跨节点网络通信,提供类似TCP的通信机制,开启RDMA功能后可以代替TCP网络实现数据传输,降低存储客户端和服务端之间的网络时延,显著提升虚拟存储平台性能,大幅提高存储客户端和服务端吞吐。