超融合HCI

深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
点击可切换产品版本
知道了
不再提醒
HCI6.9.1
{{sendMatomoQuery("超融合HCI","RAID卡故障处理")}}

RAID卡故障处理

更新时间:2023-12-06

功能说明

当超融合集群中某一节点RAID卡异常时(如卡慢),会拉低集群存储性能,甚至导致业务/存储卡死。RAID卡故障检测功能可检测到RAID卡异常,及时告警管理员,并能在卡死时将该RAID卡对应的物理主机进行隔离,避免影响整个集群的稳定性,导致整个存储或者集群业务中断。

注意事项

  1. 主机需配置IPMI,否则主机被隔离后无法远程恢复。
  1. RAID卡死时,告警信息上报可能会失败。
  2. 两主机VS集群(未配置仲裁节点的场景下),主机被隔离后可能导致虚拟机脑裂。

前提条件

操作步骤

  1. 登录超融合超融合平台,进入[系统管理/高级设置]页面。进入“系统设置/物理主机”目录下,找到“RAID卡状态检查”,勾选“启用RAID卡状态检查”。

  1. 当出现内存RAID卡故障时,界面会产生告警提示,提示“主机(xxx.xxx.xxx.xxx)的raid卡异常,将对主机进行网络隔离”。该主机被隔离后,其上虚拟机会自动HA,避免整个集群业务中断。