更新时间:2023-12-06
功能说明
当超融合集群中某一节点RAID卡异常时(如卡慢),会拉低集群存储性能,甚至导致业务/存储卡死。RAID卡故障检测功能可检测到RAID卡异常,及时告警管理员,并能在卡死时将该RAID卡对应的物理主机进行隔离,避免影响整个集群的稳定性,导致整个存储或者集群业务中断。
注意事项
- 主机需配置IPMI,否则主机被隔离后无法远程恢复。
- RAID卡死时,告警信息上报可能会失败。
- 两主机VS集群(未配置仲裁节点的场景下),主机被隔离后可能导致虚拟机脑裂。
前提条件
无
操作步骤
- 登录超融合超融合平台,进入[系统管理/高级设置]页面。进入“系统设置/物理主机”目录下,找到“RAID卡状态检查”,勾选“启用RAID卡状态检查”。
- 当出现内存RAID卡故障时,界面会产生告警提示,提示“主机(xxx.xxx.xxx.xxx)的raid卡异常,将对主机进行网络隔离”。该主机被隔离后,其上虚拟机会自动HA,避免整个集群业务中断。