超融合HCI

深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
{{sendMatomoQuery("超融合HCI","磁盘异常告警")}}

磁盘异常告警

更新时间:2025-12-10

磁盘卡慢、磁盘故障、磁盘离线、磁盘不识别、磁盘亚健康

可查看硬件服务器指示灯、查看磁盘灯状态、可登录服务器IPMI(MGMT)管理页面

索引:

①确认故障现象、告警信息及业务影响
②卡慢盘处理指导
③磁盘离线处理指导
④磁盘不识别处理指导
⑤磁盘亚健康处理指导

详细操作步骤说明

步骤1:确认故障现象、告警信息及业务影响

操作影响说明:无

1、检查磁盘管理界面是否存在明显告警信息,如磁盘告警延时过大:

告警磁盘卡慢

2、磁盘离线

3、磁盘不识别(新建存储卷/虚拟存储扩容/磁盘替换/新增本地存储等场景)

4、磁盘亚健康

 

步骤2:卡慢盘处理指导

   操作影响说明:无

1、查看具体告警信息,可能的告警现象如下所示:

现象一:告警提示-硬盘已确诊为卡慢盘并已隔离,请更换该硬盘!该硬盘重建任务完成前请勿对其它主机的硬盘进行拔插操作。

现象二:告警提示-硬盘出现卡慢,已被临时隔离,请勿对此硬盘进行拔插操作。

现象三:告警提示-硬盘疑似慢盘,慢盘会导致业务卡慢,为防止业务再次受到影响,目前对该盘进行永久隔离,该硬盘重建任务完成前请勿对其它主机的硬盘进行拔插操作。

现象四:告警提示-硬盘已确诊为卡慢盘,硬盘自动隔离失败,会影响业务性能,可手动点击“隔离硬盘”按钮隔离处理,如果还是失败,请联系深信服科技处理!

现象五:告警提示-硬盘IO延时大,硬盘时延大于25毫秒,如果业务受到影响可隔离该硬盘,如果业务未受到影响可忽略。

现象六:告警提示-硬盘的IO性能低于正常硬盘,建议更换该硬盘。

现象七:告警提示-硬盘出现卡慢,正在尝试通过重置恢复。

现象八:告警提示-硬盘的IO卡顿,一般是硬盘故障或者raid卡故障导致,请联系深信服科技确认问题,如果是硬盘故障,请更换该硬盘。

现象九:告警提示-硬盘疑似卡盘,硬盘自动隔离失败,请到“硬盘管理”页面查看硬盘是否已经隔离。如果未隔离,可手动点击“隔离硬盘”按钮隔离处理,如果还是失败,请联系深信服科技处理!

现象十:告警提示-疑似卡盘,该硬盘的服务已经被临时停止!

现象十一:告警提示-疑似卡盘,已被临时隔离,请勿对此硬盘进行拔插操作。

现象十二:告警提示-硬盘发生IO错误,该问题一般是由硬件故障造成,并且会严重危害您的数据安全,请更换该硬盘。

现象十三:告警提示-硬盘发生IO错误,会严重危害您的数据安全,请更换该硬盘。

现象十四:告警提示-故障硬盘已被热备盘成功替换,请在确认该硬盘已经从物理主机上拔出后,点击删除硬盘。

2、若符合以上告警现象,请联系深信服技术支持进一步确认是否需要更换返修磁盘,400热线:4006306430。

步骤3:磁盘离线处理指导

   操作影响说明:无

1、可能原因如下:
(1)磁盘出现坏道或者磁盘损坏
(2)存储私网有丢包情况
(3)raid卡出现故障

2、若出现单块磁盘离线,可尝试重新拔插硬盘或将硬盘拔出后插入其他正常主机的磁盘槽位检查是否可正常识别,若均无法识别,请联系深信服技术支持进一步确认是否需要更换返修磁盘,400热线:4006306430

 

3、若出现多块磁盘离线,先检查各主机存储网络、存储网络交换机是否正常,同时联系深信服技术支持报修

步骤四:磁盘不识别处理指导

   操作影响说明:无

1、测试添加本地存储是否能发现磁盘;

能发现:说明硬件层面磁盘识别正常,界面识别不到可能是磁盘组了raid导致
1)、缓存盘和数据盘仅支持直通(JBOD.NON-RAID)、单盘raid0模式
2)、缓存盘和数据盘不建议使用RAID0模式(RAID0不支持热插拔)
不支持热拔插:拔插磁盘可能会导致raid卡整列信息丢失,导致磁盘无法识
不能发现:可能硬件层面可能没识别到磁盘,进入下一步排查


2、进入ipmi或者BMC界面,查看磁盘是否识别正常(检查磁盘是否在线、raid卡状态是否正常)。如图可以在ipmi界面看到磁盘是否在线,且可以看到raid卡状态是否正常
注意:缓存盘和数据盘仅支持直通(JBOD.NON-RAID)、单盘raid0模式

3、如果ipmi或BMC界面无法看到磁盘状态,可以重启服务器进入raid卡界面查

步骤5:磁盘亚健康处理指导

   操作影响说明:无

1、亚健康磁盘典型的表现为:硬盘变慢、卡顿、寿命即将用尽,坏道数过多等

2、可根据告警信息提示,联系深信服技术支持进一步确认是否需要更换返修磁盘,400热线:4006306430

3、建议开启坏道扫描功能,路径【[存储/虚拟存储】-【高级设置】-【可靠性配置】-【定时坏道扫描】

4、建议开启主机亚健康检测,路径[可靠服务/主机亚健康监控],进入亚健康主机设置,勾选主机亚健康监控及处置的选项。并在[系统管理/高级设置]中,勾选应用层假死配置项。亚健康主机告警策略如下图所示:

应用层假死检测如下图所示:

 

配置验证:无

配置可能涉及的关联问题:无