建议使用Chrome浏览器访问!
技术支持
互动社区
学习培训
深信服官网
合作伙伴

超融合HCI

关注
深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
故障案例库
典型场景排查思路

【HCI-LMT】磁盘(XXX)非介质错误数超限,非介质错误发生1003次,大于等于阈值1000。建议:请及时更换磁盘。

更新时间:2024-10-18
  • 阅读权限:游客
  • 下载
  • 分享
  • 收藏
所属模块 集群维护 | 日志和告警
适用版本 HCI6.10.0以上
告警:磁盘(XXX)非介质错误数超限,非介质错误发生1003次,大于等于阈值1000。建议:请及时更换磁盘。
磁盘(XXX)非介质错误数超限,非介质错误发生1003次,大于等于阈值1000。建议:请及时更换磁盘。

检测原理:

首先获取对应磁盘的信息,使用命令:smartctl -iHA ,如下图所示。ID对应的为smart_id_raw 中的id, RAW_VALUE对应的是smart_id_raw中的raw_value。

磁盘非介质错误超限告警是判断smart_996_raw的值val_996是否大于等于阈值1000, 需要查看是否存在ID 为 996的内容,如果不存在,无需判断。如果存在需要判断,获取RAW_VALUE 判断是否大于1000,如果大于告警。

以下示例中没有ID=996对应的内容,作为参考查看。

磁盘存在非介质错误
更换磁盘
主机磁盘
见排查步骤

 

 

本页目录
  • 问题描述
  • 告警信息
  • 有效排查步骤
  • 根因
  • 解决方案
  • 操作影响范围
  • 是否是临时解决方案
  • 建议与总结
  • 排查内容