1、进 /sf/log/kdump目录,查看是否有生成宕机日志,如有,查看宕机日志是否跟宕机截图一样,先是报一个硬盘一直io error,然后有内核堆线,指向RAID卡驱动smartpqi,踩到空指针BUG,是则检查报错硬盘smart,有异常则返修磁盘并升级RAID卡驱动,硬盘正常则升级RAID卡驱动到最新版本。
2、如无宕机日志,则查看下IPM日志是否有硬件报错,内核日志、mce日志查看是否有硬件报错,有则返修对应部件,无则找对应产品线研发排查。
原因:
Io timeout导致驱动异常,踩到空指针,导致设备宕机,固件与驱动版本不匹配,原厂建议驱动升级到2.1.10-020版本,协调对应产品线研发处理。