建议使用Chrome浏览器访问!
技术支持
互动社区
学习培训
深信服官网
合作伙伴

超融合HCI

关注
深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
故障案例库
典型场景排查思路

HCI主机执行MegaCli类工具后可能会导致SAS raid卡reset,主机离线

更新时间:2024-02-02
  • 阅读权限:游客
  • 下载
  • 分享
  • 收藏
所属模块 服务器硬件
适用版本 通用

HCI主机执行MegaCli类工具后,可能会导致SAS raid卡reset。raid卡reset后,在670版本开始会触发raid monitor功能会把网口down掉,隔离主机,看到主机离线

HCI自带有这两个工具:

/sf/bin/raidtools/bin/MegaCli

/sf/bin/raidtools/bin/MegaCli64

以及第三方硬件厂家的收集日志工具,使用前要和厂家确认有没有用到 MegaCli类工具,如果用到执行会不会导致raid卡reset。已知的联想的收集日志的工具包自带有这个类命令:

LogCollect_Linux_v2.3.4u0-1130.zip

后台查看内核日志/sf/log/today/kernel.log ,有看到raid卡 reset

1、是否执行过

2、这种场景下,raid rest后,主机离线的,看下日志,是否看到有网口down操作

/sf/log/today/raid_monitor.log

不要执行MegaCli类工具

/sf/bin/raidtools/bin/MegaCli

/sf/bin/raidtools/bin/MegaCli64

包括第三方的日志收集工具是否包含有MegaCli类工具,执行前要确认清楚。已知的联想的收集日志的工具包会执行这类命令

 LogCollect_Linux_v2.3.4u0-1130.zip

恢复方案:

1)手动up全部网口后,存储网络恢复, 

2)重启主机的sdn服务后,主机的管理网、隧道网恢复,主机上线,网络正常。 

 

本页目录
  • 问题描述
  • 告警信息
  • 有效排查步骤
  • 解决方案
  • 是否是临时解决方案