更新时间:2022-07-25
当面板指示灯出现异常情况时,需要近一步确定问题,则需要通过IPMI查看详细的事件日志定位问题;日常处理方法如下:
电源故障类建议处理方法
先进IPMI查看事件日志,确认是CPU过热还是MEM过热;
查看发过部件是瞬间的通常是环境温度过热导致,会自行恢复;持续过热则需要关机断电确认;
持续过热且无法降温,需要联系400专家确认是否返修。
内存故障类建议处理方法
先进IPMI查看事件日志,确认异常内存的具体槽位;
故障类,如,内存设备禁用,插槽无法识别出容量,先做插拔仍无法解决返修;不可修正ECC,直接返修对应内存;
告警类,通常是(可修正ECC)数量少,且不是连续多天持续报,可进行清理日志,重启BMC,解决;若持续报数量大,则返修对应内存。
风扇故障类建议处理方法
先进IPMI查看事件日志和查看传感器值;
风扇转速值高于或低于BMC设定阈值会告警,通常能自行恢复不反复发生不用理会;
显示风扇故障,且传感器显示风扇无值,插拔风扇无用后直接返修风扇。
系统故障类建议处理方法
先进IPMI查看事件日志(通常是子系统健康故障);
结合IPMI事件日志确认系统是否引导异常,若异常重启设备通常能解决;
重启无效需要联系专家确认是否返修。
硬盘故障类建议处理方法
重新插拔raid卡;
确认BIOS 内是否识别 raid卡;
确认raid卡上是否有硬盘;
JBOD磁盘,可做插拔,无效,返修磁盘。