更新时间:2024-05-09
当面板指示灯出现异常情况时,需要近一步确定问题,则需要通过IPMI查看详细的事件日志定位问题;日常处理方法如下:
- 电源故障类建议处理方法
• 先进IPMI查看事件日志,确认是CPU过热还是MEM过热;
• 查看发过部件是瞬间的通常是环境温度过热导致,会自行恢复;持续过热则需要关机断电确认;
• 持续过热且无法降温,需要联系400专家确认是否返修。
- 内存故障类建议处理方法
• 先进IPMI查看事件日志,确认异常内存的具体槽位;
• 故障类,如,内存设备禁用,插槽无法识别出容量,先做插拔仍无法解决返修;不可修正ECC,直接返修对应内存;
• 告警类,通常是(可修正ECC)数量少,且不是连续多天持续报,可进行清理日志,重启BMC,解决;若持续报数量大,则返修对应内存。
- 风扇故障类建议处理方法
• 先进IPMI查看事件日志和查看传感器值;
• 风扇转速值高于或低于BMC设定阈值会告警,通常能自行恢复不反复发生不用理会;
• 显示风扇故障,且传感器显示风扇无值,插拔风扇无用后直接返修风扇。
- 系统故障类建议处理方法
• 先进IPMI查看事件日志(通常是子系统健康故障);
• 结合IPMI事件日志确认系统是否引导异常,若异常重启设备通常能解决;
• 重启无效需要联系专家确认是否返修。
- 硬盘故障类建议处理方法
• 重新插拔raid卡;
• 确认BIOS 内是否识别 raid卡;
• 确认raid卡上是否有硬盘;
• JBOD磁盘,可做插拔,无效,返修磁盘。