超融合HCI

深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
点击可切换产品版本
知道了
不再提醒
HCI6.8.0(R1-R2)
{{sendMatomoQuery("超融合HCI","内存CE错误隔离")}}

内存CE错误隔离

更新时间:2023-10-20

功能说明

当业务或平台进程运行在内存 ECC 错误的内存空间上时,内核会收到内存上报的ECC报错信息;深信服超融合平台内存隔离机制将会尝试隔离该内存空间,避免后续业务或者平台进程再次使用该内存空间。

注意事项

内存ECC功能需要服务器CPU支持MCE功能,如涉及到硬件确认,可联系深信服技术支持。

前提条件

操作步骤

  1. 登录超融合HCI平台,当出现内存ECC隔离时,界面会产生告警提示,提示“主机(xxx.xxx.xxx.xxx)的内存条(Px-DIMMxxPx-DIMMxx)出现内存ECC CE可纠正错误过多且无法进行隔”。

单个内存条ECC隔离地址块数量占比超过10%,或1小时内单个内存条出现ECC错误次数超过2000次(无论是否隔离成功)时,会产生普通告警提示;

单个内存条ECC隔离地址块数量占比超过25%,可用内存很少,或1小时内单个内存条出现ECC错误次数超过6000次(无论是否隔离成功)时,会产生紧急告警提示。

电脑萤幕的截图

描述已自动生成

  1. 当平台出现告警提示时,建议联系服务商更换内存条。更换内存条时,请将相应主机开启单主机维护模式后再进行更换。

图片包含 游戏机, 画, 钟表

描述已自动生成

告警提示中的内存条地址是内存条的逻辑地址,需要参照服务器的内存布局示意图才能更换内存条。