更新时间:2023-12-06
功能说明
超融合平台的网络亚健康功能,通过主机间发送探测报文,检测节点间网络链路的丢包率及时延状况,当达到阈值时,上报告警,有效避免因链路问题而导致的业务中断的风险。
前提条件
无
注意事项
- 环境刚部署15min无法识别网口是否是亚健康状态。
- 支持配置网络亚健康检测的VLAN ID, 但不支持业务口配置到VLAN子网口。
- 支持检测服务器节点间外部物理链路时延(包括网卡、光模块、物理传输介质、交换机),不受操作系统进程调度时延影响。终端通信网只支持服务器之间的链路检测。
- 支持网络亚健康检测的场景如下:
|
聚合 |
不聚合 |
聚合与不聚合混用 |
管理口 |
√ |
√ |
√ |
VXLAN口 |
√ |
√ |
√ |
业务口 |
√ |
√ |
√ |
存储私网口 |
√ |
√ |
× |
终端通信口 |
√ |
√ |
√ |
- 其中聚合网口场景,支持区分成员口的亚健康检测,支持的聚合模式包括:主备聚合,负荷分担,LACP。但不支持轮询(mode0,round-robin)策略的负荷分担模式;不支持老版本升级上来的VS聚合模式;集群间vxlan跨三层探测,聚合网口的时延丢包检测结果不区分成员口。
- 如下场景不支持网络亚健康检测:
• SCP与HCI之间网络链路的亚健康检测。
• 仲裁节点的通信网络亚健康检测(2+1仲裁,延伸集群+仲裁)。
• 异构(vmware)纳管场景下,不支持异构集群内网络亚健康检测,不支持HCI与异构集群间的往来亚健康检测。
• SCP纳管物理主机场景。
操作步骤
进入[可靠服务/主机亚健康监控/亚健康配置/网络亚健康配置]界面,可配置通信口的时延阈值和丢包阈值,当触发阈值时将进行告警。
不同网口网络亚健康配置如下表所示:
网口功能 |
低灵敏度 |
中灵敏度 |
高灵敏度 |
统计时间窗口 |
界面告警刷新频率 |
网络恢复正常后,最大告警解除时间 |
管理通信口 |
丢包率>=10%,时延>=120ms 探测频率1次/s |
丢包率>=5%,时延>=75ms 探测频率1次/s |
丢包率>=1%, 时延>=50ms 探测频率2次/s |
3min |
1min |
4min |
业务通信口 |
丢包率>=10%,时延>=120ms 探测频率1次/s |
丢包率>=5%,时延>=75ms 探测频率1次/s |
丢包率>=1%, 时延>=50ms 探测频率2次/s |
3min |
1min |
4min |
数据通信口 |
丢包率>=10%,时延>=120ms 探测频率1次/s |
丢包率>=5%,时延>=75ms 探测频率1次/s |
丢包率>=1%, 时延>=50ms 探测频率2次/s |
3min |
1min |
4min |
存储通信口 |
丢包率>=0.2%,时延>=1.2ms 探测频率10次/s |
丢包率>=0.1%,时延>=850us 探测频率10次/s |
丢包率>=0.04%, 时延>=500us 探测频率10次/s |
15min |
1min |
4min |
终端通信口 |
丢包率>=2%,时延>=50ms 探测频率1次/s |
丢包率>=1%,时延>=25ms 探测频率1次/s |
丢包率>=1%, 时延>=5ms 探测频率2次/s |
3min |
1min |
4min |