建议使用Chrome浏览器访问!
技术支持
互动社区
学习培训
深信服官网
合作伙伴

超融合HCI

关注
深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
故障案例库
典型场景排查思路

【HCI-VN】主机系统负载高导致管理网之间时延高分析

更新时间:2024-08-19
  • 阅读权限:游客
  • 下载
  • 分享
  • 收藏
所属模块 网络问题 | 虚拟网络
适用版本 通用

集群的主机管理口时延较高,甚至当笔记本直连也有较高的时延

无,但是管理口时延高导致会导致页面无法登录

时延高一般是性能问题,平台性能问题一般就是两个方面:

- 一方面是 DP 转发核跑满

- 另一方面是系统负载高导致中断核CPU被跑满,从而导致收发包时延高,这篇kb针对这一类问题

1. 先看管理口是否被 DP 接管,1)如果接管了且有 p_ethX(非Mellanox网卡);2)没有被接管,则适用下面说的方法

2. 可以优先排查网卡的中断核,查看网卡的中断号列表 cat /proc/interrupts | grep p_ethX

3. 查看每个中断当前所属的 CPU

3. 查看每个CPU核的占用

可以看到有个中断核被跑满了,表明主机负载高,CPU被调度抢占了

4. 排查主机的负载:

可以看到,这个负载很高,伴随其他现象就是主机非常卡,输个 vtpclust 都很卡

上述可以看到,主机负载也很高,导致网卡的中断核被抢占跑满了,从而导致了管理口通信时延高

需要排查主机负载高的问题。

针对这一问题,有一个KB可以参考。但是主机负载高不一定都是这个KB里面的问题。可以先按照这个KB进行排查,如果不是该问题,则需要进行排查主机负载高的原因。

KB:https://support.sangfor.com.cn/cases/list?product_id=33&type=1&category_id=23556

主机负载高不一定都是这个KB里面的问题。可以先按照这个KB进行排查,如果不是该问题,则需要进行排查主机负载高的原因。

 

 

本页目录
  • 问题描述
  • 告警信息
  • 有效排查步骤
  • 根因
  • 解决方案
  • 操作影响范围
  • 是否是临时解决方案
  • 建议与总结