时延高一般是性能问题,平台性能问题一般就是两个方面:
- 一方面是 DP 转发核跑满
- 另一方面是系统负载高导致中断核CPU被跑满,从而导致收发包时延高,这篇kb针对这一类问题
1. 先看管理口是否被 DP 接管,1)如果接管了且有 p_ethX(非Mellanox网卡);2)没有被接管,则适用下面说的方法
2. 可以优先排查网卡的中断核,查看网卡的中断号列表 cat /proc/interrupts | grep p_ethX
3. 查看每个中断当前所属的 CPU
3. 查看每个CPU核的占用
可以看到有个中断核被跑满了,表明主机负载高,CPU被调度抢占了
4. 排查主机的负载:
可以看到,这个负载很高,伴随其他现象就是主机非常卡,输个 vtpclust 都很卡
需要排查主机负载高的问题。
针对这一问题,有一个KB可以参考。但是主机负载高不一定都是这个KB里面的问题。可以先按照这个KB进行排查,如果不是该问题,则需要进行排查主机负载高的原因。
KB:https://support.sangfor.com.cn/cases/list?product_id=33&type=1&category_id=23556