建议使用Chrome浏览器访问!
技术支持
互动社区
学习培训
深信服官网
合作伙伴

超融合HCI

关注
深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
故障案例库
典型场景排查思路

【HCI-VN】多台云主机重启后网卡起不来(vlink没下发)

更新时间:2024-07-31
  • 阅读权限:游客
  • 下载
  • 分享
  • 收藏
所属模块 网络问题 | 虚拟网络
适用版本 HCI6.10.0(R1-R2)

反馈虚拟机重启后网卡起不来,但虚拟机编辑界面是显示连线的。

1. 这种情况一般是虚拟机的 vlink 没下发到数据面,可以直接在虚拟机所在主机后台,进入 vn-agent 容器(container_exec -n vn-a)查看 vlink 情况:

sfd_byTools.sh --vlink|grep <vm_id>

如果输出为空,就表示没有 vlink。

 

2. 如果不知道这样排查,可能会去看 qemu 的日志,一般会显示下面的异常,也能说明是 vlink 没有生成。

(PS:这个socket文件是要 vlink 建起来的时候才会去创建)

 

3. 这种情况需要从 VT 管理面-》VN 管控面逐步排查下来

VT 管理面看 sfvt_vtpdaemon 日志,重点关注:

# 查询 vlink 关机是否由 VT 触发的一些日志:
grep -rn "[create_vm_interface_vlink]" /sf/log/today
grep -rn "[shutdown_vm_interface_vlink]" /sf/log/today
grep -rn "update network interfaces" /sf/log/today

 

VT 管理面看到 vlink 下发的标志:

 

VN 管控面详细排查可以看这篇kb,写得比较详细:

http://tskb.sangfor.com/forum.php?mod=viewthread&tid=30890

如果当前日志不够,需要开 LCP debug,如果到这一步,建议上升研发处理了。

 

4. 该问题在开启 debug 后,看到异常如下:

 查看数据库发现 vrrp 出现数据残留。导致 lcp 下发 dp 配置出现异常,lcp 一直报错,影响 vlink 下发。

问题直接原因:mysql出现vrrp的数据残留,导致lcp下发dp配置出现异常,lcp一直报错
内部限制:vmport,vrrp对应location不允许超过3个,该问题存在vrrp的location为4个。

临时恢复:删除mysql多出的异常数据

该问题在6.11.0版本解决,等解决了会出合集补丁

如果出现 lcp 不断重启,也大概率是该问题,优先查看 mysql 数据库,是否有 vmport/vrrp 的 location 超过 4 个的。

 

本页目录
  • 问题描述
  • 告警信息
  • 有效排查步骤
  • 根因
  • 解决方案
  • 建议与总结
您当前处于未登录状态,资料搜索或查找可能会不全面,请登录后以查找更全面的内容注册登录