建议使用Chrome浏览器访问!
技术支持
互动社区
学习培训
深信服官网
合作伙伴

超融合HCI

关注
深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
故障案例库
典型场景排查思路

【KB:330225165】HCI前台告警虚拟路由器运行失败

更新时间:2024-08-26
  • 阅读权限:游客
  • 下载
  • 分享
  • 收藏
所属模块 网络问题
适用版本 HCI 6.7.0HCI 6.7.0R1HCI 6.7.0R2HCI6.7.0R3HCI6.8.0(R1-R2)

HCI前台告警虚拟路由器运行失败,告警描述为“虚拟路由器(xx路由器_xxx)运行失败,请联系技术支持处理。”

  1. 在数据库查询vrrp表中数据发现告警路由器两个实例都是slave。
    # mysql --login-path=root
    # use network
    # select * from vrrp where evr_id='<vr_id>'\G​

    如果是容器版本,需要先进入platform容器

    # /sf/vn/debug/container-util.sh -e platf mysql --login-path=root
  2. 在路由器所在主机查看数据面状态时正常的,是master状态的。
    # con t
    # vrouter <vr_id>
    # show vrrp​
  3. 查看mp日志,发现以下问题。
    # cat /sf/log/today/vn/vn-manager-service-rpc.log​
  4. 查看所有主机的vxlan_alert目录下是否生成了告警文件。如果有请参见解决方案解决,如果没有请联系技术支持定位。
    非容器化执行以下命令:
    # vs_cluster_cmd.sh e 'ls /tmp/vnet_event/vn-reporter/vxlan_alert'
    容器化执行以下命令:
    # sfd_cluster_cmd.sh e 'ls /tmp/vnet_event/vn-reporter/vxlan_alert​'
路由器角色上报消息因为vxlan_alert上报错误而无法处理。

临时规避办法

  1. 手动删除vxlan_alert目录下的告警文件。
    # rm -fr <待删除告警文件名称>​
  2. 重启vn-reportf服务。
    # cd /sf
    # container_exec -n vn-a
    # /sf/vn/etc/init.d/vn-reporter restart​

彻底解决办法

680R2及之后版本已解决,建议升级到HCI 6.8.0R2及以上版本。升级具体操作请参见对应版本的升级指导。

 

本页目录
  • 问题描述
  • 有效排查步骤
  • 根因
  • 解决方案