1. 首先ping测试看一下,从外部ping虚拟机,简单抓个包看下,发现丢包时 HCI 这边无法抓到请求包

2. 为了进一步实锤,可要求从虚拟机往外ping一下,包括同主机、跨主机都ping一下
发现同主机跨主机不丢包,但ping网关丢包。
进一步抓包发现:也是request包出去,外部没回reply,网口统计没丢包增长。


3. 这种情况只能检查下交换机的情况,如果不好确认,可以用一台PC接在交换机上ping网关看看,是不是也丢包
4. 查看交换机的mac表,就发现存在有两条相同的mac记录,这个mac特点是虚拟机的mac。确认HCI内部存在两台相同MAC的虚拟机。

重新自动获取虚拟机的mac,梳理集群是否还存在mac冲突的虚拟机。
内部已提需求在产品内提供防呆机制,保证虚拟机mac不会冲突。
同时会工具化,排查问题前先用工具检测一遍问题。