1.、确认QEMU是否卡住,在asv 容器中执行cat /proc/ <QEMU pid>/stack 查看QEMU堆栈,主线程一直是卡住状态,堆栈中出现nfs_fstat 调用但是一直未返回
2、当QEMU堆栈出现nfs_fstat IO不返回异常一般是vs存储服务存在异常,找vs相关人员确认存储是否出现了异常
查看QEMU的日志路径:日志路径:/sf/log/today/sfvt_qemu_<vmid>.log
集群环境IO流量波动有概率导致少量IO超时,超时超过3s会触发磁盘服务断开后自动重连,重连失败后自动转入了60s超时逻辑,IO累计60s才超时断开导致部分虚拟机IO异常挂起;
存储自动恢复后虚拟机未自动恢复,原因是加锁的时候调用nfs_fstat,然后nfs_fstat一直没返回,导致卡住重启虚拟机后恢复。