- 进入HCI后台,查看虚拟机监控信息显示“xxxmsgxxx无响应,请稍后重试或重启!...“,qemu无响应,怀疑qemu卡死。
HCI 6.8.0及以上版本需执行以下命令进入ASV容器
container_exec -n asv-c
qm monitor [vmid]
qm> info status
qm> io cont
qm> info block

- 根据最初挂起的时间点分析,磁盘中报错磁盘空间不足。

- 根据【系统管理】-【操作日志】可以看出,挂起时间段有批量删除快照的动作,快照删除原理涉及到数据合并, 数据合并过程会申请大量空间去合并数据,合并完毕后才会释放空间,所以导致业务申请空间失败虚拟机异常挂起。

- 根据qemu日志分析,qemu 的主线出现异常,还在等待上一次请求。
# cat /sf/log/[日期]/sfvt_qemu_[vmid].log

临时解决办法
联系研发在后台重启NFS,然后重启qemu服务,以恢复虚拟机业务。(高危操作务必联系研发操作)
彻底解决办法
HCI 6.8.0R1及以上版本对批量操作申请存储空间问题进行了优化,建议将环境升级至HCI最新版本。