建议使用Chrome浏览器访问!
技术支持
互动社区
学习培训
深信服官网
合作伙伴

超融合HCI

关注
深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
故障案例库
典型场景排查思路

【HCI-Qemu】虚拟机异常挂起或黑屏,后台查看QEMU进程卡在nfs_fstat

更新时间:2025-03-15
  • 阅读权限:游客
  • 下载
  • 分享
  • 收藏
所属模块 虚拟存储 | 虚拟存储磁盘
适用版本 通用
在vs出现故障后QEMU提交IO不返回导致QEMU卡住,虚拟机挂起或控制台是黑屏状态,为了恢复业务需要kill掉QEMU进程进行HA恢复业务

1.、确认QEMU是否卡住,在asv 容器中执行cat /proc/ <QEMU pid>/stack 查看QEMU堆栈,主线程一直是卡住状态,堆栈中出现nfs_fstat 调用但是一直未返回

2、当QEMU堆栈出现nfs_fstat IO不返回异常一般是vs存储服务存在异常,找vs相关人员确认存储是否出现了异常

查看QEMU的日志路径:日志路径:/sf/log/today/sfvt_qemu_<vmid>.log 

集群环境IO流量波动有概率导致少量IO超时,超时超过3s会触发磁盘服务断开后自动重连,重连失败后自动转入了60s超时逻辑,IO累计60s才超时断开导致部分虚拟机IO异常挂起;

存储自动恢复后虚拟机未自动恢复,原因是加锁的时候调用nfs_fstat,然后nfs_fstat一直没返回,导致卡住重启虚拟机后恢复。

升级6.11.1以上版本
内部TD:http://200.200.26.182:86/#/defect/details/2024111500350
虚拟机会HA自动拉起
和客户协商一致后操作
Qemu的卡住堆栈,Qemu 日志
本页目录
  • 问题描述
  • 告警信息
  • 有效排查步骤
  • 根因
  • 解决方案
  • 操作影响范围
  • 是否是临时解决方案
  • 建议与总结
  • 排查内容