建议使用Chrome浏览器访问!
技术支持
互动社区
学习培训
深信服官网
合作伙伴

超融合HCI

关注
深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
故障案例库
典型场景排查思路

【KB:330426315】在VDC基于模板创建虚拟机后,同时间点还原模式开启虚拟机后概率性出现IO挂起

更新时间:2024-11-28
  • 阅读权限:游客
  • 下载
  • 分享
  • 收藏
所属模块 虚拟机编辑 | 虚拟机开关机
适用版本 HCI 6.3.0R2HCI 6.3.0R1HCI 6.3.0HCI 6.2.3HCI 6.2.0HCI 6.1.0HCI 6.0.1HCI 6.7.0HCI 6.3.0R3HCI 6.3.20PHCI 6.7.0R1HCI 6.7.0R2HCI6.7.0R3HCI6.8.0(R1-R2)HCI6.8.1HCI6.9.0HCI 6.0.0及以下版本HCI6.9.1HCI6.8.0HCI6.8.0R1HCI6.8.0R2

在VDC基于模板创建虚拟机后,同时间点还原模式开机虚拟机后概率性出现IO挂起。

描述:虚拟机(xxx)IO读写失败,导致虚拟机异常挂起,请检查存储网络是否断开,如果是网络断开,则重新连接即可自动恢复。

  1. 排查vtpdaemon日志收到两次开机请求调度服务执行不同主机执行虚拟机开机,205,208主机。
    grep 'boot the vm [vmid]' /sf/log/[日期]/sfvt_vtpdaemon.log
    grep [vmid] /sf/log/[日期]/scheduler.log*|grep '启动虚拟机:[vmid]' | grep '01 22'
    sfd_cluster_cmd.sh e "grep rename /sf/log/[日期]/sfvt_vtpdaemon.log|grep [vmid]|grep '01 22'"
  2. 在205主机查看vtpdaemon日志。
    cat /sf/log/[日期]/sfvt_vtpdaemon.log
     205主机在22:18:13设置虚拟机临时状态为starting,并创建锁成功进入虚拟机模板还原流程。

    205主机在22:19:52执行完虚拟机 启动流程后释放锁,开启虚拟机完成。

  3. 在208主机查看vtpdaemon日志,208主机判断虚拟机未在运行时在22:19:52成功拿到锁后再执行一次虚拟机模板还原流程后台开机失败;

  4. 在205主机查看qemu日志,可看到在205虚拟机开机成功运行的虚拟机持续写入已经被删除掉的文件,从而导致运行一段时间之后导致业务挂起。
    cat /sf/log/[日期]/sfvt_qemu_[vmid].log​

并发开机场景处理时对虚拟机状态与加锁检测低概率未拦截导致执行还原流程执行两次后虚拟机挂起。
(客户侧有定时开机计划任务和同时手动点还原模式开机)

临时解决办法 

临时取消开机计划或者手动开机时错开定时开机计划的时间。

彻底解决办法

HCI 6.10.0及以上版本已修复,可升级至HCI6.10.0及以上版本。

本页目录
  • 问题描述
  • 有效排查步骤
  • 根因
  • 解决方案
您当前处于未登录状态,资料搜索或查找可能会不全面,请登录后以查找更全面的内容注册登录