1、首先根据提示检查agent状态,虚拟机上agent状态正常,agentcheck结果也正常;
2、查看虚拟机日志,重点看RVLAgent日志,有如下日志记录:提示没有qxl显示设备
3、梳理RVLAgent逻辑,发现在五qxl设备时,RVLAgent会向客户端传递没有显卡的信息,然后客户端会对应输出问题现象中的报错;
4、检查设备管理器,发现显示设备正常,存在两个qxl设备;
5、因为设备管理器中设备状态正常,需要进一步分析RVLAgent识别不到qxl显卡的原因,增加日志发现,RVLAgent识别到的显卡描述,不带有sangfor字段,仅带有TitanGPU controller字段,而识别逻辑要求有sangfor字段,导致识别不到qxl显卡;
6、检查正常环境中,qxl显卡设备的描述应该是Sangfor TitanGPU controller,查看设备描述符也是如此
7、在删除显示设备后重启(重启后平台会再插上显卡),更新显卡驱动后正常