建议使用Chrome浏览器访问!
技术支持
互动社区
学习培训
深信服官网
合作伙伴

超融合HCI

关注
深信服超融合SANGFOR HCI是面向下一代数据中心的软件定义基础架构,通过虚拟化技术融合计算、存储、网络和安全等资源,并提供运维管理、容灾备份、智能监控等高级特性,帮助用户构建极简、稳定、高性能的云化数据中心基石。
故障案例库
典型场景排查思路

【HCI-VT】虚拟机内部/var/sangfor/recv/下目录堆积文件过多导致虚拟机异常

更新时间:2023-01-05
  • 阅读权限:游客
  • 下载
  • 分享
  • 收藏
所属模块 虚拟机内部 | 虚拟机内部环境问题
适用版本 通用
客户587R3环境,虚拟机安装了性能优化工具,发现内部/var/sangfor/recv/5/0/目录下堆积了200多万个文件(msg、hdr),影响了客户业务。
虚拟机内部/var/sangfor/recv/5/0/目录下有大量文件,文件生成太多inodes存储区被占用80%已经到了预警阈值。

1. 查看虚拟机只配置了8G内存,free为0,vmtools进程占用内存不高。
2. guest机内部的mod5收到host发来的icmp包请求,但2021.05.26就不再打日志了,说明应该是某个地方hang住了

3. 低版本的sdnagent是常驻服务,会一分钟定时发一次请求,每次请求生成4个文件,即一分钟4个文件。

4.为啥linux会读到windows请求,因为 sdnagent发送消息时不区分操作系统类型.不过这个不影响住流程,linux读到windows,识别不出msgid后会丢掉请求并把文件删除。

1、虚拟机内部堆积的是sdnagentd服务请求生成的文件,sdnagentd每分钟定时发送icmp请求到虚拟机机并生成4个文件,粗略计算2021.05.26-2022.07.12可以生成237w个,与描述一致。
2、sdnagent通过vmproxy服务与guest机通信,将消息持久化到文件(msg),由于虚拟机内部报表服务卡住,无法处理消费消息,造成文件的累积。(报表服务卡住原因未知)

虚拟机内部重启vmtools可解决
670版本以前的装有性能优化工具的虚拟机业务
1、sdnagent服务在670版本已经废弃,目前已知的HCI侧已没有定时向虚拟机内部发送请求的服务。670以后应该不会再出现由于报表服务异常卡主导致无法消费消息造成文件堆积的现象。
2、虚拟机内部vmtools方法:在/usr/local/VMOptimizationTools目录下先执行./stopall 再./startall,进行重启
3、设计时需要考虑消费者无法消费消息的特殊情况,此时生产者应该被限制发消息,或者服务端有兜底机制去及时清理无法消费的消息。

虚拟机vmtools与宿主机通信异常,报表进程卡主,无法消费宿主机发来的消息文件,虚拟机内部文件累积过多。
本页目录
  • 问题描述
  • 告警信息
  • 有效排查步骤
  • 根因
  • 解决方案
  • 操作影响范围
  • 是否是临时解决方案
  • 建议与总结
  • 排查内容