更新时间:2023-10-25
系统巡检主要为用户提供系统的日常检查、异常排查。
系统管理员可以通过系统巡检功能可以带来以下价值:
- 提高系统稳定性:通过定期巡检系统,可以及时发现并解决系统中的问题,从而提高系统的稳定性和可靠性。
- 预防故障发生:通过巡检可以发现潜在的故障点,及时进行维护和修复,避免故障的发生,减少系统停机时间。
- 提高系统性能:巡检可以发现系统中的性能瓶颈,及时进行优化和调整,提高系统的性能和响应速度。
- 降低维护成本:通过定期巡检可以及时发现问题并进行维护,避免问题扩大化和累积,从而降低维护成本。
系统巡检功能:具备节点硬件健康检测、系统模块检测、业务模块检测、系统配置检测四部分检测功能,及时发现XDR集群存在的告警和故障。包括以下13项检测功能:
- 节点检测
-
- 系统管理员可以通过节点检查获取集群各节点的运行状态是否正常。
- CPU检测
-
- 系统管理员可以通过CPU检测来检查设备负载和IO是否正常。
- 内存检测
-
- 系统管理员可以通过内存检测来检查内存使用率是否正常。
- 磁盘检测
-
- 系统管理员可以通过磁盘检测来检查设备磁盘占用、磁盘IO、文件系统等是否正常。
- 网络检测
-
- 系统管理员可以通过网络检测来检查设备网卡配置、DNS、丢包率等数据是否正常。
- 时间同步
-
- 系统管理员可以通过时间同步来检查各节点间时间是否同步。
- 集群连通性检测
-
- 系统管理员可以通过集群连通性检测来检查设备间数据交互是否正常。
- 系统模块检测
-
- 系统管理员可以通过系统模块检测来集群底座、集群管理、系统组件是否正常。
- 业务模块检测
-
- 系统管理员可以通过业务模块检测来检查各个业务模块运行是否正常 。
- 序列号检测
-
- 系统管理员可以通过序列号检测来检查设备序列号是否正常。
- 数据上云检测
-
- 系统管理员可以通过数据上云检测来检查上云通道配置是否正常。
- 自动升级检测
-
- 系统管理员可以通过自动升级检测来检查设备是否开启了自动升级。
- 网络接口配置检测
-
- 系统管理员可以通过网络接口来检查设备网口配置是否正常。
巡检检测周期:XDR系统,每5分钟会自动巡检一次。
告警/故障处理:高点击黄色感叹号标志,查看系统的告警和故障提示,并提供对应的解决方案,用于参考。