云运维订阅

深信服云运维订阅(原云端智能大脑)是适用于深信服超融合信服云平台的智能运维管理组件。通过镜像模板的方式快速部署于超融合基础设施上,可以将业务环境中的故障告警及潜在环境风险加密传输到云端智能大脑。基于深信服自研天工智能引擎帮助用户快速闭环故障,提前预测环境风险并提供处置建议。
点击可切换产品版本
知道了
不再提醒
v2.5.0
{{sendMatomoQuery("云运维订阅","云主机监控详情")}}

云主机监控详情

更新时间:2024-09-02

2.3.2.1.进入云主机监控详情

在云主机列表中点击云主机名称,会新开tab页面展示云主机监控详情信息,默认跳转展示云主机关联对象信息。

2.3.2.2.查看基础信息

若云主机已安装Agent且采集正常,在云主机监控详情下将展示云主机基础信息。

2.3.2.3.根因分析拓扑

在关联拓扑图中,鼠标悬浮可查看对象资源的运维风险事件信息。

悬浮窗中支持点击跳转查看对象资源的监控信息和运维风险事件信息。点击查看监控按钮将跳转对象资源监控详情下监控界面。

悬浮窗内点击告警事件或风险事件边的>,将跳转智能事件中心并筛选出对象资源当前实时告警或实时风险。

2.3.2.4.监控详情

在云主机监控详情界面点击监控标签切换到监控界面,即可展示云主机监控信息。

1.1.1.1.1监控大盘展示

点击页面下右上角小齿轮按钮,支持自定义设置在概要、操作系统、进程、CPU、内存、磁盘、磁盘IO、网络下监控指标图表展示。

1.1.1.1.1.1设置大盘展示时间

点击页面下右上角时间设置下拉框,可自定义选择展示云主机最多近一年时间段的监控数据。

1.1.1.1.1.2查看监控图表详情

点击概要标签,可查看云主机监控详情概要下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。

图表中仅内存使用率和CPU使用率在悬浮时可以点击查看当前时间节点云主机Top5进程的内存或CPU使用情况。

以下为概要标签下图表展示参数信息:

图表名称

曲线采集指标

曲线图例名称

内存使用率

host_mem_used_bytes

内存使用率

CPU使用率

host_cpu_used_percent_sum

CPU使用率

系统平均负载

host_system_load1

host_system_load5

host_system_load15

1分钟系统平均负载

5分钟系统平均负载

15分钟系统平均负载

CPU IO 等待

host_cpu_iowait_sum

CPU IO等待使用率

内存swap使用率

host_mem_swap_used_percent

内存swap使用率

磁盘总使用率

host_disk_used_percent_sum

磁盘总使用率

磁盘inode总使用率

host_disk_inodes_used_percent_sum

磁盘inode总使用率

磁盘IO平均延迟

host_diskio_await_avg

磁盘IO平均延迟

网卡总带宽(Linux独有)

host_net_bandwidth_bytes_sum

网卡总带宽

TCP总连接数

host_netstat_sum

TCP总连接数

2.3.2.5.操作系统监控

点击操作系统标签,可查看云主机监控详情操作系统下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。

以下为操作系统标签下图表展示参数信息:

图表名称

曲线采集指标

曲线图例名称

机械运行时间

host_system_uptime_seconds

机械运行时间

系统平均负载

host_system_load1

host_system_load5

host_system_load15

1分钟系统平均负载

5分钟系统平均负载

15分钟系统平均负载

进程个数(Linux独有)

host_processes_blocked

host_processes_zombies

host_processes_stopped

host_processes_running

host_processes_sleeping

host_processes_total

阻塞进程个数

僵尸进程个数

停止进程个数

运行中进程个数

睡眠进程个数

进程总数

进程运行率(Linux独有)

host_processes_percent

进程运行率

TCP连接数

host_netstat_established

host_netstat_non_established

host_netstat_listen

host_netstat_close_wait

host_netstat_sum

ESTABLISHED状态的TCP连接数

ESTABLISHED状态的TCP连接数

listen状态的TCP连接数

CLOSE_WAIT状态的TCP连接数

TCP总连接数

TCP连接缓冲区大小(Linux独有)

host_netstat_rx_queued_bytes

host_netstat_tx_queued_bytes

TCP连接接收缓冲区总大小

TCP连接发送缓冲区总大小

活跃的UDP套接字个数

host_netstat_udp_socket

活跃的UDP套接字个数

2.3.2.6.进程监控

点击进程标签,可查看云主机监控详情下进程Top5列表信息。列表展示筛选时间内进入过Top5的进程监控信息,默认排序按照CPU降序排序。

在进程列表中,点击进程名称前的展开按钮即可查看该进程监控信息。

以下为进程标签下图表展示参数信息:

图表名称

曲线采集指标

曲线图例名称

内存使用率

host_process_mem_used_percent

内存使用率

CPU使用率

host_process_cpu_used_percent

CPU使用率

IO每秒大小

host_process_io_write_bytes

host_process_io_read_bytes

打开文件数(Linux独有)

host_process_open_file

打开文件数

2.3.2.7.CPU监控

点击CPU标签,可查看云主机监控详情CPU下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。图表中仅CPU使用率在悬浮时可以点击查看当前时间节点云主机Top5进程CPU使用情况。

以下为CPU标签下图表展示参数信息:

图表名称

曲线采集指标

曲线图例名称

CPU使用率

host_cpu_used_percent

CPU使用率

用户态CPU使用率

host_cpu_user_sum

用户态CPU使用率

系统态CPU使用率

host_cpu_sys_sum

系统态CPU使用率

空闲CPU使用率

host_cpu_idle_sum

空闲CPU使用率

CPU IO 等待

host_cpu_iowait_sum

CPU IO 等待使用率

中断CPU使用率

host_cpu_irq_sum

中断CPU使用率

软中断CPU使用率

host_cpu_softirq_sum

软中断CPU使用率

虚拟CPU等待物理CPU的时间百分比

host_cpu_steal_sum

虚拟CPU等待物理CPU的时间百分比

2.3.2.8.内存监控

点击内存标签,可查看云主机监控详情内存下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。图表中仅内存使用率在悬浮时可以点击查看当前时间节点云主机Top5进程内存使用情况。

以下为内存标签下图表展示参数信息:

图表名称

曲线采集指标

曲线图例名称

内存使用率

host_mem_used_percent

内存使用率

内存大小

host_mem_total_bytes

host_mem_available_bytes

host_mem_used_bytes

host_mem_free_bytes

内存总量大小

可用内存大小

已用内存大小

空闲内存大小

cache置换大小(Linux独有)

host_mem_swap_cached_bytes

cache置换大小

内存swap大小

host_mem_swap_total_bytes

host_mem_swap_used_bytes

host_mem_swap_free_bytes

内存swap大小

已用内存swap大小

空闲内存swap大小

内存swap使用率

host_mem_swap_used_percent

内存swap使用率

内存swap每秒大小

host_mem_swap_in_pages_per_second

host_mem_swap_out_pages_per_second

内存swap每秒入大小

内存swap每秒出大小

内存每秒页故障量

host_mem_page_fault_pages_per_second

内存每秒页故障量

2.3.2.9.磁盘监控

点击磁盘标签,可查看云主机监控详情磁盘下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。可自定义选择需要展示的磁盘分区监控视图。

以下为磁盘标签下图表展示参数信息,以磁盘分区/boot为例:

图表名称

曲线采集指标

曲线图例名称(示例)

磁盘分区使用率

host_disk_used_percent

磁盘分区/boot使用率

磁盘分区大小

host_disk_size_bytes

host_disk_free_bytes

host_disk_used_bytes

磁盘分区/boot大小

磁盘分区/boot剩余量大小

磁盘分区/boot使用量大小

磁盘分区inode使用率

host_disk_inodes_used_percent

磁盘分区/boot inode使用率

磁盘分区inode数量

host_disk_inodes

host_disk_inodes_free

host_disk_inodes_used

磁盘分区/boot inode总数量

磁盘分区/boot 空闲inode数量

磁盘分区/boot 已用inode数量

2.3.2.10.磁盘IO监控

点击磁盘IO标签,可查看云主机监控详情磁盘IO下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。可自定义选择需要展示的磁盘监控视图。

以下为磁盘IO标签下图表展示参数信息,以磁盘vda为例:

图表名称

曲线采集指标

曲线图例名称(示例)

磁盘IO使用率

host_diskio_used_percent

磁盘vda IO使用率

磁盘IO每秒请求数量

host_diskio_read_count_per_second

host_diskio_write_count_per_second

磁盘vda IO每秒读请求数量

磁盘vda IO每秒写请求数量

磁盘IO每秒大小

host_diskio_read_bytes_per_second

host_diskio_write_bytes_per_second

磁盘vda IO的每秒读入大小

磁盘vda IO的每秒写入大小

磁盘IO每秒加权时间

host_diskio_weighted_io_time_per_second

磁盘vda IO每秒加权时间

磁盘IO平均请求大小

host_diskio_avg_request_bytes

磁盘vda IO平均请求大小

磁盘IO平均等待时间

host_diskio_await

host_diskio_r_await

host_diskio_w_await

磁盘vda IO请求平均等待时间

磁盘vda IO读请求平均等待时间

磁盘vda IO写请求平均等待时间

2.3.2.11.网络监控

点击网络标签,可查看云主机监控详情网络下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。可自定义选择需要展示的网卡监控视图。

以下为网络标签下图表展示参数信息,以网卡eth0为例:

图表名称

曲线采集指标

曲线图例名称(示例)

网卡带宽大小(Linux独有)

host_net_bandwidth_bytes

网卡eth0带宽大小

网卡每秒包数

host_net_recv_packets_per_second

host_net_send_packets_per_second

网卡eth0每秒接收包数

网卡eth0每秒发送包数

网卡每秒流量带宽使用率(Linux独有)

host_net_recv_bytes_per_second_percent

host_net_send_bytes_per_second_percent

网卡eth0每秒入向流量带宽使用率

网卡eth0每秒出向流量带宽使用率

网卡每秒流量

host_net_recv_bytes_per_second

host_net_send_bytes_per_second

网卡eth0每秒入向流量

网卡eth0每秒出向流量

网卡每秒丢包率

host_net_recv_drop_packets_per_second_percent

host_net_recv_drop_packets_per_second_percent

网卡eth0每秒接收丢包率

网卡eth0每秒发送丢包率

网卡每秒丢包数

host_net_recv_drop_packets_per_second

host_net_send_drop_packets_per_second

网卡eth0每秒接收丢包数

网卡eth0每秒发送丢包数

网卡每秒错包率

host_net_recv_error_packets_per_second_percent

host_net_send_error_packets_per_second_percent

网卡eth0每秒接收错包率

网卡eth0每秒发送错包率

网卡每秒错包数

host_net_recv_error_packets_per_second

host_net_send_error_packets_per_second

网卡eth0每秒接收错包数

网卡eth0每秒发送错包数

网卡每秒缓冲溢出错包数

host_net_recv_fifo_error_packets_per_second

host_net_send_fifo_error_packets_per_second

网卡eth0每秒接收缓冲区溢出错包数

网卡eth0每秒发送缓冲区溢出错包数

2.3.2.12.云主机当前告警

在云主机监控详情界面点击当前告警标签切换到当前告警界面,展示云主机当前未关闭的告警事件。

1.1.1.1.2当前告警详情

在云主机监控详情下当前告警列表中,点击告警操作栏中详情按钮,将跳转该告警事件详情进行查看。

1.1.1.1.3当前告警搜索

云主机监控详情下当前告警列表支持按照问题描述、集群名称的关键字搜索。

1.1.1.1.4响应当前告警

在云主机监控详情下当前告警列表中,点击告警操作栏中响应按钮后,该告警事件状态将变更为处理中且响应按钮将隐藏不支持再次响应。

在云主机监控详情下当前告警列表中,勾选告警事件的复选框,支持对批量告警进行响应。

1.1.1.1.5确认当前告警

在云主机监控详情下当前告警列表中,点击告警操作栏中确认按钮后,该告警事件状态将变更为已关闭且从当前事件列表中移除。

在对单条告警事件进行确认时,二次确认弹窗默认不勾选屏蔽所选事件。若勾选将创建屏蔽策略(可于【产品与服务】--> 【云端智能大脑】-->【智能事件中心】-->【通知屏蔽】中查看创建的屏蔽策略),该告警事件下次触发时将直接屏蔽。若需要恢复,在【产品与服务】--> 【云端智能大脑】-->【智能事件中心】-->【通知屏蔽】解除屏蔽即可。

在云主机监控详情下当前告警列表中,勾选告警事件的复选框,支持对批量告警进行确认。批量确认告警事件二次确认弹框中不支持批量创建屏蔽策略。