更新时间:2024-09-02
2.3.2.1.进入云主机监控详情
在云主机列表中点击云主机名称,会新开tab页面展示云主机监控详情信息,默认跳转展示云主机关联对象信息。
2.3.2.2.查看基础信息
若云主机已安装Agent且采集正常,在云主机监控详情下将展示云主机基础信息。
2.3.2.3.根因分析拓扑
在关联拓扑图中,鼠标悬浮可查看对象资源的运维风险事件信息。
悬浮窗中支持点击跳转查看对象资源的监控信息和运维风险事件信息。点击查看监控按钮将跳转对象资源监控详情下监控界面。
悬浮窗内点击告警事件或风险事件边的>,将跳转智能事件中心并筛选出对象资源当前实时告警或实时风险。
2.3.2.4.监控详情
在云主机监控详情界面点击监控标签切换到监控界面,即可展示云主机监控信息。
1.1.1.1.1监控大盘展示
点击页面下右上角小齿轮按钮,支持自定义设置在概要、操作系统、进程、CPU、内存、磁盘、磁盘IO、网络下监控指标图表展示。
1.1.1.1.1.1设置大盘展示时间
点击页面下右上角时间设置下拉框,可自定义选择展示云主机最多近一年时间段的监控数据。
1.1.1.1.1.2查看监控图表详情
点击概要标签,可查看云主机监控详情概要下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。
图表中仅内存使用率和CPU使用率在悬浮时可以点击查看当前时间节点云主机Top5进程的内存或CPU使用情况。
以下为概要标签下图表展示参数信息:
图表名称 |
曲线采集指标 |
曲线图例名称 |
内存使用率 |
host_mem_used_bytes |
内存使用率 |
CPU使用率 |
host_cpu_used_percent_sum |
CPU使用率 |
系统平均负载 |
host_system_load1 host_system_load5 host_system_load15 |
近1分钟系统平均负载 近5分钟系统平均负载 近15分钟系统平均负载 |
CPU IO 等待 |
host_cpu_iowait_sum |
CPU IO等待使用率 |
内存swap使用率 |
host_mem_swap_used_percent |
内存swap使用率 |
磁盘总使用率 |
host_disk_used_percent_sum |
磁盘总使用率 |
磁盘inode总使用率 |
host_disk_inodes_used_percent_sum |
磁盘inode总使用率 |
磁盘IO平均延迟 |
host_diskio_await_avg |
磁盘IO平均延迟 |
网卡总带宽(Linux独有) |
host_net_bandwidth_bytes_sum |
网卡总带宽 |
TCP总连接数 |
host_netstat_sum |
TCP总连接数 |
2.3.2.5.操作系统监控
点击操作系统标签,可查看云主机监控详情操作系统下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。
以下为操作系统标签下图表展示参数信息:
图表名称 |
曲线采集指标 |
曲线图例名称 |
机械运行时间 |
host_system_uptime_seconds |
机械运行时间 |
系统平均负载 |
host_system_load1 host_system_load5 host_system_load15 |
近1分钟系统平均负载 近5分钟系统平均负载 近15分钟系统平均负载 |
进程个数(Linux独有) |
host_processes_blocked host_processes_zombies host_processes_stopped host_processes_running host_processes_sleeping host_processes_total |
阻塞进程个数 僵尸进程个数 停止进程个数 运行中进程个数 睡眠进程个数 进程总数 |
进程运行率(Linux独有) |
host_processes_percent |
进程运行率 |
TCP连接数 |
host_netstat_established host_netstat_non_established host_netstat_listen host_netstat_close_wait host_netstat_sum |
ESTABLISHED状态的TCP连接数 非ESTABLISHED状态的TCP连接数 listen状态的TCP连接数 CLOSE_WAIT状态的TCP连接数 TCP总连接数 |
TCP连接缓冲区大小(Linux独有) |
host_netstat_rx_queued_bytes host_netstat_tx_queued_bytes |
TCP连接接收缓冲区总大小 TCP连接发送缓冲区总大小 |
活跃的UDP套接字个数 |
host_netstat_udp_socket |
活跃的UDP套接字个数 |
2.3.2.6.进程监控
点击进程标签,可查看云主机监控详情下进程Top5列表信息。列表展示筛选时间内进入过Top5的进程监控信息,默认排序按照CPU降序排序。
在进程列表中,点击进程名称前的展开按钮即可查看该进程监控信息。
以下为进程标签下图表展示参数信息:
图表名称 |
曲线采集指标 |
曲线图例名称 |
内存使用率 |
host_process_mem_used_percent |
内存使用率 |
CPU使用率 |
host_process_cpu_used_percent |
CPU使用率 |
IO每秒大小 |
host_process_io_write_bytes host_process_io_read_bytes |
写 读 |
打开文件数(Linux独有) |
host_process_open_file |
打开文件数 |
2.3.2.7.CPU监控
点击CPU标签,可查看云主机监控详情CPU下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。图表中仅CPU使用率在悬浮时可以点击查看当前时间节点云主机Top5进程CPU使用情况。
以下为CPU标签下图表展示参数信息:
图表名称 |
曲线采集指标 |
曲线图例名称 |
CPU使用率 |
host_cpu_used_percent |
CPU使用率 |
用户态CPU使用率 |
host_cpu_user_sum |
用户态CPU使用率 |
系统态CPU使用率 |
host_cpu_sys_sum |
系统态CPU使用率 |
空闲CPU使用率 |
host_cpu_idle_sum |
空闲CPU使用率 |
CPU IO 等待 |
host_cpu_iowait_sum |
CPU IO 等待使用率 |
中断CPU使用率 |
host_cpu_irq_sum |
中断CPU使用率 |
软中断CPU使用率 |
host_cpu_softirq_sum |
软中断CPU使用率 |
虚拟CPU等待物理CPU的时间百分比 |
host_cpu_steal_sum |
虚拟CPU等待物理CPU的时间百分比 |
2.3.2.8.内存监控
点击内存标签,可查看云主机监控详情内存下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。图表中仅内存使用率在悬浮时可以点击查看当前时间节点云主机Top5进程内存使用情况。
以下为内存标签下图表展示参数信息:
图表名称 |
曲线采集指标 |
曲线图例名称 |
内存使用率 |
host_mem_used_percent |
内存使用率 |
内存大小 |
host_mem_total_bytes host_mem_available_bytes host_mem_used_bytes host_mem_free_bytes |
内存总量大小 可用内存大小 已用内存大小 空闲内存大小 |
cache置换大小(Linux独有) |
host_mem_swap_cached_bytes |
cache置换大小 |
内存swap大小 |
host_mem_swap_total_bytes host_mem_swap_used_bytes host_mem_swap_free_bytes |
内存swap大小 已用内存swap大小 空闲内存swap大小 |
内存swap使用率 |
host_mem_swap_used_percent |
内存swap使用率 |
内存swap每秒大小 |
host_mem_swap_in_pages_per_second host_mem_swap_out_pages_per_second |
内存swap每秒入大小 内存swap每秒出大小 |
内存每秒页故障量 |
host_mem_page_fault_pages_per_second |
内存每秒页故障量 |
2.3.2.9.磁盘监控
点击磁盘标签,可查看云主机监控详情磁盘下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。可自定义选择需要展示的磁盘分区监控视图。
以下为磁盘标签下图表展示参数信息,以磁盘分区/boot为例:
图表名称 |
曲线采集指标 |
曲线图例名称(示例) |
磁盘分区使用率 |
host_disk_used_percent |
磁盘分区/boot使用率 |
磁盘分区大小 |
host_disk_size_bytes host_disk_free_bytes host_disk_used_bytes |
磁盘分区/boot大小 磁盘分区/boot剩余量大小 磁盘分区/boot使用量大小 |
磁盘分区inode使用率 |
host_disk_inodes_used_percent |
磁盘分区/boot inode使用率 |
磁盘分区inode数量 |
host_disk_inodes host_disk_inodes_free host_disk_inodes_used |
磁盘分区/boot inode总数量 磁盘分区/boot 空闲inode数量 磁盘分区/boot 已用inode数量 |
2.3.2.10.磁盘IO监控
点击磁盘IO标签,可查看云主机监控详情磁盘IO下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。可自定义选择需要展示的磁盘监控视图。
以下为磁盘IO标签下图表展示参数信息,以磁盘vda为例:
图表名称 |
曲线采集指标 |
曲线图例名称(示例) |
磁盘IO使用率 |
host_diskio_used_percent |
磁盘vda IO使用率 |
磁盘IO每秒请求数量 |
host_diskio_read_count_per_second host_diskio_write_count_per_second |
磁盘vda IO每秒读请求数量 磁盘vda IO每秒写请求数量 |
磁盘IO每秒大小 |
host_diskio_read_bytes_per_second host_diskio_write_bytes_per_second |
磁盘vda IO的每秒读入大小 磁盘vda IO的每秒写入大小 |
磁盘IO每秒加权时间 |
host_diskio_weighted_io_time_per_second |
磁盘vda IO每秒加权时间 |
磁盘IO平均请求大小 |
host_diskio_avg_request_bytes |
磁盘vda IO平均请求大小 |
磁盘IO平均等待时间 |
host_diskio_await host_diskio_r_await host_diskio_w_await |
磁盘vda IO请求平均等待时间 磁盘vda IO读请求平均等待时间 磁盘vda IO写请求平均等待时间 |
2.3.2.11.网络监控
点击网络标签,可查看云主机监控详情网络下监控图表展示。鼠标悬浮图表内即可展示当前时间节点对应指标采集上报值。可自定义选择需要展示的网卡监控视图。
以下为网络标签下图表展示参数信息,以网卡eth0为例:
图表名称 |
曲线采集指标 |
曲线图例名称(示例) |
网卡带宽大小(Linux独有) |
host_net_bandwidth_bytes |
网卡eth0带宽大小 |
网卡每秒包数 |
host_net_recv_packets_per_second host_net_send_packets_per_second |
网卡eth0每秒接收包数 网卡eth0每秒发送包数 |
网卡每秒流量带宽使用率(Linux独有) |
host_net_recv_bytes_per_second_percent host_net_send_bytes_per_second_percent |
网卡eth0每秒入向流量带宽使用率 网卡eth0每秒出向流量带宽使用率 |
网卡每秒流量 |
host_net_recv_bytes_per_second host_net_send_bytes_per_second |
网卡eth0每秒入向流量 网卡eth0每秒出向流量 |
网卡每秒丢包率 |
host_net_recv_drop_packets_per_second_percent host_net_recv_drop_packets_per_second_percent |
网卡eth0每秒接收丢包率 网卡eth0每秒发送丢包率 |
网卡每秒丢包数 |
host_net_recv_drop_packets_per_second host_net_send_drop_packets_per_second |
网卡eth0每秒接收丢包数 网卡eth0每秒发送丢包数 |
网卡每秒错包率 |
host_net_recv_error_packets_per_second_percent host_net_send_error_packets_per_second_percent |
网卡eth0每秒接收错包率 网卡eth0每秒发送错包率 |
网卡每秒错包数 |
host_net_recv_error_packets_per_second host_net_send_error_packets_per_second |
网卡eth0每秒接收错包数 网卡eth0每秒发送错包数 |
网卡每秒缓冲溢出错包数 |
host_net_recv_fifo_error_packets_per_second host_net_send_fifo_error_packets_per_second |
网卡eth0每秒接收缓冲区溢出错包数 网卡eth0每秒发送缓冲区溢出错包数 |
2.3.2.12.云主机当前告警
在云主机监控详情界面点击当前告警标签切换到当前告警界面,展示云主机当前未关闭的告警事件。
1.1.1.1.2当前告警详情
在云主机监控详情下当前告警列表中,点击告警操作栏中详情按钮,将跳转该告警事件详情进行查看。
1.1.1.1.3当前告警搜索
云主机监控详情下当前告警列表支持按照问题描述、集群名称的关键字搜索。
1.1.1.1.4响应当前告警
在云主机监控详情下当前告警列表中,点击告警操作栏中响应按钮后,该告警事件状态将变更为处理中且响应按钮将隐藏不支持再次响应。
在云主机监控详情下当前告警列表中,勾选告警事件的复选框,支持对批量告警进行响应。
1.1.1.1.5确认当前告警
在云主机监控详情下当前告警列表中,点击告警操作栏中确认按钮后,该告警事件状态将变更为已关闭且从当前事件列表中移除。
在对单条告警事件进行确认时,二次确认弹窗默认不勾选屏蔽所选事件。若勾选将创建屏蔽策略(可于【产品与服务】--> 【云端智能大脑】-->【智能事件中心】-->【通知屏蔽】中查看创建的屏蔽策略),该告警事件下次触发时将直接屏蔽。若需要恢复,在【产品与服务】--> 【云端智能大脑】-->【智能事件中心】-->【通知屏蔽】解除屏蔽即可。
在云主机监控详情下当前告警列表中,勾选告警事件的复选框,支持对批量告警进行确认。批量确认告警事件二次确认弹框中不支持批量创建屏蔽策略。