更新时间:2023-11-08
在[全网监控/故障监控中心]里有网络故障排查、用户认证故障排查、客户端解密故障排查、权限策略故障排查、web访问质量监测和单用户检测六个部分。用于帮助运维人员、技术支持工程师等专业人士进行故障自查。
网络故障排查
网络故障排除是用来监控网络的状态,当网络出现异常时,识别错误类型,并提供解决方案。目前可以识别4种网络异常。
- [内网DOS攻击]
事件说明:内网DOS攻击事件xx次,攻击流量会导转发设备性能超限、线路拥塞,造成上网卡慢或者无法访问网络。
错误类型:内网DOS攻击。
解决方案:请检查网络拓扑变化,是否构成环路。请隔离对应IP设备并对该设备进行病毒查杀。
- [网口丢包异常]
事件说明:网口丢包事件xx次,网口丢包、错误包会造成上网卡慢,影响用户上网体验。
错误类型:rx_crc_errors。
解决方案:该错误表明数据包传输物理层故障。请更换连接对应网口的网线,或者更换和网线直连的对端网口。
- [ARP异常]
事件说明:ARP异常事件xx次,设备网关存在ARP无回复或回复异常。
错误类型:ARP异常。
解决方案:请检查网关设备的运行状态及连通性。
- [网关PPS异常]
事件说明:设备PPS超限事件xx次,PPS造成设备所有控制和审计功能失效。
错误类型:网关PPS异常。
解决方案:设备持续PPS超限表明当前设备性能不足,建议对经过设备的流量进行分流,或者联系商务渠道更换更高端平台设备。
用户认证故障排查
管理员利用“用户认证故障排查”工具可以自查用户出现认证异常无法上网、上线错误等异常问题。在[用户认证故障排查]界面可以查看设备记录的用户认证过程中出现的异常情况,方便运维人员快速定位问题。
管理员在输入框输入异常用户的用户名/IP/mac地址,点击<搜索>,即可看到该用户认证过程中的异常情况。
管理员在排障建议列表点击<详情>能弹出排障建议。
管理员可查看问题描述:如“用户名或密码错误”,参考排障建议步骤去排查问题。
客户端解密故障排查
客户端解密故障主要根据准入客户端的安装情况、证书安装情况、异常详情来定位故障信息。
其中排查思路如下:
• 匹配解密策略:若客户端解密故障排查中没有该用户信息或匹配解密策略为空,检查解密策略是否已经匹配且匹配正确。
• 准入客户端的安装情况:
未安装:该用户未安装准入客户端,检查终端准入客户端安装运行情况,可手动安装。
已安装:该用户已安装准入客户端。
• 证书情安装情况:
证书安装成功: 该用户已安装证书成功。
其他状态包括:系统证书安装失败、火狐证书安装失败、证书安装失败、证书无效、证书过期。
• 异常情况:
代理正常运行:状态正常。
代理异常:准入客户端代理无回包。
驱动异常:包括驱动文件不存在、驱动签名失效、驱动被杀毒软件阻止、基本筛选引擎(BPE)服务被禁止。
权限策略故障排查
通过“权限策略故障排查”可以查看用户访问权限策略匹配情况,当策略匹配的用户与实际期望不符合时,运维人员或工程师可以使用该功能进行排查。
管理员在输入框输入异常用户的IP地址,点击<开始监测>,可以看到该用户匹配到的所有策略。通过与实际需求进行比对,找到异常点并调整策略。
管理员可以在应用类型中选择需要查找的相应策略,点击<匹配详情>,可显示该IP 对应的策略名称、策略控制序号、匹配维度、匹配结果等信息,可根据这些信息找到异常点来调整策略信息。
解决方法:识别到该策略的DNS协议没有放通,导致访问所有的网站都拒绝,回到权限策略设置把DNS协议去掉勾选,就能访问正常。
Web访问质量监测
用于显示内网终端访问监测网站的网络质量。以 HTTP(默认所有网站)与HTTPS(用户自定义网站)请求作为网络质量检测的评估对象,对核心指标(RTT时延、DNS时延、TCP重传率..)进行抽样,根据质量分析数据模型来对所有上网IP进行质量评估,结果分两类:优、差,并按单用户的网络质量分布情况评估客户整体的网络质量,结果为差时将提供潜在问题分析建议。可以查看当前网络质量监测状态,近日网络质量,以及当前网络质量及网络诊断结果。
点击<质量定义>,用于设置检测网络实时质量定义设置。
统计网络质量的活跃用户少于N人数可以自定义填写。默认10人,允许输入1 - 100之间的数字。
全天质量查的定义:用于监测判断,当全天质量查的时间累积超过N分钟时,判断为网络质量差,默认30分钟,允许输入10 - 300之间的数字。
点击<选择日期>可以查看一周内的网络质量状态。
点击<监测对象>用来选择网络监测的网站。默认选择所有网站。用户也可以指定要监测的网站,最多可以有3个监测列表,每个列表最多100个域名。
在检测对象下拉点击<管理>,进行编辑网站列表。
鼠标移到波形图上,出现悬浮框,可以看到详细的网络质量状态,当网络质量为差的时候,可以点击查看,进行查看上网慢用户列表。
纵坐标是统计到的在上网的用户个数,网络质量好的用户数+差的用户数。
鼠标移到波形图上,可以查看当前时间上网质量优和差的用户个数,点击<查看>可定位当前上网慢的用户列表。
网络诊断结果:用来查看详细的网络质量,可以显示若干条详细网络质量较差的原因。
可能存在的原因:
- 未开启流控。
- 带宽不足(如果当天存在连续10分钟http流量占带宽90%)。
- P2P抢占带宽,建议限速,(如果当天连续10分钟p2p流量占带宽90%)。
- 建议设置保证通道 (流控有丢包10%以上且未设保证通道)。
- 策略(xxx)流控限制较低。
- 策略(xxx)连接数限制较低。
- DNS配置错误。
- 提示内侧或外侧性能瓶颈。
- 单用户检测
当整体网络质量判定不能解决问题时,可以对单用户进行针对性检测。
例如:在发现用户A的在上网慢的列表中,可以在单用户检测—检测对象中输入用户名或IP地址或者点击选择用户在下列组织结构中勾选用户。
- 确定<提交>后,在监测地址点击<设置>,设置监控地址。
- 终端页面重定向:可以选择访问百度是重定向到测试页面或者所有web访问重定向到测试页面。
- 监视地址:可以选择使用内置监测地址库或者自定义监测地址。
- 确定<提交>后,点击开始设置,以www.baidu.com为例。
- 用户访问www.baidu.com,重定向到测试页面。
- 点击<开始测试>后,用户开始检测。测试时会有时间提示。
- 管理员页面显示开始检测。
- 用户检测完毕。
- 管理员页面显示检测结果。