建议使用Chrome浏览器访问!
技术支持
互动社区
学习培训
深信服官网
合作伙伴

硬件产品

关注
主要包含硬件产品相关知识
故障案例库
典型场景排查思路

【硬件排查】AD系统如何判断网口down/up 问题

更新时间:2024-12-10
  • 阅读权限:游客
  • 下载
  • 分享
  • 收藏
所属模块 网安设备硬件排查
适用版本 通用

AD系统网口被DPDK接管,除管理口外,其他口是DPDK接管,网口down/up不在messages、dmesg提醒网口down/up。

收集信息:

  1.  反馈异常当天,ADweb界面日志告警情况。
  2.  反馈异常当天,黑匣子日志。
  3.  AD提供收集信息脚本,收集相关硬件信息。

 

检查对应黑匣子日志路径

  1.  异常当天的dpdk日志,文件是个压缩包,需要解压查看

 aclog\blackbox\18\since-240603-172755\dpdk_stats.gz

 

  1.  异常当天的InfoAboveModuleName

如果问题日期在收集黑匣子当天,日志在log中

\log\20241118\zh_CN\0\InfoAboveModuleName-20241118.csv

如果问题日期在收集黑匣子时2天以上,比如16号的问题,18号收集日志,日志在hislog中

\hislog\20241116\zh_CN\0\InfoAboveModuleName-20241116.csv

 

日志解析

DPDK日志,解压后为dpdk_stats

其中接口port0 =eth1

 

AD收集信息脚本中会收集network_info.md  日志包含网口lspci 相关信息

其中有:

 ### lspci -tvvv ###   网卡挂载情况

  ### lspci -xxx ###   寄存器情况

### lspci -nnvvv | grep -i cesta ###    lspci情况

### /usr/ad/bin/icat /iproc/net/dev ###  网络流量统计

### cat /etc/sinfor/ad/dpdk_eth.ini ###  网口pcieID

### iproc /iproc/netdev/nic ###  网口down/up情况

### lspci -Dnn | grep -i eth ### 网口芯片信息

 

 

问题判断:

  1.  确认问题现象,web是否有告警是否有提示网口断电;

确认InfoAboveModuleName日志,是否有提示网口断电。

如果都有提示,说明网口有物理down提示。

如果web或者info没有提示网口down,只是对端设备网口down,这种转软件分析。

  1.  检查dpdk日志,确认是否有网卡错误包,丢包。

 如果仅有CRC错误,没有其他类型错误,排查线路,光模块,光纤,网线,参考CRC问题,处理。

如果有大量错误,包含各种错误类型,初步判断寄存器异常,检查是否为预警问题。(参考8口卡,825994万兆卡问题)

  1.  如果dpdk没有异常,检查md日志,看看网口寄存器情况
  2.  如果以上都没有看到异常,异常网口是光口,可以考虑检查光衰情况。(参考网口工具使用,注意非X710\XL710 网口可以看,X710\XL710 网口工具待发布中)
  3.  检查messages或者dmesg,异常时间是否有pcie错误或者网口hang
  4.  如果以上都无法判断,了解一下对接设备,看看对接设备信息,升级FAE进一步排查。

 

 

 

 

 

 

 

本页目录
  • 问题描述
  • 解决方案
您当前处于未登录状态,资料搜索或查找可能会不全面,请登录后以查找更全面的内容注册登录