建议使用Chrome浏览器访问！

技术支持

互动社区

学习培训

深信服官网

合作伙伴

深信服自助服务平台

我的Sangfor

硬件产品

关注

主要包含硬件产品相关知识

文档

故障处理

搜本产品

故障案例库

典型场景排查思路

主模块：

全部

网安设备硬件排查

服务器硬件知识库

维修常见问题库

版本标签：

全部

为您筛选140条结果

【硬件排查】SN为F6Q,FBQ无RAID卡型号设备系统盘做软RAID1操作指导

当机型没有RAID卡，客户要求系统盘组RAID1，可以进BIOS组软RAID1操作步骤一：重启设备进按delete键进BIOS，默认BIOS密码：S#AN$6fo81r，选择Advance-->Platform Configuration-->PCH Devices-->PCH SATA Configuration-->Configure SATA as改成RAID，然后F10保存，重启再进BIOS界面。步骤二：选择Advance-->Dynamic UEFI Oprom-->vroc选项进去做RAID。如果系统盘识别不到，将系统盘跟能识别到的HDD盘交叉下位置，重启设备再进该界面组RAID。

【硬件排查】SN为FES开头服务器风扇全速转问题排查

风扇全速转，重启设备可以恢复。附CPLD V0.7版本，升级前需要解压 SZH_52DB16_UN_V07_20240605.7z ( 0.06M ) 步骤一：后台用ipmitool sel elist查看BMC日志发现有报错，日志看不了，BMC挂了。步骤二：关机重启设备能正常进BMC，查看CPLD版本为V0.3版本，BMC版本为0.09版本步骤三：关机，固件升级里面升级CPLD版本到V0.7，升级成功后，拔掉电源线2分钟后再上电，进了系统后查看固件版本是否为V0.7版本。步骤四：查看其他正常设备检查型号和BMC固件和CPLD固件版本是否为R5240H0 0.09 V0.3是则都需要关机升级CPLD。查看硬件型号指令：dmidecode -t1 查看BMC版本：ipmitool mc info 查看CPLD版本：ipmitool raw 0x3a 0xEC 0x70 原因：R5240H0机型升级了BMC0.09版本，CPLD用的低版本V0.3，不适配导致BMC挂死，风扇全速转，升级CPLD版本解决。

设备扩容与定制需求查询

遇到设备扩容和硬件定制相关需求的客户时，可以根据以下步骤进行处理。情景一：客户咨询能否扩容部件步骤一：获取客户设备SN、型号和配置情况，是否有相关硬件定制。步骤二：根据型号到W3的SCP应用中查询定制信息，如下图，依照实际配置情况，确认可否做对应定制。情景二：客户咨询能扩容什么型号、什么规格的部件步骤一：获取设备型号与SN，根据SCP结果进行答复。步骤二：SCP中的定制信息不足/信息缺失时，将SN和型号反馈到定制负责人确认可否进行扩容，具体的扩容配件规格。网安定制：曾鹏10450 服务器定制：徐伟43346 目前支持不支持定制的部件有：服务器：CPU、RAID卡、8盘位扩容12盘位、第三方显卡定制显卡供电线。网安：CPU。

【硬件排查】U.2硬盘安装操作指导

此文档适应于双路服务器，单路服务器不支持（U.2资源属于第二颗CPU资源）一、SN为F6H、FBH开头服务器U.2硬盘安装操作指导步骤一：拆上盖，用螺丝刀拧动机箱上盖螺丝，取下机箱盖，放置指定区域。步骤二：拆riser3部件，依次拆卸机箱自带3颗螺丝，如下图：步骤三：拆riser3线缆，拔掉riser3到主板端线缆。步骤四：移除riser3模组，往远离后部水平移动，然后向上取出riser3模组。步骤五：安装U.2模组，将U.2模组安装拆riser3模组反方向安装到机箱上，然后用3颗螺丝固定。步骤六：安装线缆，将下图所示4条线缆按照顺序安装到主板上，检查螺丝无漏锁，硬盘线缆无松动，安装完成，然后将U.2硬盘插到硬盘模组中。二、SN为F6C开头服务器U.2硬盘安装操作指导步骤一：核实加装配件，信号线一条，U,2数据线4条。步骤二：拆上盖，和拆除风扇模组，双手捏住风扇模组两端，水平向上取出，然后放置闲置区域。步骤三：安装线缆，找到4个NVME接口，主板端将数据线依次接入 NVME0-CPU1（①）和 NVME1-CPU1（②）接口，注意线材自带防呆接口，不可插反，将短线接入NVME0-CPU1，长线接入NVME1-CPU1，若有多根线材，则按照主板（0-1-2-3）槽位依次安装。步骤四：前置背板端将数据线依次接入 NVME0-CPU1（①）和 NVME1-CPU1（②）接口，注意线材自带防呆接口，不可插反；（若有多根线材，则按照0-1-2-3次序依次安装）将多余出来的部分折叠，并卡入束带内。注意：来料数据线为一长一短两根，短线为银白色接口，长线为黑色接口，将短线接入NVME0-CPU1，长线接入NVME1-CPU1。步骤五：将背板定位线一端插入图示①接口，然后将线材穿过限位槽，另一端插入图示接口②，安装时注意线材自带防呆接口，避免插反。步骤六：待线材全部安装完毕，将多余出来的部分折叠，并卡入束带内；将风扇模组原路径安装回机箱，然后安装导风罩和上盖，将U.2盘插到第一层0-3槽位。三、SN为F6Q开头服务器U.2硬盘安装操作指导加装2根高速线，加装在①-J30位置（红色线），②-J54位置（紫色线）硬盘加装在前置11/10/9/8盘位四、SN为FBQ开头服务器U.2硬盘安装操作指导当需要加装U.2硬盘时，需加装2根高速线，第一根加装在背板4号位置对应主板4号位置（黄色线）第二根线加装在背板5号位置主板5号位置（红色线），U.2硬盘按倒序加装11.10.9.8硬盘位号五、SN为FBC开头服务器U.2硬盘安装操作指导当安装U.2硬盘时，加装2根高速线，一头加装在①-J80位置（短线），另一端加装在前置背板④位置，如图示红线，第二根线加装在②-J79位置（长线），另一端加装在前置背板③ 如图示黄线位置硬盘加装在前置11/10/9/8盘位。六、中科海光5系列服务器U.2硬盘安装操作指导七、中科海光7系列服务器U.2硬盘安装操作指导

【硬件排查】SN为FBQ开头服务器9560-8i RAID卡组RAID5操作指导

9560-8i RAID卡默认JBOD模式，支持RAID0,1,10，需要改成RAID模式才支持RAID5,50 步骤一：重启设备，在LOGO界面按delete键进BIOS（BIOS默认密码为：S#AN$6fo81r），选择Advanced-->Dynamic UEFI Oprom-->9560-8i 步骤二：选择Main Menu-->Controller Management-->Advanced Controller Management -->Manage Personality Mode-->Advanced-->Force Switch to RAID Mode-->Confirm 改为Enabled，选择Yes，按Enter键保存。步骤三：看到Requested Mode模式变为RAID模式后，重启设备，然后进BIOS，选择RAID卡进入管理界面。如果状态还是JBOD，下方的Advanced强制下RAID模式，然后重启设备进BIOS，选择RAID卡进入管理界面。步骤四：选择Configuration Management-->Create Virtual Drive，然后将要组RAID5的数据盘改成Enabled,选OK，Confirm选择Enabled，Yes 步骤五：Select RAID Level选择RAID5，然后点击Select Drives，将需要组RAID5的盘改成Enabled，再Apply Changes 步骤六：RAID配置按照下图设置：Strip Size:64KB,Write Policy:Always Write Back，Drive Cache:Disable，然后点击Save Configuration，Confirm选择Enabled，Yes 步骤七：选择Virtual Drive Management，查看RAID5是否已组成功。

【硬件排查】国芯CCUPM2003加密卡重启识别异常问题

加密卡重启后提示异常，判断为未识别加密卡。重启能恢复，或者断电重启恢复。涉及平台以及加密卡型号：设备型号：aTrust-1000-LS1050C,aTrust-1000-LS1050M，aTrust-1000-LS1050G 硬件平台：智微兆芯平台加密卡型号：国芯CCUPM2003加密卡风险固件版本：CCP907T SDFESXF 2.15 20230824 v4 附固件信息判断工具： GetDevInfo.7z ( 0.01M ) 步骤一：Web界面提示国密卡未识别：步骤二：系统后台lspci信息判断，下图为异常值。正常情况，lspci有识别加密卡为：步骤三：上传脚本 GetDevInfo （见附件）工具，到tmp 路径，增加权限，执行指令（当设备恢复识别加密卡情况下执行）老版本固件：CCP907T SDFESXF 2.15 20230824 v4 异常版本新版本固件：CCP907T SDFESXF 2.16 20240112 V4 更新后版本解决方案：返厂更换新加密卡，更新固件版本

【硬件排查】SN为FBH服务器宕机，故障码CPU VCCIN或VSA_CPU failture报错处理

设备宕机重启，BMC日志打印CPU VCCIN错误，或者VSA_CPU failture告警。附件附BIOS,BMC固件。 FBH BIOS,BMC.zip ( 72.72M ) 步骤一：登录IPMI，查看事件日志，发现有VICCIN告警，或者有VSA_CPU failture告警，无其他告警。步骤二：检查BMC固件版本为3.03.10.91版本。步骤三：3.03.11.15版本以前有这个问题，需升级到3.03.11.15及以上版本，我司最新版本为：3.07.00.31，对应的BIOS版本也升级下。

【硬件排插】YANHUA C610电源告警问题排查

客户端设备web界面出现电源监控频繁告警现象（单电源/双电源）。步骤一：判断设备平台：dmidecode_ex, 判断为YANHUA C610平台步骤二：查看监控方式以及电源当前状态，外观检查电源模块接电源线位置指示灯情况。如果是电源指示灯为橙色，则检测供电线路，或者交叉检查电源模块。如果是2个电源都是绿色常亮，则进一步排查。后台执行sh -x get_power_state_raw.sh ，确认设备监控方式为BMC监控还是SIO监控。如果是sensors ，判断当前监控方式是SIO监控。如果是ipmitool ，判断当前监控方式是BMC监控。 0x18 是正常值 0x08 和0x10 是单电源丢失 0x00 是双电源异常（理论上不存在，属于误报）通过SN 查烤机系统是否为BMC设备，该型号应该为BMC监控步骤三：查看BMC日志，执行以下命令。 modprobe ipmi_msghandler modprobe ipmi_devintf modprobe ipmi_si Ipmitool sel elist 如果没有没有近期日志，可以先保存一份日志后，清理日志再看。保存日志指令ipmitool sel elist >>bmc.log 清理日志指令ipmitool sel clear 如果日志持续输出异常信息，电源是指灯正常，则判断BMC监控信息异常。解决方案：临时解决：重启BMC ，或者断电再开机重启BMC 指令 ipmitool bmc reset cold 长期解决：暂无，待确定

【硬件排查】SN为W*Z开头设备BMC异常问题排查

BMC无法读取，直连ipmi接口ip不通/设备上电无法正常启动问题设备平台和产品范围：family:SXF_PUMA_448_4_2/SXF_PUMA_448_2_1 产品线：AF/AD/ATRUST/NSF/STA/WAF 案例一：设备型号：NSF-7100A-I 风扇全速转，区别于替他设备转速转的风扇声音很大，系统后台无法读取bmc的信息，直连IPMI的IP不通，确认BMC没有起来，重启设备BMC无法恢复故障结论：设备BMC芯片异常，设备风扇事BMC监控，BMC没用正常工作导致风扇不受控制，此类现象需要返厂检修分析。案例二：设备型号：STA-100-B3100 设备使用中突然掉电，重新上电无法开机，面板power和logo灯都不亮。断电静置几分钟，重新上电开机问题一样故障结论：BMC芯片异常造成芯片短路导致设备无法启动判断依据：1，设备系统运行正常，BMC无法读取，直连IPMI不通2，风扇全速工作，机箱风扇工作声音很大3，设备上电无法正常启动，4，设备SN：WCZ开头，family信息：family:SXF_PUMA_448_4_2/SXF_PUMA_448_2_1

【硬件排查】AD系统如何判断网口down/up 问题

AD系统网口被DPDK接管，除管理口外，其他口是DPDK接管，网口down/up不在messages、dmesg提醒网口down/up。收集信息：反馈异常当天，ADweb界面日志告警情况。反馈异常当天，黑匣子日志。 AD提供收集信息脚本，收集相关硬件信息。检查对应黑匣子日志路径异常当天的dpdk日志,文件是个压缩包，需要解压查看 aclog\blackbox\18\since-240603-172755\dpdk_stats.gz 异常当天的InfoAboveModuleName 如果问题日期在收集黑匣子当天，日志在log中 \log\20241118\zh_CN\0\InfoAboveModuleName-20241118.csv 如果问题日期在收集黑匣子时2天以上，比如16号的问题，18号收集日志，日志在hislog中 \hislog\20241116\zh_CN\0\InfoAboveModuleName-20241116.csv 日志解析 DPDK日志，解压后为dpdk_stats 其中接口port0 =eth1 AD收集信息脚本中会收集network_info.md 日志包含网口lspci 相关信息其中有： ### lspci -tvvv ### 网卡挂载情况 ### lspci -xxx ### 寄存器情况 ### lspci -nnvvv | grep -i cesta ### lspci情况 ### /usr/ad/bin/icat /iproc/net/dev ### 网络流量统计 ### cat /etc/sinfor/ad/dpdk_eth.ini ### 网口pcieID ### iproc /iproc/netdev/nic ### 网口down/up情况 ### lspci -Dnn | grep -i eth ### 网口芯片信息问题判断：确认问题现象，web是否有告警是否有提示网口断电；确认InfoAboveModuleName日志，是否有提示网口断电。如果都有提示，说明网口有物理down提示。如果web或者info没有提示网口down，只是对端设备网口down，这种转软件分析。检查dpdk日志，确认是否有网卡错误包，丢包。如果仅有CRC错误，没有其他类型错误，排查线路，光模块，光纤，网线，参考CRC问题，处理。如果有大量错误，包含各种错误类型，初步判断寄存器异常，检查是否为预警问题。（参考8口卡，825994万兆卡问题）如果dpdk没有异常，检查md日志，看看网口寄存器情况如果以上都没有看到异常，异常网口是光口，可以考虑检查光衰情况。（参考网口工具使用，注意非X710\XL710 网口可以看，X710\XL710 网口工具待发布中）检查messages或者dmesg，异常时间是否有pcie错误或者网口hang 如果以上都无法判断，了解一下对接设备，看看对接设备信息，升级FAE进一步排查。

【硬件排查】硬盘不调度或掉盘问题排查

场景一：硬盘识别异常或BIOS引导盘序异常，开机直接进入到BIOS界面，或者提示"Reboot and Select proper Boot device or Insert Boot Media in selected Boot device and press a key"硬盘没有正常启动，或者硬盘没有安装正确的系统。场景二：硬盘坏道或插写寿命耗尽，现象体现BIOS界面/开机alarm常亮串口显示无法进入系统，一直打印硬盘I/O报错或者文件系统报错。场景三：链路问题或硬盘CRC有异常数值导致一直打印硬盘扇区报错或ATA链路报错-硬盘反复重置硬盘响应延迟。场景四：客户设备异常重启，重启后系统后台smartctl参数读取正常，查看系统日志记录与客户业务感知异常时间存在差异，硬盘掉盘或疑是掉盘场景五：常用硬盘厂商已知问题，JBL寿命问题，市场还存在老固件V1.30.6及以下版本/海康低128G/256G卡死问题固件版本D5Na2A11/创见128G 硬盘CRC低固件版本FW: 02J0TSXF 场景六：硬盘只读导致系统服务异常，多见是硬盘分区满了，无法write，系统日志一般会有read_only只读的打印，或者系统文件异常记录。场景七：双盘设备数据盘掉盘案列，messages存储在系统盘，blackbox存储在数据盘。场景八：设备iowait延迟，硬盘I/O异常场景一：硬盘识别异常或BIOS引导盘序异常，开机直接进入到BIOS界面，或者提示"Reboot and Select proper Boot device or Insert Boot Media in selected Boot device and press a key"硬盘没有正常启动，或者硬盘没有安装正确的系统。现象排查：设备ALRM常亮，串口或者VGA显示器接入BIOS界面查看硬盘识别及盘序，设置系统盘作为第一启动项，如确认启动项是正确的，需进一步确认设备ghost信息解决方案：BIOS设置正确启动项，确认设备系统安装信息场景二：硬盘坏道或插写寿命耗尽，现象体现BIOS界面/开机alarm常亮串口显示无法进入系统，一直打印硬盘I/O报错或者文件系统报错现象排查：设备ALARM常亮，查看串口或者VGA输出，重复打印bad target异常，设备重启无法恢复。解决方案：硬盘坏道，需要返修更换硬盘场景三：链路问题或硬盘CRC有异常数值导致一直打印硬盘扇区报错或ATA链路报错-硬盘反复重置硬盘响应延迟现象排查：查看串口输出或者dmesg日志，ATA报错重启可能会恢复，CRC重启设备无法恢复，可以通过smart查看硬盘CRC异常数值解决方案：设备需要返修更换硬盘场景四：客户设备异常重启，重启后系统后台smartctl参数读取正常，查看系统日志记录与客户业务感知异常时间存在差异，硬盘掉盘或疑是掉盘现象排查：设备已自动重启恢复，无明显物理故障状态，向客户了解重启前设备指示灯情况及设备恢复方式（手动重启or自动重启），进系统后台查看messages和blackbox的dmesg的日志记录信息，结合设备重启时间和客户感知业务异常时间存在差异，如无相关日志记录可查看对端设备网口记录的信息，可怀疑是掉盘了如以下案列，设备重启前日志记录15：14：01，到15：54：13设备重启，客户感知业务中断时间是设备重启的时间戳，可以判断为硬盘掉盘引起设备重启，掉盘后设备不会立即重启，设备面板指示灯也不会有异常，设备业务还会正常运行，到54分内存缓存的跑完才会重启解决方案：如确认硬盘是smart数值硬盘读写速率均正常，首次可沟通观察使用，建议KA客户进行返修更换硬盘场景五：常用硬盘厂商已知问题，JBL寿命问题，市场还存在老固件V1.30.6及以下版本/海康低128G/256G卡死问题固件版本D5Na2A11/创见128G 硬盘CRC低固件版本FW: 02J0TSXF 现象排查：系统后台smartcl -a /dev/sd*读取厂商及硬盘FW信息解决方案：JBL硬盘低固件问题市场还有，常见寿命耗尽，海康盘产品线均已出固件补丁包，创见低固件问题案列较少，如已出现异常异常，可建议返修更换场景六：硬盘只读导致系统服务异常，多见是硬盘分区满了，无法write，系统日志一般会有read_only只读的打印，或者系统文件异常记录现象排查：设备面板指示灯alarm常亮，读取硬盘smart正常，dmesg日志记录中断，不是掉盘，查看硬盘分区是否有异常，后台手动无法编辑写入文件解决方案：此现象一般是系统软件功能问题，出现大量异常日志记录把分区写满了，需协调研发查看场景七：双盘设备数据盘掉盘案列，messages存储在系统盘，blackbox存储在数据盘，如下图现象排查：数据盘掉盘设备运行正常，面板指示灯无异常，先查看lsblk设备硬盘排序情况，确认双盘是否在位，查看messages与dmesg日志记录对比，是否存在中断解决方案：查看数据盘smart 健康情况，无smart报错数值可观察使用，ka客户建议返修更换场景八：设备iowait延迟，硬盘I/O异常现象排查：系统后台查看设备CPU内存等使用率信息，排除硬盘坏道，客户设备负载情况，排除以上可能如持续报硬盘iowiat高的情况，可以进一步确认硬盘固件版本信息，读取读写速率的异常，问题可以升级进一步确认解决方案：确认硬盘存在异常，沟通返修，无异常问题升级处理

alrm灯和ha灯交替闪烁

alrm灯和ha灯交替闪烁步骤一：断电5分钟上电看能否恢复，如果还是一直alrm灯和ha灯交替闪烁，内存质检过不去，整机返修。如恢复观察，测试设备则可以拿到办事处断电开箱，重新插拔内存测试，操作之前联系下硬件技术支持。

【硬件排查】IPMI安装系统花屏处理

IPMI打开KVM去安装系统，显示花屏导致无法点击下一步进行部署安装，常见于arm架构的鲲鹏服务器。步骤一：重启设备选择U盘或者光驱进入安装界面，在选择语言界面按e进行编辑，进入内核启动参数界面，启动参数上增加video=VGA-1:640x480-32@60me 在ifnames=0后面按空格再输入，注意640后面是英文字母x。步骤二：按Ctrl +x后进行安装系统。如安装系统进了安全模式，需要换个刻录工具重新刻录安装。附刻录工具 rufus-3.14.1788.zip ( 1.09M )

【硬件排查】SN为F6Q、FBQ服务器扩容内存容量识别为0问题排查

扩容内存后，IPMI的内存信息发现有条内存容量识别为0 步骤一：检查下内存是否有按照内存插法来插，如没按照内存插法扩容，需要用正确的插法扩容，如内存插法没问题，执行步骤二。步骤二：断电拆箱，将容量为0的内存和其他正常内存交叉测试，跟着内存走换内存，跟着槽位走执行步骤三。步骤三：检查该内存槽位是否有异物，刮伤，清灰下，重新安装，现象一样执行步骤四。步骤四：断电拆箱，找到主板纽扣电池，扣下来等2分钟再安装回去，上电进BIOS，然后看内存容量是否识别正常，还有异常联系硬件技术支持。

【硬件排查】storcli64工具常用指令

该工具适用于Mega RAID卡，如3008IMR,SAS3416,9361,9460,9560等，Megacli64工具跟新Mega raid卡有兼容性问题，推荐都用storcli64指令附件附storcli64工具 storcli64.zip ( 2.43M ) 如RAID卡比较新如9560卡，用下面这个新版工具：rpm -i 接rpm文件，RAID卡工具在cd /opt/MegaRAID/storcli/ 目录 storcli-007.2408.0000.0000-1.noarch.zip ( 2.05M ) 查看硬盘状态指令：./storcli64 /c0/eall/sall show （下图的EID:SLT为Enclosure Device ID和Slot Number） 2. 查看RAID卡数量指令：./storcli64 show ctrlcount 3. 修改jbod盘模式为UG模式（组RAID前模式要UG才能组RAID）指令：./storcli64 /c0/e62/s0 set good force 4. 修改UG模式为JBOD 指令：./storcli64 /c0/e62/s0 set jbod 5. 做RAID1 指令：./storcli64 /c0 add vd r1 size=all drives=E:S,E:S（先获取磁盘的EID和Slot，./storcli64 /c0/eall/sall show，C0为第一张RAID卡，C1为第二张RAID卡）示列：./storcli64 /c0 add vd r1 size=all drives=62:0,62:1 6. 做RAID5 指令：./storcli64 /c0 add vd r5 size=all drives=E:S-S 示例：./storcli64 /c0 add vd r5 size=all drives=62:0-3 7. 查看RAID组状态指令：./storcli64 /c0/vall show 8. 删除RAID 指令：./storcli64 /c0/v0 del force（先获取RAID组的VD值） 9. 查看RAID卡的JBOD是否打开指令：./storcli64 /c0 show all |grep -i jbod 10. 将RAID卡的工作模式改为JBOD模式指令：./storcli64 /c0 set jbod=on 11. 磁盘点灯和关闭硬盘灯（定位用） Lsscsi查询盘符（第三位数为DID） ./storcli64 /c0/eall/sall show 查看硬盘 ./storcli64 /c0/e62/s0 start locate 点亮硬盘灯 ./storcli64 /c0/e62/s0 stop locate 关闭硬盘灯 12. 支持在线自动重建（组RAID盘插新盘自动重建）指令：./storcli64 /c0 set maintainpdfailhistory=off 13. 查看磁盘坏道信息指令：./storcli64 /c0 show badblocks 14. 查看磁盘完整信息指令：./storcli64 /c0/eall/sall show all 15. 檫除硬盘（磁盘格式化）指令： ./storcli64 /c0/e62/s0 start erase 16. RAID卡日志收集指令：./storcli64 /c0 show alilog logfile=raid.alilog 17. 查看RAID卡信息指令：./storcli64 /c0 show all 18. 设置热备盘 storcli64 /cx/ex/sx add hotsparedrive dgs=x 局部热备盘 storcli64 /cx/ex/sx add hotsparedrive 全局热备盘 storcli64 /cx/ex/sx delete hotsparedrive 删除热备盘 storcli64 /cx/ex/sx show rebuild 查看rebuild storcli64 /cx/ex/sx start rebuild 开始rebuild 19. UBad盘重建 storcli64 /c0/ex/sx set good force 将UBad盘设置为UGood盘 storcli64 /c0/fall import 将原有的RAID配置恢复 20. 查看磁盘重建进度指令：./storcli64 /c0/ex/sx show rebuild 21. 开启Stop on error功能（RAID卡状态为安全模式，系统下，磁盘无法生成盘符）指令：./storcli64 /c0 set bios mode=soe 22. 设置RAID组缓存模式为读写指令：./storcli64 /c0/v0 set wrcache=wt 23. 设置RAID卡启动项指令：./storcli64 /c0/v0 set bootdrive=on（将VD为0的RAID组设置为Boot） ./storcli64 /c0/e252/s7 set bootdrive=on（将slot7盘设置为Boot） 24. RAID组扩容指令：./storcli64 /c0/v0 expand size=200GB（容量扩容，将VD0的容量扩大至“200GB”）指令：./storcli64 /c0/v0 start migrate type=r0 option=add drives=252:2（磁盘扩容，将slot2扩容到VD为0的RAID组） 25. RAID组迁移指令：./storcli64 /c0/v0 start migrate type=r1 option=add drives=252:3（单盘RAID 0加盘迁移至RAID 1） 26. 查看超级电容信息指令：./storcli64 /c0/cv show all 27. 升级磁盘固件指令：./storcli64 /c0/e64/s5 download src=XXX.BIN（src=后接固件） 28. 导入或者清除RAID卡外部配置 ./storcli64 /c0/fall import preview（查看RAID卡的外部配置） ./storcli64 /c0/fall import（导入外部配置） ./storcli64 /c0/fall delete（删除外部配置） 29. 查看轰鸣器状态及关闭或开启告警 ./storcli64 /c0 show alarm（查看轰鸣器状态） ./storcli64 /c0 set alarm=on（开启轰鸣声） ./storcli64 /c0 set alarm=off（关闭轰鸣声） ./storcli64 /c0 set alarm=silence（静音，临时关闭轰鸣声，重启恢复） 30. 查询和清除PreservedCache数据查询和清除PreservedCache数据（RAID卡有offline配置需要用到） ./storcli64 /c0 show preservedcache ./storcli64 /c0/vx delete preservedcache force 常用操作：一、插入有外部RAID配置盘改直通步骤一：进RAID卡工具路径（/sf/bin/raidtools/bin），查看磁盘状态，指令：./storcli64 /c0/eall/sall show （E为Enclosure Device ID，S为Slot Number，c0为第一张RAID卡，c1为第二张RAID卡，只有一张卡则为c0，可lspci |grep SAS或者lspci |grep raid查看几张卡）步骤二：如磁盘状态为UB，改成UG，指令：./storcli64 /c0/ex/sx set good，如上图e为16,s为10,指令为：./storcli64 /c0/e16/s10 set good,然后扫描和清除外部配置，指令： ./storcli64 /c0/fall import preview（查看RAID卡的外部配置） ./storcli64 /c0/fall delete（删除外部配置）步骤三：将磁盘状态改为直通。指令：./storcli64 /c0/ex/sx set jbod，上图e为16,s为10,指令：./storcli64 /c0/e16/s10 set jbod,然后用lsblk -d |grep sd查看磁盘盘符可以正常识别。二、组RAID盘状态为UB重建步骤一：进RAID卡工具路径（/sf/bin/raidtools/bin），查看磁盘状态，指令：./storcli64 /c0/eall/sall show （E为Enclosure Device ID，S为Slot Number，c0为第一张RAID卡，c1为第二张RAID卡，只有一张卡则为c0，可lspci |grep SAS或者lspci |grep raid查看几张卡）步骤二：将UB状态盘改为UG，指令：./storcli64 /c0/ex/sx set good 步骤三：扫描外部配置和重建，指令： ./storcli64 /c0/fall import preview（查看RAID卡的外部配置） ./storcli64 /c0/fall import（导入外部配置）步骤四：查看重建进度，指令： ./storcli64 /c0/ex/sx show rebuild 步骤五：如有RAID卡电容滴滴滴告警，需要临时关闭，指令： ./storcli64 /c0 show alarm（查看轰鸣器状态） ./storcli64 /c0 set alarm=silence（静音，临时关闭轰鸣声，重启恢复）三、组RAID 步骤一：将磁盘状态改为UG，如已经是UG，执行下一步骤，指令： ./storcli64 /c0/ex/sx set good （E为Enclosure Device ID，S为Slot Number，c0为第一张RAID卡，c1为第二张RAID卡，只有一张卡则为c0，可lspci |grep SAS或者lspci |grep raid查看几张卡）步骤二：组RAID： RAID0/1/5：./storcli64 /c0 add vd r1 size=all drives=E:S,E:S（vd后面接需要做的RAID0或者1或者5，先获取磁盘的EID和Slot，./storcli64 /c0/eall/sall show，C0为第一张RAID卡，C1为第二张RAID卡） RAID10/50: ./storcli64 /c0 add vd r10 size=all drives=E:S-S pdperarray=2 （pdperarray为每组span的数量，如6个磁盘组RAID50，分2组span，那数量为3）

【硬件排查】巡检报设备未开启VMD不支持U.2盘热插拔处理

巡检报设备未开启VMD，需要进BIOS开启，设备SN为9*,F6*设备需要开启VMD才支持热插拔，FB*设备无需开启VMD，开启VMD后热插拔或者重启反而识别不到U.2盘。步骤一：先确认设备SN，如果是FB*开头设备，无需开启VMD，特别是EDS服务器会误报，找软件消除告警，如果是9*,F6*开头设备，执行步骤二。步骤二：后台用lspci |grep -i sas读取lspci信息，设备开启了VMD，前面ID会有4个0，没开启VMD则执行步骤三。步骤三：重启设备，进BIOS界面打开VMD，菜单界面按delete进去，有BIOS密码，默认为：S#AN$6fo81r，选择Advanced-->Socket Configuration-->IIO Configuration-->Intel(R) vmd Techlonogy，进入Intel(R) vmd Config,选择Auto，按F10保存配置，重启后可尝试插拔NVME盘确认功能情况。 SN为9C,F6C开头服务器开启VMD步骤如下：选择Processor-->Intel VMD technology-->Socket1-->Intel VMD PStack2-->开启Hot Plug

【硬件排查】SN为FBQ服务器EDS型号更换前置背板后，后置系统盘不识别问题排查

更换前置背板和线缆后，前置硬盘可以正常识别，后置系统盘识别不到步骤一：重启设备，按delete键进BIOS里面的RAID卡管理界面，找到Drive Management，看能否识别到系统盘，识别不到执行步骤二。步骤二：关机断电插拔后置系统盘所有线缆和接前置背板SATA线，然后上电，按delete键进BIOS里面的RAID卡管理界面，找到Drive Management，看能否识别到系统盘，识别不到执行步骤三。步骤三：将后置系统盘SATA线直连RAID卡，然后上电，按delete键进BIOS里面的RAID卡管理界面，找到Drive Management，看能否识别到系统盘，识别不到则返修后置背板加线缆，能识别则执行步骤四。步骤四：将前置旧背板芯片保护套往上打开，取出芯片，按照原来安装顺序，换到新背板上，然后上电，按delete键进BIOS里面的RAID卡管理界面，找到Drive Management，看能否识别到系统盘。仍然识别不到联系硬件技术支持。

SN为FBQ开头的服务器BIOS、BMC、CPLD升级方法

注意事项： 1、PC端需配置同BMC IP一个网络段IP。 2、先升级BMC,再升级CPLD和BIOS,升级BMC可以在设备工作状态下升级，重启BMC生效。 3、升级BIOS和CPLD必须在关机（待机）状态下升级，BMC,BIOS,CPLD升级过程中一定不能断电，否则BMC,BIOS,CPLD芯片会刷挂，设备无法启动，CPLD及BIOS升级成功后，需要硬重启（断电）生效。如果只升级BMC，不会影响客户业务；如果BIOS/CPLD需要升级，请先迁移客户业务后再操作。一、BMC升级 1、设备出厂默认IPMI地址为192.168.10.10，若修改过IPMI IP，可在后台输入以下指令进行查询，也可重启设备，查看设备启动界面打印的BMC地址。 ipmitool lan print 1 2、电脑用网线连接IPMI口，打开浏览器根据专用口 IP 地址 https://192.168.10.10 （https://机器实际IP地址）登录WEB网页，登陆用户名为sangfor，密码为S#AN$6fo81r（如密码已修改，使用修改后的密码） 3、如下图所示，选择维护——》保存配置——》选取全部——》保存（建议直接选取全部，如果有不想保留的配置，也可以不勾选） 4、如下图所示，选择维护——》固件更新 5、选择文件——》选择对应的BMC固件包——》开始固件更新。 6、更新镜像选择两个镜像，核对下面列出来的保留配置项目是否与步骤3勾选的一致。List of Components选择更新所有。 7、点击继续烧录——》确定，等待5分钟左右弹出下图弹窗后按弹窗提示要求手动刷新BMC页面，重新登入web查看BMC固件是否为更新后的版本。二、CPLD升级（升级前先迁移业务，升级过程中一定不能断电） 1、进入BMC页面选择维护——》固件更新 2、选择文件——》选择CPLD升级包——》开始固件更新 3、按需选择要更新的CPLD固件（不同的部件CPLD对应不同的升级文件）。点击继续烧录——》确定。如果无法确认自己要升级的是哪个部件，请联系400硬件技术支持确认。 4、更新完成后，进入远程控制——》电源控制——》电源循环——》执行动作——》确定。如果还需要更新BIOS，可以更新完BIOS后再执行电源循环动作。 5、等待10分钟或通过远程控制台观察设备重启完成后，刷新BMC页面查看CPLD版本是否升级成功。三、BIOS升级（升级前先迁移业务，升级过程中一定不能断电） 1、进入BMC页面选择维护——》固件更新——》选择文件——》上传BIOS升级包——》开始固件更新 2、勾选保存BIOS所有配置，点击继续烧录——》确定。 3、等待5分钟左右升级完成，弹窗点击确定会跳转到电源控制界面，选择电源循环——》执行动作——》确定。 4、等待10分钟或通过远程控制台观察设备重启完成后，刷新BMC页面，查看BIOS版本是否升级成功。升级过程中遇到任何问题请拨打400-630-6430联系硬件技术支持。

【硬件排查】SN为F6H,FBH备份一体机BMC修改磁盘状态操作指导

备份一体机组了RAID5，其中一个盘亮黄灯，系统下无法改状态重建步骤一：登录IPMI，存储管理，查看异常盘状态，如果不识别，或者状态为faild，拔掉该盘，等30S再插回去，看磁盘状态，变成UB状态，执行步骤二。步骤二：选择异常盘，设置-->固件状态改为UG-->确认，然后再进去看状态变成forgein，执行步骤三。步骤三：选择RAID卡，编辑，设置里面导入Forgein配置，点确认，然后等1分钟再看磁盘状态，变为rebuild则磁盘在重建，一般数据盘重建要5个小时左右，SSD重建半个小时左右，重建过程中电容会滴滴滴告警，当磁盘变成online后告警声会消除。

SN为9S、9N、F*S、F*N开头的设备CPLD升级方法

SN为9S、9N、F*S、F*N开头的设备CPLD升级方法注意事项： 1、PC端需配置同BMC IP一个网络段IP。 2、升级CPLD需要在关机状态下升级，请进入单主机维护模式后再操作。根据设备上的标识或后台输入dmidecode -t 1查看设备SN （如知道IPMI口IP地址，可直接进行第4步操作） 1、如图所示开机按DEL键进入 BIOS Setup 页面。 2、选择”Server Mgmt”->BMC network configuration 3、查看BMC 专用口IP 地址。 4、电脑用网线连接IPMI口，打开浏览器根据专用口 IP 地址 https://192.168.10.10 （https://机器实际IP地址）登录WEB网页，登陆用户名 admin 登陆密码 admin （新用户名为sangfor，密码为S#AN$6fo81r，如密码已修改，使用修改后的密码）。 5、关闭服务器，选择—>远程控制—>电源与能耗—>电源控制—>强制关机。若设备未在关机状态下升级，BMC会提示设备未关机，无法升级CPLD。 6、如图所示，选择系统维护—>固件更新—>CPLD固件更新 7、选择CPLD升级文件，点击开始固件更新—>确定 8、等待3左右分钟后，页面提示升级成功。 9、确认CPLD升级完成结束后，将整个服务器手动断电使 CPLD升级生效，拔掉电源线1分钟以上再上电。 10、重新上电后登陆BMC Web界面最后再检查固件版本信息是否准确。

到第

页

确定

{{contentObj.name||'--'}}

{{contentObj.name||'--'}}

深信服自助服务平台

硬件产品