建议使用Chrome浏览器访问!
技术支持
互动社区
学习培训
深信服官网
合作伙伴

硬件产品

关注
主要包含硬件产品相关知识
故障案例库
典型场景排查思路
主模块:
全部
网安设备硬件排查
服务器硬件知识库
维修常见问题库
版本标签:
全部
为您筛选140条结果
【硬件排查】SN为F6Q,FBQ无RAID卡型号设备系统盘做软RAID1操作指导
当机型没有RAID卡,客户要求系统盘组RAID1,可以进BIOS组软RAID1操作       步骤一:重启设备进按delete键进BIOS,默认BIOS密码:S#AN$6fo81r,选择Advance-->Platform Configuration-->PCH Devices-->PCH SATA Configuration-->Configure SATA as改成RAID,然后F10保存,重启再进BIOS界面。   步骤二:选择Advance-->Dynamic UEFI Oprom-->vroc选项进去做RAID。如果系统盘识别不到,将系统盘跟能识别到的HDD盘交叉下位置,重启设备再进该界面组RAID。                            
【硬件排查】SN为FES开头服务器风扇全速转问题排查
风扇全速转,重启设备可以恢复。 附CPLD V0.7版本,升级前需要解压 SZH_52DB16_UN_V07_20240605.7z ( 0.06M  )       步骤一:后台用ipmitool sel elist查看BMC日志发现有报错,日志看不了,BMC挂了。   步骤二:关机重启设备能正常进BMC,查看CPLD版本为V0.3版本,BMC版本为0.09版本   步骤三:关机,固件升级里面升级CPLD版本到V0.7,升级成功后,拔掉电源线2分钟后再上电,进了系统后查看固件版本是否为V0.7版本。   步骤四:查看其他正常设备检查型号和BMC固件和CPLD固件版本是否为R5240H0  0.09  V0.3是则都需要关机升级CPLD。 查看硬件型号指令:dmidecode -t1 查看BMC版本:ipmitool mc info 查看CPLD版本:ipmitool raw 0x3a 0xEC 0x70   原因:R5240H0机型升级了BMC0.09版本,CPLD用的低版本V0.3,不适配导致BMC挂死,风扇全速转,升级CPLD版本解决。                      
设备扩容与定制需求查询
遇到设备扩容和硬件定制相关需求的客户时,可以根据以下步骤进行处理。       情景一:客户咨询能否扩容部件 步骤一:获取客户设备SN、型号和配置情况,是否有相关硬件定制。 步骤二:根据型号到W3的SCP应用中查询定制信息,如下图,依照实际配置情况,确认可否做对应定制。   情景二:客户咨询能扩容什么型号、什么规格的部件 步骤一:获取设备型号与SN,根据SCP结果进行答复。   步骤二:SCP中的定制信息不足/信息缺失时,将SN和型号反馈到定制负责人确认可否进行扩容,具体的扩容配件规格。 网安定制:曾鹏10450 服务器定制:徐伟43346   目前支持不支持定制的部件有: 服务器:CPU、RAID卡、8盘位扩容12盘位、第三方显卡定制显卡供电线。 网安:CPU。            
【硬件排查】U.2硬盘安装操作指导
此文档适应于双路服务器,单路服务器不支持(U.2资源属于第二颗CPU资源)       一、SN为F6H、FBH开头服务器U.2硬盘安装操作指导 步骤一:拆上盖,用螺丝刀拧动机箱上盖螺丝,取下机箱盖,放置指定区域。 步骤二:拆riser3部件,依次拆卸机箱自带3颗螺丝,如下图: 步骤三:拆riser3线缆,拔掉riser3到主板端线缆。 步骤四:移除riser3模组,往远离后部水平移动,然后向上取出riser3模组。 步骤五:安装U.2模组,将U.2模组安装拆riser3模组反方向安装到机箱上,然后用3颗螺丝固定。 步骤六:安装线缆,将下图所示4条线缆按照顺序安装到主板上,检查螺丝无漏锁,硬盘线缆无松动,安装完成,然后将U.2硬盘插到硬盘模组中。 二、SN为F6C开头服务器U.2硬盘安装操作指导 步骤一:核实加装配件,信号线一条,U,2数据线4条。 步骤二:拆上盖,和拆除风扇模组,双手捏住风扇模组两端,水平向上取出,然后放置闲置区域。 步骤三:安装线缆,找到4个NVME接口,主板端将数据线依次接入 NVME0-CPU1(①) 和 NVME1-CPU1(②)接口,注意线材自带防呆接口,不可插反,将短线接入NVME0-CPU1,长线接入NVME1-CPU1,若有多根线材,则按照主板(0-1-2-3)槽位依次安装。 步骤四:前置背板端将数据线依次接入 NVME0-CPU1(①) 和 NVME1-CPU1(②)接口,注意线材自带防呆接口,不可插反;(若有多根线材,则按照0-1-2-3次序依次安装) 将多余出来的部分折叠,并卡入束带内。 注意: 来料数据线为一长一短两根,短线为银白色接口,长线为黑色接口,将短线接入NVME0-CPU1,长线接入NVME1-CPU1。 步骤五:将背板定位线一端插入图示①接口,然后将线材穿过限位槽,另一端插入图示接口②, 安装时注意线材自带防呆接口,避免插反。 步骤六:待线材全部安装完毕,将多余出来的部分折叠,并卡入束带内;将风扇模组原路径安装回机箱,然后安装导风罩和上盖,将U.2盘插到第一层0-3槽位。 三、SN为F6Q开头服务器U.2硬盘安装操作指导 加装2根高速线,加装在①-J30位置(红色线),②-J54位置(紫色线)硬盘加装在前置11/10/9/8盘位   四、SN为FBQ开头服务器U.2硬盘安装操作指导 当需要加装U.2硬盘时,需加装2根高速线,第一根加装在背板4号位置对应主板4号位置(黄色线)第二根线加装在背板5号位置主板5号位置(红色线),U.2硬盘按倒序加装11.10.9.8硬盘位号     五、SN为FBC开头服务器U.2硬盘安装操作指导 当安装U.2硬盘时,加装2根高速线,一头加装在①-J80位置(短线),另一端加装在前置背板④位置,如图示红线,第二根线加装在②-J79位置(长线),另一端加装在前置背板③ 如图示黄线位置硬盘加装在前置11/10/9/8盘位。 六、中科海光5系列服务器U.2硬盘安装操作指导         七、中科海光7系列服务器U.2硬盘安装操作指导                  
【硬件排查】SN为FBQ开头服务器9560-8i RAID卡组RAID5操作指导
9560-8i RAID卡默认JBOD模式,支持RAID0,1,10,需要改成RAID模式才支持RAID5,50       步骤一:重启设备,在LOGO界面按delete键进BIOS(BIOS默认密码为:S#AN$6fo81r),选择Advanced-->Dynamic UEFI Oprom-->9560-8i   步骤二:选择Main Menu-->Controller Management-->Advanced Controller Management -->Manage Personality Mode-->Advanced-->Force Switch to RAID Mode-->Confirm 改为Enabled,选择Yes,按Enter键保存。   步骤三:看到Requested Mode模式变为RAID模式后,重启设备,然后进BIOS,选择RAID卡进入管理界面。如果状态还是JBOD,下方的Advanced强制下RAID模式,然后 重启设备进BIOS,选择RAID卡进入管理界面。   步骤四:选择Configuration Management-->Create Virtual Drive,然后将要组RAID5的数据盘改成Enabled,选OK,Confirm选择Enabled,Yes   步骤五:Select RAID Level选择RAID5,然后点击Select Drives,将需要组RAID5的盘改成Enabled,再Apply Changes   步骤六:RAID配置按照下图设置:Strip Size:64KB,Write Policy:Always Write Back,Drive Cache:Disable,然后点击Save Configuration,Confirm选择Enabled,Yes   步骤七:选择Virtual Drive Management,查看RAID5是否已组成功。            
【硬件排查】国芯CCUPM2003加密卡重启识别异常问题
加密卡重启后提示异常,判断为未识别加密卡。 重启能恢复,或者断电重启恢复。 涉及平台以及加密卡型号: 设备型号:aTrust-1000-LS1050C,aTrust-1000-LS1050M,aTrust-1000-LS1050G 硬件平台:智微兆芯平台 加密卡型号:国芯CCUPM2003加密卡 风险固件版本:CCP907T SDFESXF 2.15 20230824 v4 附固件信息判断工具: GetDevInfo.7z ( 0.01M  )       步骤一:Web界面提示国密卡未识别:    步骤二:系统后台lspci信息判断,下图为异常值。 正常情况,lspci有识别加密卡为:   步骤三:上传脚本 GetDevInfo (见附件)工具,到tmp 路径,增加权限,执行指令(当设备恢复识别加密卡情况下执行) 老版本固件:CCP907T SDFESXF 2.15 20230824 v4   异常版本新版本固件:CCP907T SDFESXF 2.16 20240112 V4   更新后版本   解决方案: 返厂更换新加密卡,更新固件版本                          
【硬件排查】SN为FBH服务器宕机,故障码CPU VCCIN或VSA_CPU failture报错处理
设备宕机重启,BMC日志打印CPU VCCIN错误,或者VSA_CPU failture告警。 附件附BIOS,BMC固件。 FBH BIOS,BMC.zip ( 72.72M  )       步骤一:登录IPMI,查看事件日志,发现有VICCIN告警,或者有VSA_CPU failture告警,无其他告警。   步骤二:检查BMC固件版本为3.03.10.91版本。   步骤三:3.03.11.15版本以前有这个问题,需升级到3.03.11.15及以上版本,我司最新版本为:3.07.00.31,对应的BIOS版本也升级下。              
【硬件排插】YANHUA C610电源告警问题排查
客户端设备web界面出现电源监控频繁告警现象(单电源/双电源)。       步骤一:判断设备平台:dmidecode_ex, 判断为YANHUA C610平台   步骤二:查看监控方式以及电源当前状态,外观检查电源模块接电源线位置指示灯情况。如果是电源指示灯为橙色,则检测供电线路,或者交叉检查电源模块。 如果是2个电源都是绿色常亮,则进一步排查。后台执行sh -x get_power_state_raw.sh ,确认设备监控方式为BMC监控还是SIO监控。 如果是sensors ,判断当前监控方式是SIO监控。 如果是ipmitool ,判断当前监控方式是BMC监控。 0x18  是正常值    0x08  和0x10 是单电源丢失 0x00  是双电源异常 (理论上不存在,属于误报) 通过SN 查烤机系统是否为BMC设备,该型号应该为BMC监控   步骤三:查看BMC日志,执行以下命令。 modprobe ipmi_msghandler modprobe ipmi_devintf modprobe ipmi_si Ipmitool sel elist 如果没有没有近期日志,可以先保存一份日志后,清理日志再看。 保存日志指令ipmitool sel elist >>bmc.log 清理日志指令ipmitool sel clear 如果日志持续输出异常信息,电源是指灯正常,则判断BMC监控信息异常。   解决方案: 临时解决:重启BMC ,或者断电再开机 重启BMC 指令 ipmitool bmc reset cold 长期解决:暂无,待确定              
【硬件排查】SN为W*Z开头设备BMC异常问题排查
BMC无法读取,直连ipmi接口ip不通/设备上电无法正常启动 问题设备平台和产品范围:family:SXF_PUMA_448_4_2/SXF_PUMA_448_2_1 产品线:AF/AD/ATRUST/NSF/STA/WAF       案例一: 设备型号:NSF-7100A-I 风扇全速转,区别于替他设备转速转的风扇声音很大,系统后台无法读取bmc的信息,直连IPMI的IP不通,确认BMC没有起来,重启设备BMC无法恢复故障结论:设备BMC芯片异常,设备风扇事BMC监控,BMC没用正常工作导致风扇不受控制,此类现象需要返厂检修分析。    案例二: 设备型号:STA-100-B3100 设备使用中突然掉电,重新上电无法开机,面板power和logo灯都不亮。断电静置几分钟,重新上电开机问题一样   故障结论:BMC芯片异常造成芯片短路导致设备无法启动 判断依据:1,设备系统运行正常,BMC无法读取,直连IPMI不通2,风扇全速工作,机箱风扇工作声音很大3,设备上电无法正常启动,4,设备SN:WCZ开头,family信息:family:SXF_PUMA_448_4_2/SXF_PUMA_448_2_1                                            
【硬件排查】AD系统如何判断网口down/up 问题
AD系统网口被DPDK接管,除管理口外,其他口是DPDK接管,网口down/up不在messages、dmesg提醒网口down/up。       收集信息:  反馈异常当天,ADweb界面日志告警情况。  反馈异常当天,黑匣子日志。  AD提供收集信息脚本,收集相关硬件信息。   检查对应黑匣子日志路径  异常当天的dpdk日志,文件是个压缩包,需要解压查看  aclog\blackbox\18\since-240603-172755\dpdk_stats.gz    异常当天的InfoAboveModuleName 如果问题日期在收集黑匣子当天,日志在log中 \log\20241118\zh_CN\0\InfoAboveModuleName-20241118.csv 如果问题日期在收集黑匣子时2天以上,比如16号的问题,18号收集日志,日志在hislog中 \hislog\20241116\zh_CN\0\InfoAboveModuleName-20241116.csv   日志解析 DPDK日志,解压后为dpdk_stats 其中接口port0 =eth1   AD收集信息脚本中会收集network_info.md  日志包含网口lspci 相关信息 其中有:  ### lspci -tvvv ###   网卡挂载情况   ### lspci -xxx ###   寄存器情况 ### lspci -nnvvv | grep -i cesta ###    lspci情况 ### /usr/ad/bin/icat /iproc/net/dev ###  网络流量统计 ### cat /etc/sinfor/ad/dpdk_eth.ini ###  网口pcieID ### iproc /iproc/netdev/nic ###  网口down/up情况 ### lspci -Dnn | grep -i eth ### 网口芯片信息     问题判断:  确认问题现象,web是否有告警是否有提示网口断电; 确认InfoAboveModuleName日志,是否有提示网口断电。 如果都有提示,说明网口有物理down提示。 如果web或者info没有提示网口down,只是对端设备网口down,这种转软件分析。  检查dpdk日志,确认是否有网卡错误包,丢包。  如果仅有CRC错误,没有其他类型错误,排查线路,光模块,光纤,网线,参考CRC问题,处理。 如果有大量错误,包含各种错误类型,初步判断寄存器异常,检查是否为预警问题。(参考8口卡,825994万兆卡问题)  如果dpdk没有异常,检查md日志,看看网口寄存器情况  如果以上都没有看到异常,异常网口是光口,可以考虑检查光衰情况。(参考网口工具使用,注意非X710\XL710 网口可以看,X710\XL710 网口工具待发布中)  检查messages或者dmesg,异常时间是否有pcie错误或者网口hang  如果以上都无法判断,了解一下对接设备,看看对接设备信息,升级FAE进一步排查。                      
【硬件排查】硬盘不调度或掉盘问题排查
场景一:硬盘识别异常或BIOS引导盘序异常,开机直接进入到BIOS界面,或者提示"Reboot and Select proper Boot device or Insert Boot Media in selected Boot device and press a key"硬盘没有正常启动,或者硬盘没有安装正确的系统。   场景二:硬盘坏道或插写寿命耗尽,现象体现BIOS界面/开机alarm常亮串口显示无法进入系统,一直打印硬盘I/O报错或者文件系统报错。   场景三:链路问题或硬盘CRC有异常数值导致一直打印硬盘扇区报错或ATA链路报错-硬盘反复重置硬盘响应延迟。   场景四:客户设备异常重启,重启后系统后台smartctl参数读取正常,查看系统日志记录与客户业务感知异常时间存在差异,硬盘掉盘或疑是掉盘   场景五:常用硬盘厂商已知问题,JBL寿命问题,市场还存在老固件V1.30.6及以下版本/海康低128G/256G卡死问题固件版本D5Na2A11/创见128G 硬盘CRC低固件版本FW: 02J0TSXF   场景六:硬盘只读导致系统服务异常,多见是硬盘分区满了,无法write,系统日志一般会有read_only只读的打印,或者系统文件异常记录。   场景七:双盘设备数据盘掉盘案列,messages存储在系统盘,blackbox存储在数据盘。   场景八:设备iowait延迟,硬盘I/O异常                           场景一:硬盘识别异常或BIOS引导盘序异常,开机直接进入到BIOS界面,或者提示"Reboot and Select proper Boot device or Insert Boot Media in selected Boot device and press a key"硬盘没有正常启动,或者硬盘没有安装正确的系统。 现象排查:设备ALRM常亮,串口或者VGA显示器接入BIOS界面查看硬盘识别及盘序,设置系统盘作为第一启动项,如确认启动项是正确的,需进一步确认设备ghost信息 解决方案:BIOS设置正确启动项,确认设备系统安装信息   场景二:硬盘坏道或插写寿命耗尽,现象体现BIOS界面/开机alarm常亮串口显示无法进入系统,一直打印硬盘I/O报错或者文件系统报错 现象排查:设备ALARM常亮,查看串口或者VGA输出,重复打印bad target异常,设备重启无法恢复。 解决方案:硬盘坏道,需要返修更换硬盘   场景三:链路问题或硬盘CRC有异常数值导致一直打印硬盘扇区报错或ATA链路报错-硬盘反复重置硬盘响应延迟 现象排查:查看串口输出或者dmesg日志,ATA报错重启可能会恢复,CRC重启设备无法恢复,可以通过smart查看硬盘CRC异常数值 解决方案:设备需要返修更换硬盘   场景四:客户设备异常重启,重启后系统后台smartctl参数读取正常,查看系统日志记录与客户业务感知异常时间存在差异,硬盘掉盘或疑是掉盘 现象排查:设备已自动重启恢复,无明显物理故障状态,向客户了解重启前设备指示灯情况及设备恢复方式(手动重启or自动重启),进系统后台查看messages和blackbox的dmesg的日志记录信息,结合设备重启时间和客户感知业务异常时间存在差异,如无相关日志记录可查看对端设备网口记录的信息,可怀疑是掉盘了 如以下案列,设备重启前日志记录15:14:01,到15:54:13设备重启,客户感知业务中断时间是设备重启的时间戳,可以判断为硬盘掉盘引起设备重启,掉盘后设备不会立即重启,设备面板指示灯也不会有异常,设备业务还会正常运行,到54分内存缓存的跑完才会重启 解决方案:如确认硬盘是smart数值硬盘读写速率均正常,首次可沟通观察使用,建议KA客户进行返修更换硬盘   场景五:常用硬盘厂商已知问题,JBL寿命问题,市场还存在老固件V1.30.6及以下版本/海康低128G/256G卡死问题固件版本D5Na2A11/创见128G 硬盘CRC低固件版本FW: 02J0TSXF 现象排查:系统后台smartcl -a /dev/sd*读取厂商及硬盘FW信息 解决方案:JBL硬盘低固件问题市场还有,常见寿命耗尽,海康盘产品线均已出固件补丁包,创见低固件问题案列较少,如已出现异常异常,可建议返修更换   场景六:硬盘只读导致系统服务异常,多见是硬盘分区满了,无法write,系统日志一般会有read_only只读的打印,或者系统文件异常记录 现象排查:设备面板指示灯alarm常亮,读取硬盘smart正常,dmesg日志记录中断,不是掉盘,查看硬盘分区是否有异常,后台手动无法编辑写入文件 解决方案:此现象一般是系统软件功能问题,出现大量异常日志记录把分区写满了,需协调研发查看   场景七:双盘设备数据盘掉盘案列,messages存储在系统盘,blackbox存储在数据盘,如下图 现象排查:数据盘掉盘设备运行正常,面板指示灯无异常,先查看lsblk设备硬盘排序情况,确认双盘是否在位,查看messages与dmesg日志记录对比,是否存在中断 解决方案:查看数据盘smart 健康情况,无smart报错数值可观察使用,ka客户建议返修更换   场景八:设备iowait延迟,硬盘I/O异常   现象排查:系统后台查看设备CPU内存等使用率信息,排除硬盘坏道,客户设备负载情况,排除以上可能如持续报硬盘iowiat高的情况,可以进一步确认硬盘固件版本信息,读取读写速率的异常,问题可以升级进一步确认 解决方案:确认硬盘存在异常,沟通返修,无异常问题升级处理          
alrm灯和ha灯交替闪烁
alrm灯和ha灯交替闪烁       步骤一:断电5分钟上电看能否恢复,如果还是一直alrm灯和ha灯交替闪烁,内存质检过不去,整机返修。如恢复观察,测试设备则可以拿到办事处断电开箱,重新插拔内存测试,操作之前联系下硬件技术支持。              
【硬件排查】IPMI安装系统花屏处理
IPMI打开KVM去安装系统,显示花屏导致无法点击下一步进行部署安装,常见于arm架构的鲲鹏服务器。       步骤一:重启设备选择U盘或者光驱进入安装界面,在选择语言界面按e进行编辑,进入内核启动参数界面,启动参数上增加video=VGA-1:640x480-32@60me 在ifnames=0后面按空格再输入,注意640后面是英文字母x。   步骤二:按Ctrl +x后进行安装系统。如安装系统进了安全模式,需要换个刻录工具重新刻录安装。   附刻录工具 rufus-3.14.1788.zip ( 1.09M  )          
【硬件排查】SN为F6Q、FBQ服务器扩容内存容量识别为0问题排查
扩容内存后,IPMI的内存信息发现有条内存容量识别为0       步骤一:检查下内存是否有按照内存插法来插,如没按照内存插法扩容,需要用正确的插法扩容,如内存插法没问题,执行步骤二。   步骤二:断电拆箱,将容量为0的内存和其他正常内存交叉测试,跟着内存走换内存,跟着槽位走执行步骤三。   步骤三:检查该内存槽位是否有异物,刮伤,清灰下,重新安装,现象一样执行步骤四。   步骤四:断电拆箱,找到主板纽扣电池,扣下来等2分钟再安装回去,上电进BIOS,然后看内存容量是否识别正常,还有异常联系硬件技术支持。                            
【硬件排查】storcli64工具常用指令
该工具适用于Mega RAID卡,如3008IMR,SAS3416,9361,9460,9560等,Megacli64工具跟新Mega raid卡有兼容性问题,推荐都用storcli64指令 附件附storcli64工具 storcli64.zip ( 2.43M  ) 如RAID卡比较新如9560卡,用下面这个新版工具:rpm -i 接rpm文件 ,RAID卡工具在cd /opt/MegaRAID/storcli/  目录 storcli-007.2408.0000.0000-1.noarch.zip ( 2.05M  )        查看硬盘状态 指令:./storcli64 /c0/eall/sall show   (下图的EID:SLT为Enclosure Device ID和Slot Number)   2. 查看RAID卡数量 指令:./storcli64 show ctrlcount    3. 修改jbod盘模式为UG模式(组RAID前模式要UG才能组RAID) 指令:./storcli64 /c0/e62/s0 set good force    4. 修改UG模式为JBOD 指令:./storcli64 /c0/e62/s0 set jbod     5. 做RAID1 指令:./storcli64 /c0 add vd r1 size=all drives=E:S,E:S(先获取磁盘的EID和Slot,./storcli64 /c0/eall/sall show,C0为第一张RAID卡,C1为第二张RAID卡) 示列:./storcli64 /c0 add vd r1 size=all drives=62:0,62:1   6. 做RAID5 指令:./storcli64 /c0 add vd r5 size=all drives=E:S-S 示例:./storcli64 /c0 add vd r5 size=all drives=62:0-3   7. 查看RAID组状态 指令:./storcli64 /c0/vall show   8. 删除RAID 指令:./storcli64 /c0/v0 del force(先获取RAID组的VD值)   9. 查看RAID卡的JBOD是否打开 指令:./storcli64 /c0 show all |grep -i jbod   10. 将RAID卡的工作模式改为JBOD模式  指令:./storcli64 /c0 set jbod=on   11. 磁盘点灯和关闭硬盘灯(定位用) Lsscsi查询盘符(第三位数为DID) ./storcli64 /c0/eall/sall show 查看硬盘 ./storcli64 /c0/e62/s0 start locate 点亮硬盘灯 ./storcli64 /c0/e62/s0 stop locate 关闭硬盘灯   12. 支持在线自动重建(组RAID盘插新盘自动重建) 指令:./storcli64 /c0 set maintainpdfailhistory=off   13. 查看磁盘坏道信息 指令:./storcli64 /c0 show badblocks   14. 查看磁盘完整信息 指令:./storcli64 /c0/eall/sall show all   15. 檫除硬盘(磁盘格式化) 指令: ./storcli64 /c0/e62/s0 start erase   16. RAID卡日志收集 指令:./storcli64 /c0 show alilog logfile=raid.alilog   17. 查看RAID卡信息 指令:./storcli64 /c0 show all   18. 设置热备盘 storcli64 /cx/ex/sx add hotsparedrive dgs=x 局部热备盘 storcli64 /cx/ex/sx add hotsparedrive        全局热备盘 storcli64 /cx/ex/sx delete hotsparedrive        删除热备盘 storcli64 /cx/ex/sx show rebuild  查看rebuild storcli64 /cx/ex/sx start rebuild    开始rebuild   19. UBad盘重建 storcli64  /c0/ex/sx set good force 将UBad盘设置为UGood盘 storcli64 /c0/fall import 将原有的RAID配置恢复   20. 查看磁盘重建进度 指令:./storcli64 /c0/ex/sx show rebuild     21. 开启Stop on error功能(RAID卡状态为安全模式,系统下,磁盘无法生成盘符) 指令:./storcli64 /c0 set bios mode=soe   22. 设置RAID组缓存模式为读写 指令:./storcli64 /c0/v0 set wrcache=wt   23. 设置RAID卡启动项 指令:./storcli64 /c0/v0 set bootdrive=on(将VD为0的RAID组设置为Boot) ./storcli64 /c0/e252/s7 set bootdrive=on(将slot7盘设置为Boot)   24. RAID组扩容 指令:./storcli64 /c0/v0 expand size=200GB(容量扩容,将VD0的容量扩大至“200GB”) 指令:./storcli64 /c0/v0 start migrate type=r0 option=add drives=252:2(磁盘扩容,将slot2扩容到VD为0的RAID组)   25. RAID组迁移 指令:./storcli64 /c0/v0 start migrate type=r1 option=add drives=252:3(单盘RAID 0加盘迁移至RAID 1)   26.  查看超级电容信息 指令:./storcli64 /c0/cv show all   27. 升级磁盘固件 指令:./storcli64 /c0/e64/s5 download src=XXX.BIN(src=后接固件)   28. 导入或者清除RAID卡外部配置 ./storcli64 /c0/fall import preview(查看RAID卡的外部配置) ./storcli64 /c0/fall import(导入外部配置) ./storcli64 /c0/fall delete(删除外部配置)   29.  查看轰鸣器状态及关闭或开启告警 ./storcli64 /c0 show alarm(查看轰鸣器状态) ./storcli64 /c0 set alarm=on(开启轰鸣声) ./storcli64 /c0 set alarm=off(关闭轰鸣声) ./storcli64 /c0 set alarm=silence(静音,临时关闭轰鸣声,重启恢复)   30. 查询和清除PreservedCache数据 查询和清除PreservedCache数据(RAID卡有offline配置需要用到) ./storcli64 /c0 show preservedcache ./storcli64 /c0/vx  delete preservedcache force             常用操作:  一、插入有外部RAID配置盘改直通 步骤一:进RAID卡工具路径(/sf/bin/raidtools/bin),查看磁盘状态,指令:./storcli64 /c0/eall/sall show  (E为Enclosure Device ID,S为Slot Number,c0为第一张RAID卡,c1为第二张RAID卡,只有一张卡则为c0,可lspci |grep SAS或者lspci |grep raid查看几张卡)   步骤二:如磁盘状态为UB,改成UG,指令:./storcli64 /c0/ex/sx set good,如上图e为16,s为10,指令为:./storcli64 /c0/e16/s10 set good,然后扫描和清除外部配置,指令: ./storcli64 /c0/fall import preview(查看RAID卡的外部配置) ./storcli64 /c0/fall delete(删除外部配置)   步骤三:将磁盘状态改为直通。指令:./storcli64 /c0/ex/sx set jbod,上图e为16,s为10,指令:./storcli64 /c0/e16/s10 set jbod,然后用lsblk -d |grep sd查看磁盘盘符可以正常识别。   二、组RAID盘状态为UB重建 步骤一:进RAID卡工具路径(/sf/bin/raidtools/bin),查看磁盘状态,指令:./storcli64 /c0/eall/sall show  (E为Enclosure Device ID,S为Slot Number,c0为第一张RAID卡,c1为第二张RAID卡,只有一张卡则为c0,可lspci |grep SAS或者lspci |grep raid查看几张卡)   步骤二:将UB状态盘改为UG,指令:./storcli64 /c0/ex/sx set good   步骤三:扫描外部配置和重建,指令: ./storcli64 /c0/fall import preview(查看RAID卡的外部配置) ./storcli64 /c0/fall import(导入外部配置)   步骤四:查看重建进度,指令: ./storcli64 /c0/ex/sx show rebuild   步骤五:如有RAID卡电容滴滴滴告警,需要临时关闭,指令: ./storcli64 /c0 show alarm(查看轰鸣器状态) ./storcli64 /c0 set alarm=silence(静音,临时关闭轰鸣声,重启恢复)   三、组RAID 步骤一:将磁盘状态改为UG,如已经是UG,执行下一步骤,指令: ./storcli64 /c0/ex/sx set good  (E为Enclosure Device ID,S为Slot Number,c0为第一张RAID卡,c1为第二张RAID卡,只有一张卡则为c0,可lspci |grep SAS或者lspci |grep raid查看几张卡)   步骤二:组RAID: RAID0/1/5:./storcli64 /c0 add vd r1 size=all drives=E:S,E:S(vd后面接需要做的RAID0或者1或者5,先获取磁盘的EID和Slot,./storcli64 /c0/eall/sall show,C0为第一张RAID卡,C1为第二张RAID卡) RAID10/50: ./storcli64 /c0 add vd r10 size=all drives=E:S-S  pdperarray=2  (pdperarray为每组span的数量,如6个磁盘组RAID50,分2组span,那数量为3)                      
【硬件排查】巡检报设备未开启VMD不支持U.2盘热插拔处理
巡检报设备未开启VMD,需要进BIOS开启,设备SN为9*,F6*设备需要开启VMD才支持热插拔,FB*设备无需开启VMD,开启VMD后热插拔或者重启反而识别不到U.2盘。       步骤一:先确认设备SN,如果是FB*开头设备,无需开启VMD,特别是EDS服务器会误报,找软件消除告警,如果是9*,F6*开头设备,执行步骤二。   步骤二:后台用lspci |grep -i sas读取lspci信息,设备开启了VMD,前面ID会有4个0,没开启VMD则执行步骤三。   步骤三:重启设备,进BIOS界面打开VMD,菜单界面按delete进去,有BIOS密码,默认为:S#AN$6fo81r,选择Advanced-->Socket Configuration-->IIO Configuration-->Intel(R) vmd Techlonogy,进入Intel(R) vmd Config,选择Auto,按F10保存配置,重启后可尝试插拔NVME盘确认功能情况。   SN为9C,F6C开头服务器开启VMD步骤如下: 选择Processor-->Intel VMD technology-->Socket1-->Intel VMD PStack2-->开启Hot Plug                
【硬件排查】SN为FBQ服务器EDS型号更换前置背板后,后置系统盘不识别问题排查
更换前置背板和线缆后,前置硬盘可以正常识别,后置系统盘识别不到       步骤一:重启设备,按delete键进BIOS里面的RAID卡管理界面,找到Drive Management,看能否识别到系统盘,识别不到执行步骤二。   步骤二:关机断电插拔后置系统盘所有线缆和接前置背板SATA线,然后上电,按delete键进BIOS里面的RAID卡管理界面,找到Drive Management,看能否识别到系统盘,识别不到执行步骤三。   步骤三:将后置系统盘SATA线直连RAID卡,然后上电,按delete键进BIOS里面的RAID卡管理界面,找到Drive Management,看能否识别到系统盘,识别不到则返修后置背板加线缆,能识别则执行步骤四。   步骤四:将前置旧背板芯片保护套往上打开,取出芯片,按照原来安装顺序,换到新背板上,然后上电,按delete键进BIOS里面的RAID卡管理界面,找到Drive Management,看能否识别到系统盘。仍然识别不到联系硬件技术支持。                
SN为FBQ开头的服务器BIOS、BMC、CPLD升级方法
注意事项: 1、PC端需配置同BMC IP一个网络段IP。 2、先升级BMC,再升级CPLD和BIOS,升级BMC可以在设备工作状态下升级,重启BMC生效。 3、升级BIOS和CPLD必须在关机(待机)状态下升级,BMC,BIOS,CPLD升级过程中一定不能断电,否则BMC,BIOS,CPLD芯片会刷挂,设备无法启动,CPLD及BIOS升级成功后,需要硬重启(断电)生效。   如果只升级BMC,不会影响客户业务;如果BIOS/CPLD需要升级,请先迁移客户业务后再操作。         一、BMC升级 1、设备出厂默认IPMI地址为192.168.10.10,若修改过IPMI IP,可在后台输入以下指令进行查询,也可重启设备,查看设备启动界面打印的BMC地址。 ipmitool lan print 1 2、电脑用网线连接IPMI口,打开浏览器根据专用口 IP 地址 https://192.168.10.10 (https://机器实际IP地址)登录WEB网页,登陆用户名为sangfor,密码为S#AN$6fo81r(如密码已修改,使用修改后的密码)   3、如下图所示,选择维护——》保存配置——》选取全部——》保存(建议直接选取全部,如果有不想保留的配置,也可以不勾选)   4、如下图所示,选择维护——》固件更新   5、选择文件——》选择对应的BMC固件包——》开始固件更新。   6、更新镜像选择两个镜像,核对下面列出来的保留配置项目是否与步骤3勾选的一致。List of Components选择更新所有。   7、点击继续烧录——》确定,等待5分钟左右弹出下图弹窗后按弹窗提示要求手动刷新BMC页面,重新登入web查看BMC固件是否为更新后的版本。   二、CPLD升级(升级前先迁移业务,升级过程中一定不能断电) 1、进入BMC页面选择维护——》固件更新 2、选择文件——》选择CPLD升级包——》开始固件更新   3、按需选择要更新的CPLD固件(不同的部件CPLD对应不同的升级文件)。点击继续烧录——》确定。 如果无法确认自己要升级的是哪个部件,请联系400硬件技术支持确认。   4、更新完成后,进入远程控制——》电源控制——》电源循环——》执行动作——》确定。 如果还需要更新BIOS,可以更新完BIOS后再执行电源循环动作。   5、等待10分钟或通过远程控制台观察设备重启完成后,刷新BMC页面查看CPLD版本是否升级成功。   三、BIOS升级(升级前先迁移业务,升级过程中一定不能断电) 1、进入BMC页面选择维护——》固件更新——》选择文件——》上传BIOS升级包——》开始固件更新   2、勾选保存BIOS所有配置,点击继续烧录——》确定。   3、等待5分钟左右升级完成,弹窗点击确定会跳转到电源控制界面,选择电源循环——》执行动作——》确定。   4、等待10分钟或通过远程控制台观察设备重启完成后,刷新BMC页面,查看BIOS版本是否升级成功。     升级过程中遇到任何问题请拨打400-630-6430联系硬件技术支持。          
【硬件排查】SN为F6H,FBH备份一体机BMC修改磁盘状态操作指导
备份一体机组了RAID5,其中一个盘亮黄灯,系统下无法改状态重建       步骤一:登录IPMI,存储管理,查看异常盘状态,如果不识别,或者状态为faild,拔掉该盘,等30S再插回去,看磁盘状态,变成UB状态,执行步骤二。   步骤二:选择异常盘,设置-->固件状态改为UG-->确认,然后再进去看状态变成forgein,执行步骤三。   步骤三:选择RAID卡,编辑,设置里面导入Forgein配置,点确认,然后等1分钟再看磁盘状态,变为rebuild则磁盘在重建,一般数据盘重建要5个小时左右,SSD重建半个小时左右,重建过程中电容会滴滴滴告警,当磁盘变成online后告警声会消除。            
SN为9S、9N、F*S、F*N开头的设备CPLD升级方法
SN为9S、9N、F*S、F*N开头的设备CPLD升级方法 注意事项: 1、PC端需配置同BMC IP一个网络段IP。 2、升级CPLD需要在关机状态下升级,请进入单主机维护模式后再操作。   根据设备上的标识或后台输入dmidecode -t 1查看设备SN   (如知道IPMI口IP地址,可直接进行第4步操作) 1、如图所示 开机按DEL键进入 BIOS Setup 页面。   2、选择”Server Mgmt”->BMC network configuration   3、查看BMC 专用口IP 地址。   4、电脑用网线连接IPMI口,打开浏览器根据专用口 IP 地址 https://192.168.10.10 (https://机器实际IP地址)登录WEB网页,登陆用户名 admin 登陆密码 admin (新用户名为sangfor,密码为S#AN$6fo81r,如密码已修改,使用修改后的密码)。   5、关闭服务器,选择—>远程控制—>电源与能耗—>电源控制—>强制关机。     若设备未在关机状态下升级,BMC会提示设备未关机,无法升级CPLD。       6、如图所示,选择系统维护—>固件更新—>CPLD固件更新   7、选择CPLD升级文件,点击开始固件更新—>确定   8、等待3左右分钟后,页面提示升级成功。   9、确认CPLD升级完成结束后,将整个服务器手动断电使 CPLD升级生效,拔掉电源线1分钟以上再上电。   10、重新上电后登陆BMC Web界面最后再检查固件版本信息是否准确。              
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
到第
确定
您当前处于未登录状态,资料搜索或查找可能会不全面,请登录后以查找更全面的内容注册登录