DELL R740主板故障数据完整恢复案例

 

    Dell服务器型号多,服务好,性价比高,所以销量一直不错,但戴尔服务器的标准保修仅有三年时间,三年后才是服务器故障高发的开始。云天工程师在13年的维修过程中将dell服务器的常见故障总结为以下几种 (提示:每一种常见问题我们都有相应的成功案例为缩短篇幅请点击连接进入相应故障详情页查看)

1.Dell 服务器不开机、黑屏、蓝屏、卡logo

 

2.Dell服务器主板损坏进水、雷击、过压、主板老化损坏

 

3.Dell服务器阵列信息丢失

 

4.Dell服务器硬盘missing 或者foreign恢复 硬盘force online失败

 

5.Dell 服务器电源损坏

 

6.Dell服务器操作系统损坏

 

 

-------------------------------本案例为DELL服务器硬盘损坏的恢复成功案例-------------------------------

    客户的运维工程师接业务部分诉求说ERP无法登录,运维工程师登录VCENTER后发现其中一台核心虚拟化宿主机服务器掉线。到机房查看后发现服务器橘色故障灯报警,如下图:

 

 

橘黄故障灯报警

 

 

    详细检查后发现如下两个报错

 

1、E1000 Failsafe voltage error. Contact support.

 

2、E122A CPU # VTT Regulator failure.Reseat CPU.

 

    运维工程师也是硬件高手一枚,并且动手能力很强。做了如下检测:

 

方法一: 电源复位 关机,拔电源线外设,长按开关按钮30秒后,再接上电源线,开机,主机风扇狂转,噪音巨大,然后归于平静报警依旧,服务器依旧无法开机。

 

方法二:仅接一颗CPU因为报错日志种有CPU电压报错,所以运维工程师对CPU进行单一排查,发现问题依旧,服务器仍旧无法开机

 

方法三:最小化内存把内存全部拔掉,只接最小的内存。故障依旧,服务器无法开机。

 

(因为该公司的运维工程师本身是学硬件出身,也对服务器进行过多年的管理所以他这些操作都很熟练,如果是新手或者对服务器不太熟悉,不建议自行进行以上操作。因为不当的操作可能会导致问题变得更严重)

 

在尝试完所有网络上能搜到的方法后,故障依旧。经人介绍后联系我们工程师上门进行检测。

 

因为戴尔服务器Exxxx的故障代码我们处理过很多案例,基本上在电话沟通中已经基本确定问题就是主板问题。因为R740主板结构复杂,修复也需要时间。客户的业务无法等待修复的时间。所以我们直接安排工程师携带同型号同配置备机至客户现场。

 

处理步骤:

1:对服务器主板,硬盘,电源,内存,CPU等做了全面检测检测报告确定问题根源在主板

 

2:安排芯片级工程师对主板进行维修。同时安排另一个数据恢复工程师对客户的阵列及数据进行镜像并对阵列做完整的分析。

 

3:导入镜像及阵列参数至我司备机后发现无法正常启动。经过系统工程师的调整后正常进入ESXI登录界面。如下图

 

 

ESXI登录界面

 

 

当天客户的业务就恢复正常了,我们芯片工程师有足够的时间对客户的主板进行维修,并且也有足够的时间对修复后的主板进行压力测试,确保修复后的主板绝对稳定可靠。最终客户的业务并未受到影响,机器也完美修复好,客户非常满意。

 

工程师温馨提示:

 

1:服务器要经常巡检,如果有亮黄灯要及时诊断。我公司为客户提供专业的定期检测服务。如有需要可电话联系我们咨询相关业务

 

2:服务器如果出现disk error后请不要持续通电尝试,因为反复通电会有很大概率导致硬盘盘片划伤,硬盘盘片划伤后数据恢复难度会极大增加,恢复费用也会极大增加。

 

3:服务器出现故障后请找专业人士进行检测修复。我司提供7*24小时上门检测服务,对于客户的紧急业务系统,可提供备机服务。

 

4:如果您的业务非常紧急,我们提供专业的备机服务,可在最短时间内恢复您的业务