DELL-T5820故障处理
昨天给一台DELL-T5820工作站做配置升级,计划将原来单根32G的内存容量扩展到8根16G。原本应该是很简单的事情,却出现了一点小状况,在将全部内存条更换完毕后,设备一直出于无法开机的状态。经过一番盘查,以下常用方法都轮流试了一遍:
- 清灰,清理内存条金手指、内存卡槽(甚至将内存条、卡槽挨个测试...)
- 放电,断电并拔下主板电池,长按开机键释放静电
- 拔掉系统硬盘、拔掉独显
- 重新安装CPU
- 重置BIOS,还原设置
花了将近2个小时,依旧没有解决问题,中间还咨询了DELL客服,结果该类型设备的工程师不在线。。。于是只好向百度、谷歌求助,在一篇文章中看到说根据设备指示灯闪烁情况去判断故障。仔细观察了下,发现规律是:黄灯闪烁4下,白等闪烁7下,但知道了这个数值,要去哪里才能找寻其表达的意义呢,搜索了半天都没有找到结果。最后抱着碰运气的心态去DELL官网找寻了下,真的就找到了T5820的产品手册,打开一看,该情况表示设备侧边盖缺失。瞬间无语了,因为平常组装或修理设备,会习惯性的等设备正常点亮并进入系统了,才会把侧盖盖上,而且从来没发现对侧盖有任何要求的。再去搜索一圈后发现,原来工作站与服务器性质相似,对环境的稳定性都要求很高,任何一块小的零配件都有可能导致设备故障。
到此,关上侧盖开机,看着设备可以正常开机了,本以为就结束了,结果蓝屏报错:INACCESSIBLE_BOOT_DEVICE。查询了一下,基本上是设备内某个硬件驱动的问题造成的,有的说要改BIOS内硬盘的格式,还有的说要先进入安全模式关闭独显的驱动。但是我感觉都不太靠谱,毕竟只是扩容了下内存,其他都没动,影响到这些方面的可能性不大。
再次重启后,系统自动进入epsa pre-boot system assessment自检模式,等待了几分钟后,显示全部检测结果正常,点击确定完成后,系统重启并能正常运行了。
但是出于好奇,又去搜索了下相关内容。发现可能是由于ECC内存条自动纠错带来的报错。因为之前使用的内存条是2Rx4 ECC类型的,而扩容加上去的是1Rx4 ECC类型的,简单理解是,前者使用的颗粒更多,后者使用的颗粒较少,2种内存虽然相兼容且可以代替使用,但是特殊情况下,使用场景还是有区别的。在对内存条数量需求较少时,1R与2R基本使用无太大差别,2R内存甚至凭借颗粒数的优势,性能更高。但对内存条数量需求较多时,更加建议使用1R内存,因为相同存储容量下,更少的内存颗粒数量使得出现故障的概率也更小,所以1R内存条通常更多的使用在服务器当中。
经过一番折腾,虽然很头疼,但是刨根问底让自己学到知识还是很开心滴~
当前文章地址:https://www.day0.club/775/dell-t5820%e6%95%85%e9%9a%9c%e5%a4%84%e7%90%86/
来源:DAY·0驾校
文章版权归作者所有,未经允许请勿转载。
共有 0 条评论