吾爱破解 - 52pojie.cn

 找回密码
 注册[Register]

QQ登录

只需一步,快速开始

查看: 715|回复: 11
收起左侧

[经验求助] 关于RAID的问题

[复制链接]
lbl283743758 发表于 2024-3-25 14:27
25吾爱币
我们有一台设备的服务器(戴尔),做了RAID1。服务器异常断电重启后,进入操作系统后,RAID会自动导数据。
前两次的异常断电重启后,都是这样的过程。这是正常的。

第三次异常断电重启,无法进入系统,黑屏界面提示“No Boot Device Found。Press any key to reboot the machine”,然而此时按什么键都没有任何反应一直卡在这儿
看提示感觉是硬盘上启动项丢了,由于对raid不了解,只知道是两个硬盘互为备份,就想着拔掉一个硬盘,留一个硬盘,肯定有一个是好的吧。于是,让当班人员拆机箱把拔掉一个硬盘线。然而无论留哪个硬盘线,启动后还是一样卡在那。最后都插回去了。
我当天上午过去试了,还是一样的情况。硬盘上有Acronis备份文件,但没有拷贝出来,所以我赶紧运行PE进入到服务器硬先把这个做好的备份拷贝了出来。
从PE中看,至少非系统盘内的数据是在的,磁盘管理查看硬盘情况,只能看到一个硬盘信息,我不知道RAID1正常或不正常的情况下,能看到几个硬盘信息。没什么可弄的,就关机了。服务器电源线一直插着。

然后把这台设备的旧电脑弄好,给设备先用着

为了排查这台服务器异常断电的问题,又去把这台服务器的ups接到显示器和服务器主机的电源线,进行了对调。之后没动这台服务器,一直处于插电未开机的情况。

大概上午11点40的时候,我又去启动这台服务器试了,居然发现能开机了,过程图无法上传,我就大概说一下:
1、刚启动服务器,显示RAID信息那个界面,Size Status显示为黄色字体的 多少G Rebuild,Bootable为也是。此界面物理设备索引为1的那个硬盘,也是黄色字体;
2、接下来就开始 “扫描并修复C盘 以及进度”,进度到百分之百又自动重启了一次,RAID信息和1中一样
3、之后能正常进入系统,设备用的软件也都能正常用了。

请问这是什么情况?我不知道为什么开始提示No Boot Device Found,后边又能启动起来?如果再次出现这样的问题,我怎么操作能快速的到上1、2、3那样把服务器启动起来?请各位大神指教!本人对这方面的东西不了解


最佳答案

查看完整内容

首先恭喜你,你没瞎操作到离谱的境地。 其次Raid1 即使在阵列损坏的情况下数据也是不会丢失的。前提是你的2块磁盘都是OK的 最后你之所以恢复了。是你触发了阵列的恢复,因为你没有单硬盘正常运行系统,理论上讲你的2块磁盘的数据是一致的。 为什么触发了“Size Status显示为黄色字体的 多少G Rebuild,Bootable为也是。此界面物理设备索引为1的那个硬盘,也是黄色字体;“是因为你的这个操作”当班人员拆机箱把拔掉一个硬盘线。 ...

发帖前要善用论坛搜索功能,那里可能会有你要找的答案或者已经有人发布过相同内容了,请勿重复发帖。

yeyudragon 发表于 2024-3-25 14:27
首先恭喜你,你没瞎操作到离谱的境地。
其次Raid1 即使在阵列损坏的情况下数据也是不会丢失的。前提是你的2块磁盘都是OK的
最后你之所以恢复了。是你触发了阵列的恢复,因为你没有单硬盘正常运行系统,理论上讲你的2块磁盘的数据是一致的。
为什么触发了“Size Status显示为黄色字体的 多少G Rebuild,Bootable为也是。此界面物理设备索引为1的那个硬盘,也是黄色字体;“是因为你的这个操作”当班人员拆机箱把拔掉一个硬盘线。然而无论留哪个硬盘线,启动后还是一样卡在那。最后都插回去了“
这里当你拔掉任意一根硬盘线并对服务器通电就触发了阵列卡的检测 由于你是2个磁盘线都拔掉了。又通电插回去了。因此阵列卡下面2个磁盘其实都是离线状态。由于你反复操作。庆幸阵列卡只拉起并只认一块磁盘为正常盘所以你后面才能正常触发阵列重做。
”从PE中看,至少非系统盘内的数据是在的,磁盘管理查看硬盘情况,只能看到一个硬盘信息,我不知道RAID1正常或不正常的情况下,能看到几个硬盘信息“
这个是阵列后如果你没有新建 vd 通常也不会创建多个VD 所以PE能识别阵列卡的情况下是1个磁盘,注意这里的一个磁盘是阵列后的。而不是真的磁盘。比如你是希捷的磁盘 PE下看到的应该是STxxxxx磁盘 实际上你看到的应该是 megasasxxxxx。
你应该庆幸你运气不错 而不是想怎么样才能快速的到上1、2、3。
简单操作参考
你每次启动服务器自检的时候 会有一个提示CTRL+R/H等等,进入阵列卡配置。按下后会进入阵列卡的专属配置页面。里面有磁盘信息,阵列信息的多种信息。并且还有基本的阵列卡型号。下次遇到此次问题时,切记不要乱拔硬盘线,而是进入阵列配置界面截图或拍照后求助。
最后为你的备份行为点半个赞,虽然你备份了,但是并没有备份出来而是放在本地这样之比无备份稍微强了那么一点点。
yeyudragon 发表于 2024-3-25 15:30
”其次Raid1 即使在阵列损坏的情况下数据也是不会丢失的。前提是你的2块磁盘都是OK的“ 这里有歧义,说是2块都OK是针对你下面的离谱操作的。实际是只要有1块磁盘OK数据都不丢失
yeyudragon 发表于 2024-3-25 15:44
https://support.huawei.com/enterprise/zh/doc/EDOC1000004345/b1165913  这个仅做参考,里面的阵列卡和你当前使用的界面不一致,不过方法和步骤大同小异。你可以读一读
syd1990 发表于 2024-3-25 15:45
RAID 1通过镜像技术将数据同时写入两个硬盘,这样即使一个硬盘失败,另一个仍然包含所有数据,从而保证数据的冗余和安全。通常情况下,如果一个硬盘出现故障,系统应该能够继续使用另一个硬盘启动和运行。

遇到的问题
No Boot Device Found: 这个问题通常表示BIOS/UEFI无法在任何配置的启动设备上找到有效的启动信息。在RAID配置中,这可能意味着RAID控制器遇到问题,或者两个硬盘上的RAID元数据不同步,导致无法正常读取启动信息。

硬盘拔出尝试: 拔出一个硬盘的尝试是一个常见的故障排除步骤,旨在测试RAID 1中的镜像硬盘是否能单独工作。然而,如果RAID配置或元数据受损,这个方法可能不会奏效。

系统最终能够启动: 在你的情况下,系统在几次尝试后最终能够启动,并自动开始重建RAID阵列,这表明系统可能自动修复了RAID配置或元数据的一些问题,并成功从剩余的健康硬盘启动。

为什么会自动修复?
RAID控制器在检测到不一致或问题时,可能会尝试自动修复问题。这可能包括重新同步硬盘或重建RAID阵列的元数据。当你再次尝试启动服务器时,可能正好控制器完成了自我修复的过程,使得系统能够正常启动。

如果再次发生,该怎么办?
检查RAID控制器的状态: 通常在启动时可以通过特定的快捷键进入RAID控制器的配置界面,检查硬盘状态和RAID阵列的健康状况。

使用RAID控制器的恢复选项: 如果有可用的选项,比如重建RAID或导入外部配置,可以尝试使用这些选项恢复。

检查BIOS/UEFI设置: 确保启动顺序正确,RAID控制器(如果是独立的硬件)被设置为启动设备。

备份重要数据: 任何RAID故障排除步骤之前,确保已经备份了重要数据,以防数据丢失。

联系专业支持: 如果问题复杂或无法自行解决,考虑联系服务器制造商的技术支持或专业的IT服务提供商。

准备紧急启动介质: 拥有一个可启动的紧急修复盘或USB驱动器,可以帮助你在系统无法启动时进行故障排除或数据恢复。
 楼主| lbl283743758 发表于 2024-3-25 15:49
yeyudragon 发表于 2024-3-25 15:30
”其次Raid1 即使在阵列损坏的情况下数据也是不会丢失的。前提是你的2块磁盘都是OK的“ 这里有歧义,说是2 ...

请问:如果只要有一块磁盘ok,数据不会丢失。
那异常断电重启后,卡在 No Boot Device Found。。。按什么都没有反应,这是啥情况?按提示是找不到启动设备,理解为启动项丢失了,对吗?这种情况的处理方式,就是按你所说,进入raid配置拍照求助是吗?

keyellen 发表于 2024-3-25 15:49
重要数据一定要,RAID 1,另外还得再至少备份1份
yeyudragon 发表于 2024-3-25 15:53
lbl283743758 发表于 2024-3-25 15:49
请问:如果只要有一块磁盘ok,数据不会丢失。
那异常断电重启后,卡在 No Boot Device Found。。。按什 ...

只要是阵列后的第一时间是检查阵列卡中阵列状态,如果阵列状态是OK的,你就当普通的系统故障处理,如果阵列不OK,则需要检查时哪里不OK 这个需要具体的环境来判断
yeyudragon 发表于 2024-3-25 16:00
lbl283743758 发表于 2024-3-25 15:49
请问:如果只要有一块磁盘ok,数据不会丢失。
那异常断电重启后,卡在 No Boot Device Found。。。按什 ...

我好像只回答了一部分
1、如果只要有一块磁盘ok,数据不会丢失。--是的,你甚至可以通过一些手段用这块磁盘单独启动系统,不建议。
2、那异常断电重启后,卡在 No Boot Device Found。。。按什么都没有反应,这是啥情况?按提示是找不到启动设备,理解为启动项丢失了,对吗?--可以这么理解,同时某些阵列卡有个选项叫 set boot drive,可以制定启动设备,不过这并不适合你的环境,根据描述你的应该是阵列故障,导致阵列离线。
3、这种情况的处理方式,就是按你所说,进入raid配置拍照求助是吗?-是的,看看是什么原因,然后做后续操作。以及以后的故障规避
 楼主| lbl283743758 发表于 2024-3-25 16:29
yeyudragon 发表于 2024-3-25 16:00
我好像只回答了一部分
1、如果只要有一块磁盘ok,数据不会丢失。--是的,你甚至可以通过一些手段用这块 ...

你好,我还有一个比较好奇的问题请教:就是我上边描述123可以启动了,那是在rebuild完成后才能启动的,是吗?这个rebuild是在什么状态下进行的?那台服务器当时大多数是在接了电源但关机的状态。在接通电源、没开机的时候,也是能rebuild的吗?
您需要登录后才可以回帖 登录 | 注册[Register]

本版积分规则

返回列表

RSS订阅|小黑屋|处罚记录|联系我们|吾爱破解 - LCG - LSG ( 京ICP备16042023号 | 京公网安备 11010502030087号 )

GMT+8, 2024-12-15 23:54

Powered by Discuz!

Copyright © 2001-2020, Tencent Cloud.

快速回复 返回顶部 返回列表