欢迎来到天天文库
浏览记录
ID:81262816
大小:96.00 KB
页数:4页
时间:2022-10-11
《双盘失效解决方案》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
本节只介绍双盘失效问题处理案例。三盘及以上盘失效请联系研发处理。· 本操作方法只适应于RAID失效且该RAID中所有的LUN全部失效的情况。1. 查看RAID类型,确认RAID状态、LUN状态以及失效硬盘的槽位号和时间点。登录OSM管理界面,找到告警ID为 900 的告警:硬盘失效,记录硬盘失效的时间点及先后顺序,如下图:可知(0,8)槽位硬盘先失效,(0,4)槽位硬盘后失效(此项一定要记正确,顺序记反,会导致数据丢失)。图2 图3 通过后台登录至Cli模式,输入 showrg 获取RAID的ID、类型和状态,输入showlun 获取LUN的ID和状态以及LUN归属的RAID,如下图:其中RAID1的类型为RAID5,状态为fault(失效),其所属的LUN状态全部为失效。图4 2. 确认硬盘的物理状态和逻辑状态。通过后台登录至CLI模式,输入showdisk –l 和 showdisk –p 分别获取硬盘的逻辑状态和物理状态,如下图:(0,4)(0,8)逻辑状态为fault,物理状态为nomal。图5
1图6 3. 修复RAID为降级状态。a。 修复最后失效的硬盘为normal状态。进入mml命令模式下面,通过(revivedisk 框号 槽位号)命令操作恢复后失效的硬盘,如下图后失效的为(0,4)槽位硬盘.注意:如果(0,4)槽位的硬盘物理状态为fault,需要先拔插一下该槽位的硬盘使其物理状态恢复为normal(查看方法同showdisk –p )。b。 修复所有的LUN为normal状态,RAID为降级状态。c. 修复完硬盘之后,通过(reviveraidlunRAID—ID)命令继续修复所有的LUN为normal,然后退出到cli模式查看RAID的状态会变为降级状态(Degrade)。图7 图8 d。 确认修复完成。执行完步骤3。c之后,exit 到cli模式,重新查看最先失效的硬盘的状态是否为重构状态(Reconstructionisinprocess),如果为重构状态则修复完成,如下图(0,8)槽位硬盘的状态为重构状态。
2图9 如果硬盘的状态不为重构状态,为Fault状态,如下图:图10 当出现Fault状态时:· 通过步骤3.b确认该槽位的硬盘的物理状态也为 fault时,需要对该槽位的硬盘进行拔插操作(拔和插间隔15s以上),拔插后硬盘会进入重构状态,若仍未进入,联系相关技术支持工程师。· 通过步骤3.b确认该槽位的硬盘的物理状态为 normal时,可以拔插操作恢复;若现场无人,可以通过mml下面的模拟拔插盘进行恢复,如下图:· spuui>devsetdiskout08spuui>devsetdiskin 0 8图11
34。 操作完成之后,再次确认该槽位的硬盘是否进入重构状态,若仍未进入重构状态,及时联系研发人员。若已经进入重构状态,可以先恢复业务.a。 确认文件系统是否正常.文件系统修复时需要umount文件系统,暂停业务。若文件系统有损坏,请参照相应的文件系统修复指导书进行操作。b. 恢复业务。5。 确认修复完成之后,恢复主机业务。建议与总结· 在进行修复之前将存储日志进行收集发至研发进行分析。· 有疑问时,将修复步骤描述发至研发确认。· 超过2块盘的RAID失效请联系研发处理.
此文档下载收益归作者所有
举报原因
联系方式
详细说明
内容无法转码请点击此处