资源描述:
《ibmaix日常维护及故障处理汇总》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、第一类、机房环境及物理检查一、机房内环境要求1. 温度与湿度:最佳工作温度:20-25摄氏度极限工作温度:10-40摄氏度 湿度:8-80%(在23摄氏度条件下)如果不是工作在最佳温度,请注意改善机房环境2. 同时机房要保证清洁.机房应保持清洁,若空气灰尘过多,很容易造成资源读写错误及磁盘机中磁盘或读写磁头毁损。二、电源要求电 压: 要求电压稳定,尖峰电压会损坏设备电压范围: 220V+/-10%,即200-240V,50-60Hz电源功率: 视机器类型和系统配置而定电源线 : 标准
2、的零,地,火三相电,其中零,地电压不得超过3.0V.电源接驳: 用符合电流要求的空气开关或其他设备和主机电源线接驳,保证计算机系统的可靠工作应使用稳压电源和UPS,并建议配备发电机组;对于冗于电源的接入,建议采用两路单独输入.三、硬件检查]检查服务器、磁阵的安装、电源线、7133和主机接线符合要求。服务器状态检查:1. 当服务器处于启动和正常工作状态时,其前面板上的液晶显示屏上应无信息显示。2. 当液晶显示器上出现带数字和字母的信息时,说明有硬件告警。可以通过查询相关机型的ServiceGuide查到相
3、应告警原因,情况严重的,则要立即通知IBM技术专家进行问题排查。7133状态检查:磁阵前面板上有7133机柜的状态灯(与电源灯并排)和各硬盘的状态灯(一排小灯,与各硬盘位置一一对应)。1.当机柜的状态灯出现橙黄色时,说明有硬件告警,此时要检查磁柜的电源、接线、硬盘等。如果有硬件故障则立即进行更换和更正,如果查不出具体问题,则需要联系相关专家进一步诊断。2.当硬盘工作正常时,与各硬盘对应的硬盘灯会呈绿色,如无读写,则绿灯一直亮,如该硬盘有读写操作,则绿灯会不规则闪烁,当硬盘损坏时或SSA环路出现问题时,则硬盘状
4、态灯将熄灭,或者呈闪烁状态:以1~3秒的频率有规律地、不停地闪烁第二类、系统日常维护流程2.1系统启动系统启动正常顺序如下:首先对外设(磁盘阵列、磁带库等)加电。待所有外设加电自检完成后,主机加电正常起机。主机加电后,系统进行自检,在液晶显示屏显示”ok”后,才能按白色POWER键起机.启动主机HACMP,启动后可用命令tail-f/tmp/hacmp.out来检查启动情况,在HACMP未完全启动前不要进行下一步。检查服务器的网络地址,路由表(可用netstat-i,netstat-rn等),检查文件系统,逻
5、辑卷(可用mount,lsvg-o等)。检查各项应用是否工作正常。2.2系统关闭停止HACMP (smittyclstop)。查看HACMP的状态,检查服务器的网络地址,路由表(可用netstat-i,netstat-rn等),检查文件系统,逻辑卷(可用mount,lsvg-o等)。在HACMP未完全停止前不要进行下一步。关闭主机(shutdown–F)。重启系统可以使用:shutdown-Fr如有必要的话,按磁盘阵列前方的白色按钮关闭磁盘阵列。2.3查看系统的错误记录在系统运行时,一些系统错误会记录在er
6、rlog中,其中有些错误还会在终端上显示。检查错误日志可用以下命令:#errpt
7、more查看系统所有的记录IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTIONE85C5C4C 0426104399 P S CFGLFT SOFTWAREPROGRAMERROR2BFA76F6 0426104099 T S SYSPROC SYSTEMSHUTDOWNBYUSER9D4CF6E7 0426104399 T O err
8、demon ERRORLOGGINGTURNEDON1E2AC07E 0426103999 T O errdemon ERRORLOGGINGTURNEDOFF1E5EER4T 0423132999 T O clstrmgr OPERATORNOTIFICATION 其中IDENTIFIER为错误编号,当需要检查详细信息时常会用到。TIMESTAMP为时间标签,它记录的是出错时间,其格式:月月日日时时分分年年T为Type,它记录的是错误类型P:为永久错误,需引起注意
9、T:为临时错误。C为Class, 它记录的是错误种类,如H:HardwareS:SoftwareO:ErrlogercommandmessagesU:undeterminedRESOURCE_NAME 为错误来源DESCRIPTION为错误描述#errpt-aj查看系统详细记录内容其中IDENTIFIER为错误编号,如#errpt-aj0426104399#errpt-d