ibmp服务器故障检测

ibmp服务器故障检测

ID:32322802

大小:420.50 KB

页数:12页

时间:2019-02-03

ibmp服务器故障检测_第1页
ibmp服务器故障检测_第2页
ibmp服务器故障检测_第3页
ibmp服务器故障检测_第4页
ibmp服务器故障检测_第5页
资源描述:

《ibmp服务器故障检测》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、p系列、系统p预防性维护说明p系列、系统p预防性维护说明国际商业机器(中国)有限公司文档编号:当前版本号:3.1最初发布日期2001年12月13日最新修订日期:2011年9月2日IBM中国维护与技术服务12p系列、系统p预防性维护说明IBM中国维护与技术服务12p系列、系统p预防性维护说明一、硬件维护部分:1.检查机房环境:(请参照IBM机房条件及各机型的具体要求)温度:室内温度建议保持在22±2℃湿度:相对湿度应保持在50±5%电源:根据不同机型使用的电源有:200~240V交流单相;380~415V交流三相;-48V±5%直流,实测电压不

2、应超出允许的范围。零线与火线不能反接,通常是面对插座的左边为零线,右边为火线。机器必须有良好的接地保护,地线的接地电阻要求小于1欧姆。因接地电阻测量需要专业仪器,因此以客户提供的测量数值为准,工程师只要确保机柜电源线的地线、机壳(接上电源线后)到建筑物接地端的电阻小于1欧姆就可以了。新版巡检报告中添加了记录事项为是否双电源(此处指的是双动力源供电,比如电力供给来自不同的发电厂,而不是指设备是不是有冗余电源),此外,需要记录如果是双动力源是否部署在了各自独立的PDU或者UPS上。洁净度:机房应保持清洁且有良好的管理与维护。如机房太脏应提醒客户注

3、意。设备散热:设备进风口温度是否够低并有足够的气流。机房内设备的摆放是否符合冷热通道原则(绝对不能让设备排出的热空气排向其它设备的进风口)。随机工具:对于59X/FHA这类高端机型,随机会附带一些R&V时需要用到的平台,滑轨等工具,巡检时应确认随机工具的当前存储状态,以备不时之需。2.检查系统硬件情况:先从外观上检查硬件情况,检查设备故障灯是否有亮。各种设备上都有故障指示灯,通常为橙色并有~标记。高端服务器,如p670/p690/p59x/FHA,应检查UEPO开关上的系统故障指示灯是否亮。同时检查BPC、BPD、BPR、DCA、MDA等电源

4、子系统的Power-on、Power-in、Power-out、EnableGreenLED等是否长亮。还要检查部件故障灯,如I/Odrawer、PCI卡,硬盘等。检查是否有人改装过IBM设备(如拆掉面板、开口、拆掉过滤网、改变网络连接等)。这些改装可能会影响设备的稳定运行,甚至带来严重后果。对于高端Power5/Power6服务器,还应检查其正面Lightstrip和背面Lightstrip。有安装的部件(如CPUbook)所对应的绿色LED应长亮。任何故障指示灯(橙色)都应不亮。同时注意主机的OperatorPanel,高端Power5/

5、Power6或其它由HMC管理的机器应检查HMC图形界面的虚拟OperatorPanel。设备发生故障时通常伴有出错代码,必须把所有故障代码记录下来。除此以外还应注意有否其他异常情况(如硬盘、风扇异常的声音、电缆破损、系统出风是否顺畅、气流是否因为异物遮挡而影响散热效果等)。IBM中国维护与技术服务12p系列、系统p预防性维护说明1.检查硬件错误报告errorlog:无HMC管理的系统可登录到AIX,使用“errpt–dH”命令检查硬件错误报告。如有,则应使用“errpt–ajerr_id

6、more”命令检查详细的日志。为了准确判断故障,可对

7、硬件设备运行故障诊断程序,如运行“diag-edhdisk1”。诊断程序可对故障记录中的SENSEDATA进行分析并给出SRN、SRC、FRU等。注:如果故障记录太多,应将故障报告取回作进一步分析。可用命令:“snap–r;snap–gc”用“mail”命令查看有否发给root用户的错误报告。用“alog–otboot”命令和“alog–otconsole”命令检查系统的启动记录和主控台的出错信息。对于Power5以前的主机,如果客户允许停机,则应shutdown主机,进入服务处理器(ServiceProcessor)菜单检查故障记录。对于P

8、ower5、Power6、Power7主机,无须shutdown分区就可以进入ASMI菜单进行检查。有HMC管理的系统,可进入ServiceFocalPoint进行检查。HMCV6步骤如下:在ServiceFocalPoint目录下点击ManageEvents打开ManageServiceableEvents窗口。单击OK,进入ServiceableEventsOverview窗口,里面记载了最近的错误日志。单击一条记录,再选择Selected菜单,选择ViewDetails,察看错误详细信息。IBM中国维护与技术服务12p系列、系统p预防性

9、维护说明里面的错误信息应详细记录并保存,不可疏忽。在错误被排除之后应该清除错误信息。选择Selected菜单,选择CloseEvent,关闭错误详细信息。HMCV7

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。