欢迎来到天天文库
浏览记录
ID:44585151
大小:87.60 KB
页数:5页
时间:2019-10-23
《[推荐精品]aix故障诊断信息收集》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、二、故障信息的收集1)收集故障信息对于判断、诊断故障原因,修复系统非常重要。2)系统故障记录(errorlog)。errdemon进程在系统启动时自动运行,记录包括硬件、软件及其他信息。故障记录文件为/var/adm/ras/err1og,可备份下来或拷贝到别的机器上分析。errpt命令的使用(普通用户权限也可使用):tterrpt
2、more列出简短出错信息T(类型):P永久;T临时;U未知(永久性的错误应引起重视)C(分类):H硬件;S软件;0用户;U未知#errpt-dH列出所有硬件岀错信息tterrpt-dS列出所有软件出错信息#errpt-ajERROR
3、_ID列出详细出错信息#errpt-aj0502f666<—ERROR_ID用大小写均可3)控制面板上的LED代码.8位代码,通常系统故障灯会同吋亮起。某些机型还会同时显示故障设备位置代码。.4位代码,通常是Exxxo.3位代码,通常为Oyyy,只看后3位。.8位和4位代码可查看系统服务手册(ServiceGuide)o3位代码可査看系统诊断手册(DiagnosticInformationforMultipleBusSystem)□.闪动的888,系统崩溃,硬件或软件原因造成。按reset键会显示更多内容。888-102一般为软件故障(888-102-207例外
4、)系统会产生一个dump。888-102-xxx-0C9系统正在做dump,请等待。888-102-xxx-0C0系统dump完成,可关电重启。888-103或105硬件故障,一般有SRN代码及位置代码。4)SMS(SystemManagementService)故障记录如何进入SMS菜单:当主控台出现键盘图标后(LED显示E1F1吋)按1键。选择"Utilities"选择"ErrorLog抄下8位故障代码(在SMS屮还可以更改系统启动顺序表)5)MAIL#mai1系统会向root用户发ma订报告出错信息。通常系统出现故障后没有进行检杳修复,系统会定时提FEr
5、ooto6)运行故障诊断程序(Diagnostic),对系统硬件进行检查和诊断。当发现有硬件故障时应立即使用diag#diag>选高级诊断(AdvanceDiagnostic)>选问题诊断(ProblemDetermination)或选系统检查(SystemVerification)(选PD会对系统错误记录进行分析)diag运行后会给!l!SRN代码,故障设备名称及百分比,地址代码等。对于PCI机型丿应在系统报错7天之内运行diag程序对出错记录里的sense数据进行分析。7)其他用于收集系统信息的命令lsdev-C系统设备信息ttlsdev-CcdiskIsp
6、v查看物理卷信息#1spvlsvg查看卷组信息#lsvgdatavgttlsvg-1:rootvglslpp查看文件组信息#lslpp-L
7、grep23100020lsattr查看设备参数设置ttlsattr-Elent2lscfg查看VPD信息(VirtualProductData)#lscfg-v1ssal不同的硬件设备有不同的VPD,所含的格式和信息都不一样。通常备件号和微码版本最有参考价值。注:FRU(FieldReplaceUnit)才是真正的备件号。三、硬件故障定位方法IBM小型机故障定位方法包括小型机I/O柜上的显示面板上的Checkpoints信
8、息,ErrorCode和SRNsoCheckpoints检查点是系统加电CMOS初始化程序(initialprogramload(TPL)),运行后显示在I/O柜的显示而板上一系列信息。IPL流程当交流电源接到系统后,IPL流程就开始了,IPL流程包括•四个步骤:.Phase1:ServiceProcessor的初始化Phase1开始于交流电源接到系统后,直至lj0K显示在I/O柜上的显示面板上为止。在这个步骤会显示8xxx或9xxxcheckpoints代码。.Phase2:由ServiceProcessor引导的硬件初始化Phase2开始于按FI/O柜上的白
9、色电源开关。在这个步骤会显示9xxxcheckpoints。91FF是最示的代码标志着第三步骤的开始。.Phase3:系统固件的初始化Phase3一个系统处理器接管控制并继续初始化系统资源,在这个步骤会显示ExxxoE105是授后的代码标志着第四步骤ATX启动的开始。在这个过程中还会显示各种位码(位置码代表着系统的每一个部分).Phase4:AIX启动当AIX开始启动吋,显示而板上的代码为Oxxx,同吋位置码会出现在第二行。当AIX的登录窗口出现在控制台上时第四步骤结束同时显示面板上再无任何信息出现。ErrorCode当系统运行有错误发现时,一个8位码会显示在显
10、示面板上,同时在第二行显
此文档下载收益归作者所有