巡检常用命令.doc

巡检常用命令.doc

ID:53710559

大小:55.50 KB

页数:4页

时间:2020-04-06

巡检常用命令.doc_第1页
巡检常用命令.doc_第2页
巡检常用命令.doc_第3页
巡检常用命令.doc_第4页
资源描述:

《巡检常用命令.doc》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、IBMAIX小型机巡检常用命令及流程第一:首先是机房温度以及湿度的检查,当然这些一般情况都没问题。参考值:温度(摄氏℃)10℃-40℃湿度8%-80%第二:就是关于电源的检测,这个只要不是新装机,一般没问题。参考值:零-地电压小于1V火-地电压200-240V(补充:当然59系列的机器相间380V,相地240V)第三:关于报错。主要查看硬件的永久性报错#errpt-dH

2、pg软件的永久性报错#errpt-dS

3、pg还有系统又没又报警灯第三:机器的序列号:#uname-Mu第四:操作系统版本:#osleve

4、l-r注:有时候不能使用是因为系统版本低的原因第五:其他检测执行sysdumpdev–l(检查dump是否设置为alwaysallowsysdump)执行sysdumpdev–e(检查当前dump大小应该为主dump设备的大小的80%以下)执行lsvg-lrootvg(检查有否"stale"状态的逻辑卷)执行lsps-s(检查内存交换区占用情况)执行df–k(检查文件系统的分配状况,一般不要超过80%)执行lsdev–Ccdisk(检查硬盘状态为available)执行lsdev–Ccadapter(检查

5、PCI卡状态为available)执行lsdev–Cctape(检查磁带机状态为available)执行lsdev–Ccprocessor(检查CPU状态为available)执行lsattr–Elsys0

6、grepautorestart(检查系统crash后是否自动重新启动)执行lsattr–Elsys0

7、grepcpuguard(检查CPUGUARD是否开启)执行lsattr–Elmem0(检查内存状态正常size=goodsize)执行vmstat2iostat,topas观察us,sy,pi,po

8、,(内存占用率,硬盘读写速度等检查是否有性能瓶颈)执行netstat–in和netstat–rn(观察网络状态)执行entstat–denX(检测网卡运行速率与交换机速率是否匹配)(网卡速率由10M半工改为自适应时,缺省网关会丢失。更改网卡速率后需要在系统中执行smittyroute操作重新激活缺省路由。如果进行网卡速率的调整,请务必小心。)执行ping命令(检查网络连接状况)执行lsdev–C

9、grepaio(检查异步IO是否可用)执行lssrc–gcluster(查看是否有三个进程均为active状态

10、)(这个主要看起了几个HA的进程了,有的时候是一个或两个)执行/usr/sbin/cluster/clstat–a(查看cluster状态是否正常)检查/etc/hosts,确保双机配置中IP别名不会存在包含关系(share_ip1包含了share_ip)执行#more/usr/es/adm/cluster.log#more/usr/es/sbin/cluster/history/*#cat/tmp/hacmp.out(检查这三个日志中是否有error或者fail.)检查7133面板上的指示灯,如果黄灯亮

11、则需要诊断问题HOTspare磁盘检测1、检查是否有raid保护#smittyssaraid--->ListAllDefinedSSARAIDArrays2、检查是否有HotSpare#smittyssaraid--->ListComponentsinaHotSparePool对于7133,执行Smittyssaraid?ListAllDefinedSSARAIDArrays查看7133raid状态,正常应该为good状态。对于7133,执行Smittyssaraid?Change/ShowUseofan

12、SSAPhysicalDisk查看7133硬盘状态,正常应该为member或者spare状态对于FastT,分别登录上两个controller(登陆方法后面详细讲解),查看是否有错误日志。记录检查结果cpu(主频*数量)#lsattr-Elproc0内置磁盘个数:#lsdev-Ccdisk网卡信息:#lsdev-Ccadapter系统属性:#lsattr-E-lsys01.系统错误报告(ErrorLog)的检查:硬件故障检测命令:#errpt-dH-TPERM若有故障执行命令#errpt-a-dH-TPE

13、RM>/tmp/harderror.log保存,分析结果报告给客户软件故障检测命令:#errpt-dS-TPERM若有故障执行命令#errpt-a-dS-TPERM>/tmp/softerror.log保存,分析结果报告给客户2.有否发给root用户的错误报告(mail):#mail(1).观察所有未读消息,注意有关diagela的消息。(2).常用命令:h[]Displayheadingsofgroupcontainingm

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。