欢迎来到天天文库
浏览记录
ID:44542387
大小:61.50 KB
页数:5页
时间:2019-10-23
《日常维护工作手册》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、日常维护工作手册一.HIS系统各主机的登陆及日常巡检BOSS系统主机的构成:主机名用途CACHE1—192.16&4.2HISCACHE2—192.168.4.3DS5020---192.168.128.101HISB24交换机一10.77.77.77HIS1.日常巡检巡检过程包括5个部分:检查errpt报错日志、检查换页空间使用率、检查文件系统使用率、检查he状态、、检查各主机CPU/内存使用率。登陆主机一errpt软硬件报错1#hostname…确认登陆主机2#errpt-dH
2、more…查询硬件错误(一般同时前面板黄灯)3#errpt
3、-ajxxxxxxx查看详细的错误代码二检查换页空间使用率1#Lsps-a-查看换页空间使用,内存足够时,使用率不高于5%如果遇到换页空间增涨,可通过topas,vmstat等命令检查各进程状态,立刻通知应用工程师。三检查文件系统使用率l#df-g查看文件系统使用率如果有超过80%的文件系统,需要进入该目录,du-sm查询那个目录或者文件较大。四检查ha状态登陆主机#cd/usr/sbin/es/cluster#./clostat-a查看双机状态为stale表示稳定如果出现网络故障网卡处显示为down五检查各主机CPU/内存使用率使用Top
4、asvmstat检查主机负载1.关于topas命令的输出:右边从上至下依次是当前CPU、网络、磁盘使用情况和当前占用CPU资源较高的若干进程。CPU使用情况i栏中有四项依次是kernelo(此代表当前系统内核使用的CPU资源)User(此项是当前系统中其他用户使用的CPU资源)Wait(CPU等待时间)以及Idle(CPU空闲时间)oIdle值很低的话,则代表当前CPU十分繁忙。在topas输出右侧的memory>pagingspace屮可以查看当前系统内存与换页空间使用率。1.关于vmstat的输出:Proc部分:「->在运行队列中等待的
5、进程数。(如此值达到2〜5倍CPU数,说明系统中等待执行的线程数较多,可能存在性能问题)b—>在等待io的进程数memory部分:avm->等于当前使用的物理内存和使用的交换区的总和减去作为文件系统缓存的物理内存(单位为4KB)free—>空闲的内存(4k表示)pages部分:re》回收的页面pi一一》进入页面数po——》出页面数fr——》代表此段时间内,有多少不用的物理内存被释放sr——》通过吋钟算法扫描的页面fault显示每秒的中断数:in》设备中断sy——》系统中断CS》cpu交换cpu表示cpu的使用状态:US——》系统中用户操作所
6、占用的CPU时间百分比sy一一》系统中系统调用所占用CPU时间百分比id——》cpu空闲的时间百分比wa——》系统等待磁盘10所占时间百分比(此时CPU闲置)LABEL事件的预定义名称IDENTIFIER事件的数字标识符Date/Time事件的日期和时间SequenceNumber事件的唯一编号MachineID系统处理器部件的标识号NodeID系统的缩写名(助记名)Class错误的一般原因。可能的错误类型有:II硬件S软件0指示性信息U未确定的Type发生的错误的严重性。可能有如下错误类型:PEND一个设备或部件将很快丧失其可用性PERF
7、设备或部件的性能已降级至可接受的水平以下PERM不可能恢复的状况。此类错误通常是最严重的错误,并可能意味着硬件设备或软件模块损坏。除PERM之外的错误类型通常不代表一个故障,但可通过诊断程序进行分析。TEMP多次不成功的尝试Z后,被恢复的状况。此错误类型也用来记录指示性的信息条目,如DASD设备的数据传输统计。UNKN不能确定错误的严重性INFO指示性的错误日志条目,和不是错误的结果ResourceName发现错误的资源名称。对于软件错误,这是一个软件部件、或一个可执行程序的名称。对于硬件错误,这是一个设备、或系统部件的名称。这不表示部件故
8、障、或需要替换。相反,可用来确定用来分析错误的适当诊断模块。ResourceClass发现故障的资源通用类。(如,disk设备类)ResourceType发现故障的资源类型LocationCode设备的路径。可能有多达四个字段,分别涉及drawer(抽屉)、slot(插槽)、connector(连接器)、port(端口)。VPD关键产品数据(Vitalproductdata)。该字段的内容是多种多样的。设备的错误日志条目比较典型地,返回关于设备厂商、序列号、工稈变动级别、只读存储器级别等方面的信息。DescriptionProbableCa
9、useUserCauses和外部设备(如ActionsInstallCauses错误的摘要列岀一些可能导致错误的原因列出一些用户误操作导致故障的可能原因。不正确地插入的磁盘mod
此文档下载收益归作者所有