应急预案通用标准处置-oraclev1.2

应急预案通用标准处置-oraclev1.2

ID:42799021

大小:1.21 MB

页数:91页

时间:2019-09-21

应急预案通用标准处置-oraclev1.2_第1页
应急预案通用标准处置-oraclev1.2_第2页
应急预案通用标准处置-oraclev1.2_第3页
应急预案通用标准处置-oraclev1.2_第4页
应急预案通用标准处置-oraclev1.2_第5页
资源描述:

《应急预案通用标准处置-oraclev1.2》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、修改记录编号日期描述版本作者审核发布日期12012-3-30建立•文档1.0贺耀东22012-6-6补充场景,补充CMMP告警对应信息1.0贺耀东32013-3-26补充llgASM部分1.1.24-26和2.1.28-2.1.31;crsstat-t命令补充llg对应命令1.0贺耀东42013-7-31增加1.1.28/29、2.1.32/33/341.1贺耀东52013-08-29增加1.1.30、31、321.1贺耀东62013-9-22增加2.1.351.2贺耀东72013-10-21增加1.1.331.

2、2贺耀东89101112131415如无中国建设银行的书面许可,任何人都无权复制或利用。®CopyRight2005byChinaConstructionBank应急处置操作手册1.故障场景及处置流程14通用数据库故障场景441•单节点数据库(含RAC—边节点)无响应,其上所有业务HANG事件级别:五级授权级别:部室负责人授权场景描述:单节点数据库(含RAC一边节点)无响应,所有业务HANG;CMMP报警:Oracle数据库可用性数据库连接状态当前值为;存档设备上的空闲空间当前值为业务影响:该数据库节点上业务完全

3、中断。启动条件:无现场保护:按GD200中的方式要求,收集Oracle信息。故障场景应急处置序a调用处I置编号处置简要描述时间树T1GD007确认数据库已不响应2分钟T2GD012检查数据库日志,如果发现是日志归档2分无法进行,执行T3;否则执行T4钟T3检查归档日志文件系统是否正常,问题解决后转至T73分钟T4GD002调用GD002重启数据库10分钟T5GD012检查数据库日志,确认数据库重启正常1分钟T6GD007确认数据库状态正常,通知应用重启1分钟T7应急救治结束修订日期:2012年6月4日修订人:贺耀

4、东1.1.2.RAC数据库整体无响应,所有业务HANG事件级别:五级授权级别:部室负责人授权场景描述:RAC数据库整体无响应,所有业务HANGCMMP告警:Oracle数据库可用性数据库连接状态当前值为业务影响:所有业务启动条件:无现场保护:按GD200中的方式要求,收集Oracle信息。序调用处处置简要描述时间匱编号树T1GD007确认各节点数据库都已不响应2分故障场景应急处钟T2GD012检查各节点数据库日志,如果发现是日志归档无法进行,执行T3;否则执行T42分钟T3检查归档日志文件系统是否正常,问题解决后

5、转至T73分钟T4GD013检查CRS各日志,确认最早出现问题的节点,找到原因。5分钟T5GD004/GD007关闭最早出现问题的节点数据库,重启该主机;主机无法连接后,调用GD007确认其他节点已正常;如果未正常,依次关闭其他节点数据库,重启主机。15分钟T6GD012检查数据库日志,确认数据库重启正常,通知应用重启1分钟T7GD007确认数据库状态正常1分钟T8应急救治结束修订日期:2012年6月4日修订人:贺耀东143•整体业务速度慢,主机持续有CPU(一个或多个)高,且占用CPU高的pid固定事件级别:六

6、级授权级别:部室日常授权场景描述:整体业务速度慢,主机持续有CPU(—个或多个)高,且占用CPU高的pid固定CMMP告警:Unix服务器CPU利用率当前值为业务影响:整体业务速度慢。启动条件:无现场保护:无序a调用处■编号处置简要描述时间树T1GD014根据pid找到当时正在执行的SQL1分钟T2GD015查看该SQL的执行计划1分钟T3GD016查看相关表的具体信息,分析问题原因,采取相应操作.10分钟T4应急救治结束O5分钟故障场景应急处修订日期:2012年6月4日修订人:贺耀东1他4•整体业务速度慢,主机

7、CPU不高,或占用CPU高的pid持续变化事件级别:六级授权级别:部室日常授权场景描述:整体业务速度慢业务影响:整体业务速度慢启动条件现场保护故障场景应急处置序调用处置编号处置简要描述时间树T1GD008生成AWR、ASH报告3分钟T2分析原因:如果是大批量小SQL反复执行,可能是由于业务量突增引起;如果是由于锁冲突(Latch)、队列等待(Enq)造成,需要消除瓶颈.5分钟T3应急救治结束。5分钟修订日期:2012年6月4日修订人:贺耀东115•数据库部分业务缓慢,CPU占用正常事件级别:六级授权级别:部室日常

8、授权场景描述:数据库部分业务缓慢,CPU占用正常。大部分业务正常未受影响。业务影响:大部分业务正常未受影响,个别业务缓慢启动条杵:无现场保护:无。故障场景应急处置序调用处匱编号处置简要描述时间树T1GD017找到业务慢的session1分钟T2GD018针对该session生成ASH报告2分钟T3分析原因:有特殊等待事件可能是由于数据库bug;如果是由于锁冲突(Latch

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。