欢迎来到天天文库
浏览记录
ID:14763493
大小:43.00 KB
页数:3页
时间:2018-07-30
《传输+华为+sdh+ptn950异常掉电操作导致网元配置数据丢失及业务中断故障案例》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库。
1、传输+华为+PTN950异常掉电操作导致网元配置数据丢失及业务中断故障案例关键字:PTN950故障原因:数据库问题专业:传输设备类型:PTN设备型号:950设备厂家:华为软件版本:故障原因归类:硬件故障现象:PTN950安装了两块CXP单板,构成单板1+1保护组。1号槽位CXP单板(用1-CXP表示)为工作板,2号槽位CXP单板(用2-CXP表示)为保护板。为处理单板不在位告警,更换了2-CXP单板。之后,网元上的配置数据全部丢失,业务中断。原因分析:错误操作导致网元数据库被清空。流程图:对故障单板继续进行更换查看网管告警,能否确定故障原因?YN分析操作过程,核对每个步
2、奏是否正确?对错误操作结合网管日志和告警进行分析定位。N恢复网元数据库,设备恢复正常工作,故障排除。业务恢复正常结束经验总结PWLSPPing测试,核实是否Tunnel不通?接到故障,查看电路有无告警?解决措施:步骤一:分析操作过程:1.更换2-CXP单板。新的2-CXP单板的软件版本与1-CXP单板的软件版本不一致,2-CXP单板自动从1-CXP单板同步软件。1.软件同步完成后,2-CXP单板自动硬复位,此时网管上的“网元视图”中显示2-CXP单板不在位。理论上,硬复位过程将持续3至5分钟。2.此时认为设备异常,决定重新启动设备。大约1秒钟时间内,设备掉电又重新上电。
3、3.网元重新启动后,网管上的配置数据全部丢失,业务中断。步骤二:查询网元重启后的CXP单板1+1保护组,发现工作板为2-CXP单板。这与掉电前工作板为1-CXP单板不符。掉电之前,2-CXP单板为保护板,但仅与工作板1-CXP单板完成了软件匹配,尚未从1-CXP单板同步网元配置数据,故2-CXP单板上的数据库为空。重启之后,1-CXP单板成为保护板,并自动同步了2-CXP单板上的数据库,导致1-CXP单板上的数据库被同步为空,故障发生。步骤三:查询网元日志,发现2-CXP单板重新上电的时间,较1-CXP单板重新上电的时间提前20秒,导致2-CXP单板被识别为工作板。单板
4、掉电时,有大约1秒的掉电缓冲时间,再次上电时则会先执行约20秒的ECC校验,通过后才正式上电运行。在本案例中,设备从掉电到上电所用时间大约1秒钟,2-CXP单板未能完成掉电缓冲,直接跳过了上电ECC校验时间,先于1-CXP单板上电,被默认识别为工作板,导致故障发生。步骤四:恢复网元数据库,设备恢复正常工作,故障排除。预防、监控措施:为保护设备,请在设备掉电至少5秒后再重新上电。
此文档下载收益归作者所有