传送网元脱管定位思路及处理方案

传送网元脱管定位思路及处理方案

ID:32629510

大小:64.75 KB

页数:6页

时间:2019-02-13

传送网元脱管定位思路及处理方案_第1页
传送网元脱管定位思路及处理方案_第2页
传送网元脱管定位思路及处理方案_第3页
传送网元脱管定位思路及处理方案_第4页
传送网元脱管定位思路及处理方案_第5页
资源描述:

《传送网元脱管定位思路及处理方案》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、传送网元脱管定位思路及处理方案摘要:网元脱管是传送网络维护中经常碰到的问题。虽然有时网元脱管并不会影响传送业务,但当网元脱管时,对于传送网隐患的发现会起到很大阻碍,需要尽快处理,否则有可能发展成为业务中断重大事故。将通过案例及告警分析对网元托管的处理提供思路。关键词:传送网;网元;网管;脱管中图分类号:TN915文献标识码:A文章编号:1671-7597(2012)1110158-010前言日常问题处理中,脱管问题是网络较多的问题之一,脱管问题原因很多,所需要具备的技能较为综合,包括设备ECC通信原理、网管与设备通信原理等

2、等,有一个清晰的思路,是找到问题症结的关键,本文总结囊括了网元脱管的多种场景,包括各种原因的分析,希望通过本文的学习能够进一步掌握各种脱管问题的分析处理方法。1脱管的定义及网管与设备的通信机制和检测机制脱管就是网管无法对网元(主机)进行正常的管理。其现象主要表现为:网元变灰、网元无法登录。网管与网关网元会建立socket连接,socket连接检测仅仅是检测网管与网关网元之间的socket连接是否正常,这个检测仅对Qx类型网关网元进行,如果连续3次(每次36秒)未响应,再第4次下发就会置socket中断,上报GNE_CONN

3、ECT_FAIL告警;网管与网关网元和非网关网元之间都会进行DCN检测,对网元下发Qx/TL1消息,需要网元进行Qx/TL1响应,如果网元连续2次(60秒一次)未响应,在第3次下发时就会置网元通信中断,上报NE_C0MMU_BREAK告警;网管会对网关网元以及非网关网元下发登录命令,如果失败则上报NE_N0T_L0GIN告警。2各种故障定位处理2.1上报NE_N0T_L0GIN告警网管登录不上网元,但并不代表网管与网元之前的通信不通,告警是检测后立即上报的;而上报NE_COMMU_BREAK告警表示网元通信不通,同样肯定会

4、伴随NE_N0T_L0GIN告警,该告警至少要2分钟(2X60秒)才会上报;而上报GNE_CONNECT_FAIL告警表示网关通信失效,与该网关相关的非网关网元应该有脱管现象,该告警从检测故障起108秒(3X36秒)才会上报;NDCNTestTimeoutCount参数,该参数即上面提到的DCN检测的参数,缺省为2,即连续2次(60秒一次)未响应,第三次置网元通信中断。可以在ems.cfg中增加nDCNTestTimeoutCount二2这一行,把该参数改大可以缓解网管上网元频繁脱管的现象,但该方法治标不治本,无法根本解决

5、DCN网络差的问题,一般是不建议使用的。2.2单个网元脱管和多个网元脱管脱管有单个网元脱管和多个网元脱管,单网元脱管的原因一般有:网元ID冲突、主控故障、光板故障、网元用户不正确、所属网关设置不正确等等;单网元脱管的定位可以参考以下流程图:2.3ECC风暴■■■ASECC风暴的根本原因是ECC本身不适合大组网导致的,组网过大,路由计算下降,当网络变化时,路由广播信息不断在整个网络中广播,造成路由不断重算,导致路由表收敛时间过长。根本解决ECC风暴的方法是ECC划分,保证性能的情况下要求小于等于64个网元,基本可用的情况下要

6、求小于或等于80个网元。2.4GNE_MGR_LIMIT_OVER告警该告警是检测网管侧网关网元所管理的非网关网元数目,超过缺省的64个则会上报该告警,起到提醒用户组网过大避免发生ECC风暴的作用,若现网很难做到64个网元以下,那么处理该告警的方法可以通过修改ems.cfg配置文件,增加GneMgrLimItLevel=64一行,把值修改为比实际非网关网元数量大的值即可,但不建议一味改大,否则该告警的作用将失去意义,建议尽量别超过100;确实不需要该告警作为提醒,也可以对该告警进行过滤处理。2.5网关网元脱管网关网元也脱管

7、的情况下,此时需要检查网管到网关之间的DCN是否正常,可以先从网管服务器上ping脱管网关的IP地址,若不通则需要确认网管服务器到网关网元的具体DCN网络的组网,然后逐步排查DCN网络的故障,DCN网络组网种类繁多,具体的定位方法在此就不过多进行赘述。如果能够ping通网关网元,但是还是无法登录,那么可以从服务器上尝试使用navigator工具来登录网元,判断是否为网管问题导致,如果navigatorT具也无法登录,可以通过telnet网关网元IP1400,测试网管与网关之间TCP通信的1400端口是否通,如果不通需要检查

8、服务器操作系统上的防火墙以及杀毒软件等设置是否存在禁用端口的情况。2.6网元互踢脱管查询互踢根源,需先定位确认确实存在互踢,且不明互踢源是从哪台网管哪个地方登录过来的,可以切换另一个网元用户登录,然后查询该互踢根源来自何处,查询方法如下:1)对于OSP平台R10之后的版本,可以通过网元操作日志看出,网元

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。