欢迎来到天天文库
浏览记录
ID:56721403
大小:1.25 MB
页数:42页
时间:2020-07-06
《ZXMP S385故障处理方法及流程.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库。
1、ZXMPS385故障处理方法及流程一.故障定位的基本思路及方法1.故障处理流程故障处理流程如图1-1所2.故障处理的基本原则在处理设备故障时,设备维护人员应该遵循一“查看”、二“询问”、三“思考”、四“动手”的基本原则。查看维护人员到达现场后,首先应仔细查看设备的故障现象,包括:设备的故障点、告警原因、严重程度、危害程度。只有全面了解设备的故障现象,才能透过现象看本质。询问观察完故障现象后,应询问现场操作人员,有没有直接原因造成此故障,比如:修改数据,删除文件,更换电路板,停电,雷击。思考根据现场查看的故障现象和询问的结果,结合自己的知识进行分析,进行故障定位,判断故障
2、点和故障原因。动手在通过前面三个步骤找出故障点后,维护人员可以采取适当的操作来排除故障,如:修改配置数据、更换板件。3.故障定位的基本思路3.1故障原因工程问题工程问题是指由于工程施工不规范、工程质量差等原因造成的设备故障。此类问题有的在工程施工期间就会暴露出来,有的可能在设备运行一段时间或某些外因作用下,才暴露出来,为设备的稳定运行埋下隐患。产品的工程施工规范是根据产品的自身特点并在一些经验教训的基础上总结出来的规范性说明文件。因此,严格按工程规范施工安装,认真细致的按规范要求进行单点和全网的调试和测试,是阻止此类问题出现的有效手段。外部原因外部原因是指传输设备以外导
3、致设备故障的环境、设备因素,包括以下几类。l供电电源故障,如设备掉电、供电电压过低。l交换机故障。l光纤故障,如光纤性能劣化、损耗过高、光纤损断、光纤接头接触不良。l电缆故障,如中继脱落、中继损断、电缆插头接触不良。l设备接地不良。l设备周围环境劣化。操作不当操作不当是指维护人员对设备缺乏深入了解,执行了错误的操作,从而导致设备故障。操作不当是在设备维护工作中最容易出现的情况。尤其在改网、升级、扩容时,出现新老设备混用、新老版本混用的情况下,因为维护人员不是非常清楚新老设备之间、新老版本之间的差别,常常引发故障。设备对接问题传输设备传送的业务种类繁多、对接设备复杂,而且
4、各种业务对传输通道的性能要求也不完全相同,设备对接时常出现设备故障。对接问题主要有以下几类。l线缆连接错误。l设备接地问题。l传输、交换网络之间时钟同步问题。lSDH帧结构中开销字节的定义不同。设备原因设备原因指由于传输设备自身的原因引发故障,主要包括设备损坏和板件配合不良。其中的设备损坏是指在设备运行较长时间后,因板件老化出现的自然损坏,其特点是:设备已使用较长时间,在故障之前设备基本正常,故障只是在个别点、个别板件出现,或在一些外因作用下出现。3.2故障定位的原则由于传输设备自身的应用特点——站与站之间的距离较远,因此在进行故障定位时,最关键的一步就是将故障点准确定
5、位到单站。在将故障点准确的定位到单站后,就可以集中精力来排除该站的故障。故障定位的一般原则如下:1.在定位故障时,应先排除外部的可能因素,如光纤断、交换故障或电源问题等,再考虑传输设备的问题。2.在定位故障时,要尽可能准确的定位故障站点,再将故障定位到单板。3.线路板的故障常常会引起支路板的异常告警,因此在故障定位时,先考虑线路,再考虑支路,在分析告警时,应先分析高级别告警,再分析低级别告警。4.故障定位的常见方法4.1观察分析法当系统发生故障时,在设备和网管上将出现相应的告警信息,通过观察设备上的告警灯运行情况,可以及时发现故障。故障发生时,网管上会记录非常丰富的告警
6、事件和性能数据信息,通过分析这些信息,并结合SDH帧结构中的开销字节和SDH告警原理机制,可以初步判断故障类型和故障点的位置。通过网管采集告警信息和性能信息时,必须保证网络中各网元的当前运行时间设置和网管的时间一致。如果时间设置上有偏差,会导致对网元告警、性能信息采集的错误和不及时。4.2网管测试法当组网、业务和故障信息相当复杂时,或者设备出现没有明显的告警和性能信息上报的特殊故障时,可以利用网管提供的插入误码、插入告警、环回等维护功能进行测试,判断故障点和故障类型。下面以环回操作为例进行说明。进行环回操作前,首先需要确定环回的网元、单板、通道、方向。因为同时出问题的通
7、道大都具有一定的相关性,因此在选择环回通道时,应该从多个有故障的网元中选择一个网元,从多个有故障的业务通道中选择一个业务通道,对所选择的业务通道逐个方向进行环回操作加以分析。进行环回操作时,先将故障业务通道的业务流程进行分解,画出业务路由图,将业务的源和宿、经过的网元、所占用的通道和时隙号罗列出来,然后逐段环回,定位故障网元。故障定位到网元后,通过线路侧和支路侧环回定位出可能存在故障的单板。最后结合其他处理办法,确认故障单板,并予以更换。环回操作不需要对告警和性能做太深入的分析,是定位故障点最常用、最有效的方法,缺点是会影响业务。4.3拔
此文档下载收益归作者所有