网络故障预测与健康管理的关键技术

网络故障预测与健康管理的关键技术

ID:21546433

大小:27.50 KB

页数:7页

时间:2018-10-22

网络故障预测与健康管理的关键技术_第1页
网络故障预测与健康管理的关键技术_第2页
网络故障预测与健康管理的关键技术_第3页
网络故障预测与健康管理的关键技术_第4页
网络故障预测与健康管理的关键技术_第5页
资源描述:

《网络故障预测与健康管理的关键技术》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、网络故障预测与健康管理的关键技术  摘要  近几年,随着科技的迅速发展,人们不管在生活还是生产上都离不开网络。网络涉及到工业生产、国防、教育、生活等方面。所以网络的管理尤为重要。为保证网络的正常运行,需要为其设置故障防御及管理系统。本文以网络故障预测与健康管理的系统设计为例,详细阐述在设置时的关键技术。  【关键词】网络故障预测健康管理关键技术  互联网已成为社会生活和工作的必需品,网络在运行中的各部分组成设备,如路由器、主机等日益增加,其功能在提升的同时,也加大了网络的管理难度。而网络设备的健康运行对整个网络系统有着至关重要的影响。因

2、此,在网络的日常运行中,需要能?蛭?护网络正常运行,且在出现故障后能够迅速反应,准确定位故障发生环节,并排除故障的系统。这是目前网络维护和管理工作者的核心任务。  1网络故障预测与健康管理综述  网络的故障预测和健康管理(PHM)技术是作为实现网络设备基于状态的维修、自主式保障、感知与响应后勤等新思想、新方案的关键技术,也是一门新兴综合性交叉学科。故障预测和健康管理有两层含义:意识故障预测,即预先诊断设备或系统完成各自功能时的状态,确定设备正常工作的时间长度;另一方面是健康管理,即根据诊断或预测到的设备信息、可用资源和使用需求对维修活动

3、作出适当决策能力。而网络故障预测与健康管理技术在设计上将传统的基于传感器的诊断转向基于智能系统预测,为准确而主动的维护网络正常运行提供了技术基础。  在网络的故障预测和健康管理技术中,使用当前最新科技技术为基点,结合现下网络健康程度、特征等历史数据,收集与系统属性有关的各类设备运行参数,将这些参数和系统健康做关联,对系统进行检测、分析。对网络系统未来时刻的运行状态进行预测,便于在故障发生之前,能够采取有效措施保障网络的正常运行。为更直观地阐述网络故障预测与健康管理的关键技术。本文涉及网络设备的PHM系统,同时采用模块化设计,通过四个功能

4、层次,实现网络设备故障预测与健康管理。  2故障预测与健康管理系统的设计  2.1网络故障预测系统的设计要求  在设计故障预测与健康管理系统时,系统需要实现以下要求:  (1)在故障预测与健康管理系统中的诊断环节,需要以网络管理系统所提供的警报信息为基础,通过SNMP模块接收设备警告,将来自网络系统中不同的运行设备放入警报信息转换为标准的、可识别的格式,存储到警报信息数据库中,对于故障警报信息将触发故障预测和诊断,对于数据库中的历史数据进行重新梳理分析。一旦发现故障模式,就会不断完善故障诊断信息库,为诊断故障累积“经验”,便于后期检测出

5、同样故障时及时调出处理。  (2)在系统中的诊断实施流程就是收集网络运行设备的性能的关键参数,对于参数预处理后进行合理的健康评估,再通过故障诊断方法对网络设备故障进行诊断和预测。系统中,此技术将诊断经验学习、累积和诊断的实施相互结合,互为补充,从而提高网络系统故障预测的可靠性和准确性,降低预测的误差。  2.2关键技术  网络故障预测与健康管理的关键技术从信息的收集、系统数据的处理、故障诊断与预测的技术、健康评估与管理等四个方面入手。详解如下:  2.2.1网络设备运行信息的收集  在故障预测与健康管理系统中,利用系统的预测模型对收集到

6、的网络设备运行状态信息进行分析和预测。故障预测和健康管理系统主要是将网络运行中的所有设备数据进行采集,在此过程中,为了减少通信的数量,需要选择对网络设备运行转台影响较大的参数量。比如网络设备的运行时间、系统运行时的温度变化、计算机CPU的最大利用率、内存的存储量、通信端口等对设备的运行状态影响较大的数据。以上几组变量可以反映设备的健康状态,因此在设计时,选用其作为预测模型的参数量。  在设计之时,经过团队研究,提出五点研究假设:  (1)网络设备的运行时间越趋近于或者超过发生故障的周期,系统认为发生故障的可能性就越大。  (2)网络系统

7、的运行温度越高,被认为发生故障的可能性就越高。  (3)计算机CPU子运行时的利用率越高,被认为发生故障的机率就越大。  (4)在计算机运算时的内存存储量越大,认为发生故障的可能性越大。  (5)通信端口的丢包率、误码率越高,认为发生故障的可能性越大。  提出五点假设后,系统的主要研究过程就围绕以上五点操作。同时在系统运行过程中,设备信息的收集时间间隔也比较重要。当收集的周期较短时,可以迅速发现设备的异常,更有利于维护网络的正常运行。但同时也存在缺陷,即在频繁的信息收集所占用设备和系统的有效资源,加重了系统运行的负担。当收集数据的周期较

8、长时,数据量会比较少,对系统的负担小,但是不能及时发现并解决故障问题,对于网络系统中的突发状况不能及时作出响应。所以在实验系统的设计中,将系统数据收集的间隔时间设置为5-6分钟。  2.2.2系统数据的处理

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。