欢迎来到天天文库
浏览记录
ID:23431782
大小:53.00 KB
页数:6页
时间:2018-11-07
《利用icmp实现网络状态监测系统》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库。
1、利用ICMP实现网络状态监测系统~教育资源库 一、概述 在电信级设备功能日益完善,组网日趋复杂的今天,对设备的管理监控已经成为保障设备稳定、正常运转的必要手段。其中,对底层通信网络的监控是整个监控管理系统的核心和基础。 以前众多企业级的通信核心网设备因为没有完善的监控管理,缺乏告警及系统运行状态的相关日志信息,致使维护人员无法准确掌握设备运行状态,设备运转达不到用户所必须的稳定性及安全性要求。尤其当网络物理硬件出现故障造成网络中断时,如果不能及时发现并定位,不仅会造成用户长时间通信中断,而且会让我们厂商的研发和工程人员无谓浪费时间去逐步查找软件问
2、题。针对这种现象,我们提出一种网络状态监测的解决方案。 这种监测方法主要是基于ICMP协议开发的,基本原理类似P探测包的周期应该由用户根据安全需要自行设定。 每发送10包ICMP探测消息后,应该对各被控方向的整体网络状况进行一次统计,内容包括收到响应的数量、时延及丢包率等。将所有的统计数据全部记录在指定目录下的log日志文件中,日志文件的大小在大于一个阀值时应该保存为备份文件,然后重新记录。通过日志在本机中查看服务器在一个周期时间(例如一周)内的网络通信状况,便于维护人员及时发现并提前避免传输层的问题。 这里需要设置一个周期上报线程,每隔一个用户
3、指定的时间周期,通过计算,将网络状态统计数据主动上报到操作维护台。上报内容包括被监控端的IP地址,RTT往返时间和丢包率等。此外,该线程还对每个被监测客户端的收发消息进行差值统计,一旦发现丢包立即通过接口函数上报告警至维护台。告警内容包含监控客户端的IP地址和告警级别。 需要注意的是,由于采用多方向连续ICMP监,所以,对于ICMP响应消息一定要进行合理的区分,以避免各个监控方向的统计混乱。由于传输网络具有不确定性,并不能保证每一包到达的先后顺序,此时通过IP地址、序列号和消息pid号区分响应消息就显得尤为重要。另外,为了使用发送接收超时设置,必须设
4、定socket为SO_RCVTIMEO和SO_SNDTIMEO方式,否则一旦某一监测方向出现网络超时中断问题,程序将面临被悬挂死锁的危险。 当返回ICMP回显应答时,要保存消息序列号和TTL生存时间,并计算探测消息往返时间。ICMP消息序列号计数从0开始,每发送一次新的回显请求,序列号加1。程序记录返回的每个分组的消息序列号,供查看是否有分组丢失、失序或重复,并通过在ICMP报文数据中存放发送请求的时间值来计算往返时间。当应答返回时,用当前时间减去存放在ICMP报文中的消息发起时间,即往返时间。 基于ICMP的网络监测方法,优点是具有平台无关性。无
5、论服务器、普通计算机或者电信交换机,只要是支持TCP/IP协议的操作系统,都可以被列为监控对象。即此监控方式不受被控端所使用的操作系统和操作平台限制。这样不仅提供了极强的平台通用性,还大大减少了开发和维护所需成本。 三、试验数据分析 选择在一个相对稳定的局域网(192.168.1.网段)内搭建实验环境,这样可以在测定监控系统运行稳定性的同时,通过断开、连接网线的操作,实时模拟测试各种异常情况的发生。这里只给出基本的测试数据。 简单环境构造图示于图2。12下一页友情提醒:,特别! 图2 实时模拟测试环境 其中,以1.171作为监控的服务器,16
6、0、208、211三台主机作为被监控的客户端。当服务器分别收到三个被控端的IP地址,就会以60秒为周期分别对三台服务器进行实时监控;每间隔10分钟做一次统计写日志操作(该时间周期用户可调)。 正常情况下,日志会每隔10分钟记录一次收发总包数和丢包率。为了测试超时中断情况,拔掉192.168.1.160的网线模拟网络中断,再查看日志。 此时,日志文件会记录下每次响应超时的状况,并在该次探测失败时上报告警消息至维护台,然后,统计数据时算出当前1.160服务器的丢包率。监控系统运行时,其它方向的统计信息并未因该方向丢包而受到影响,各个客户端的统计信息是相
7、互独立的。另外,也应该对网内响应时间超过100ms的数据包记录统计(100ms指代网络延时过长的阀值),以供查看整个网络是否处于超负荷工作状态。 在记录当前时间、IP地址和序列号的同时,具体响应时间也被详细列出,以供维护人员定位故障时间和故障的严重程度。 该监控系统已经在A多组组网中,为核心交换网络的底层传输系统提供监控,在工程应用中获得了良好的效果。在给已开发的网络管理系统项目中也使用了该监控方法,对整个网络的底层通信状态进行监控。应用前景及可扩展性都较好。 但是,该方法也存在一定的弊端。如果不能Ping到某台主机,那么,就不能Tel或FTP到
8、那台主机,即网络可能存在问题。随着Inter安全意识的增强,出现了提供访问控制清单的路由器和防
此文档下载收益归作者所有