诊断网络设备异常丢包故障分析

诊断网络设备异常丢包故障分析

ID:43615055

大小:251.00 KB

页数:3页

时间:2019-10-11

诊断网络设备异常丢包故障分析_第1页
诊断网络设备异常丢包故障分析_第2页
诊断网络设备异常丢包故障分析_第3页
资源描述:

《诊断网络设备异常丢包故障分析》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、诊断网络设备异常丢包故障分析案例背景某大型集团公司县公司信息内网PC在访问省公司业务和市公司业务时间歇性出现访问连接非常慢的情况,以及使用内网PC对省公司DNS服务器和市公司官网IP持续ping操作时出现不定时丢包现象,但县公司访问其内部服务器并无故障现象。访问连接慢严重影响信息内网的正常业务交互,尤其是营销部门对省公司收费系统服务器的请求访问。网络拓扑图,如图1:图1某大型企业网络拓扑图将科来网络冋溯分析系统旁路接入到县公司信息内网的核心交换机上,由于故障发生的间歇性需要对县公司到市公司的主干出口流量做长时间捕获。并利用科來网络分析系统不间断的捕获市公司核心交换机与

2、C路由器的下行接口流量。利用对比分析法,在故障发生时段,分别对两处捕获到的流量做精确分析。案例分析一、出口流量分析通过科来网络冋溯分析系统对通讯流量的长时间存储,我们对故障时段的通讯流量进行故障重现。我们在县公司捕获点,对故障时段数据进行冋溯。选择4分钟分析窗口(流量统计精度为1秒),未见突发流量和通讯流量为0的情况。广播与组播流量正常,TCPSYN比值属于正常范围。对该时段的网络应用进行分析,流量占用最大网络应用为:HTTP、未知TCP、HTTPProxy,属正常业务行为。网络应用屮存在CIFS扫描,但该应用的通讯数据包少,对主干链路的传输影响不大,网络安全事件不是

3、造成丢包的原因。对县公司访问关键业务标准应用监控梳理,网络链路传输质量良好,排除链路拥塞造成丢包现彖。但客八端访问10.176.X.X服务器的TCP会话屮存在98次TCP重传,上行重传次数为97次。大量的TCP重传造成会话延迟确认,严重影响会话质量。TCP重传大部分发生在上行,说明丢包位置在县公司到省公司之间。二、TCP会话解码对应用请求的TCP会话进行解码以确定访问延迟的具体原因。选取故障时段,县公司信息内网PC主机10.178.X.X访问10.176.X.X的应用通讯流量,客户端10.178.X.X使用2487端口访问10.176.X.X的TCP80端口,网络链路

4、传输质量良好,无链路拥塞。持续向下分析,我们发现县公司捕获点TCP会话的77号数据包在271ms后对73号数据包Seq4245726722进行了重传,73号数据包己达到县公司信息内网办公核心交换机出口。而同一会话在市公司捕获点客户端10.178.X.X发送的数据包中Seq4245726722的数据包只捕获了一次,该包并未出现在Seq4245725830与Seq4245728182之间,而是间隔200多毫秒后才出现了一次,说明在市公司只捕获到了重传的数据包,客户端10.178.X.X第一次发送的Seq4245726722数据包在县公司到市公司之间被丢弃。我们对两次捕获T

5、CP会话进行对比分析,如图2:图2捕获的两次TCP会话该TCP会话屮存在大量的TCP重传,通过对两处捕包点的TCP会话对比分析,确定造成丢包位置在县公司与市公司之间某一中间件网络设备。整个TCP会话过程中客户端和服务器响应时间未见异常,结合前面对网络链路传输质量的分析,确定县公司对省市公司的业务访问出现间歇性延迟的原因是rtr丁•中间件网络设备对数据包的丢弃造成。三、故障定位根据拓扑图,县公司路由到市公司核心交换机之间需要经过3台路由器进行转发。我们对故障发生时段接入B路由器的其他区县信息内网PC访问省市公司业务系统的TCP会话进行解码分析。三次握手时间7.9ms,网

6、络传输质量良好,未见链路拥塞。TCP会话中未见丢包重传,客户端和服务器响应正常。说明故障时段,只有该县公司信息内网出现访问丢包现彖。因此,故障范围缩小为县公司一>A路由器一>B路由器之间。我们对县公司到B路由的各个路rh接口进行逐一检查,发现A路市器与县公司连接的下行接口光模块在Input方向有大量CRC校验码错误日志。CRC循环冗余校验码错误有三种可能:1、双方网卡工作模式不同;2、链路通道信号衰减严重;3、网卡故障。我们又对县公司至A路由上行接口进行检查,光模块工作模式与对端A路由器相同,排除第一种可能。对县公司与A路由器之间的光纤通道进行衰减测试,通道正常。排除

7、第二种可能。CRC校验码错误日志是在A路由器与县公司的下行接口的Input方向上检查到,说明县公司的路由器的上行接口在对数据包进行CRC循坏兀余校验码封装时出现间歇性故障,导致A路由器下行接口在对数据包进行CRC校验码解码时发现错误。对错误CRC校验码数据包丢弃。四、故障处理将县公司到A路由器的光模块进行更换,恢复通讯--段吋间后,对A路由器下行接口进行检查,CRC循环冗余校验码数值不再增加。对县公司访问省市公司业务系统的TCP会话进行解码,双方通讯交互正常。TCP会话统计信息中无重传和丢包。县公司与省市公司之间的通讯恢复正常。案例结论1、县公司到市

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。