欢迎来到天天文库
浏览记录
ID:37906299
大小:767.81 KB
页数:32页
时间:2019-06-02
《疑难故障解决实例》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库。
1、目录ping大包丢包故障在线视频不定时异常中断故障ping大包丢包故障故障环境故障现象故障分析故障解决技巧小结故障环境说明:1、办公机器都属于10.12.128.0/24网段;2、办公机器通过一个二层的接入交换机、光电转换器接入集团核心交换机。连接拓扑:故障现象Ping大包丢包严重ping小包正常前期使用单机ping大包未出现丢包现象故障前期简单分析链路测试、策略检查均无异常,该故障非一般连通性故障此类丢包问题,主要是需要定位出丢包的位置可能故障点主要有:故障分析-分析方法数据包分析法对比分析法在此次的故障
2、解决过程中,我们主要使用对比分析法分析出将大数据包丢弃的中间设备或链路。主要通过专有的网络分析工具(科来网络分析系统)将故障时相应的数据包捕获下来进行深度分析,并通过分析发现相应的异常,从而定位故障原因的方法主要指通过对网络中传输的数据包的对比,分析出数据包在传输过程中各个中间设备对数据包的相应处理过程,包括更改、丢弃和转发等故障分析过程-选取抓包故障点在实际的分析过程中,我们需要考虑到抓包的方便性和相应中间设备的功能特性选取数据包捕获点在这个故障环境下,我们主要选在接入交换机与核心交换机上抓取数据包故障分
3、析过程-重现故障在测试机器10.12.128.66上使用如下命令测试网络的大包传输情况:ping10.1.10.9-l10000–t。我们可以简单计算一下ping10000字节的大包在以太网中会被分成多少个分片:PING产生的IP负载=10000(ping负载)+8(icmp头长度)一个以太网IP包的最大有效负载=1500(以太网MTU)-20(IP包头长度)=1480B产生IP分片数的计算方式为:10008/1480=6余1128,即一个1500B的icmp报文,5个1500B的ip分片包,1个1148B
4、的ip分片包通过该测试命令重现了故障现象:大文件传输丢包情况较为严重。故障分析过程-抓包我们分别在核心交换机6509、接入交换机上做端口镜像(端口镜像的详细命令和过程在此不再描述),将其相应链路的数据包镜像到我们选取的监听口,我们再通过科来网络分析系统捕获相应的数据包故障分析过程-对比分析1.分析接入交换机上抓取的数据包1个1500字节icmp包5个1500字节ip分片包1个1148字节ip分片包接入交换机数据包分析结论Ping超时的原因为中间某个大包在传输的过程中被丢弃了,导致接收端重组超时接入交换机转发
5、了所有的分片包,即某个分片包不是在接入交换机上丢弃的1个1500字节icmp包4个1500字节ip分片包故障分析过程-对比分析2.分析核心交换机6509上抓取的数据包1个1148字节ip分片包结论:这个被丢弃的某个分片在到达核心交换机6509前就被丢弃对比分析结果根据前面的对比分析,结合拓扑结构,我们可以知道,某个分片包是在接入交交换机转发之后、核心交换机6509接收之前被丢弃的,那么可能被丢弃的位置只剩下光电转换器了!故障解决使用替换法,将接入交换机端的光电转换器更换为一个全新的光电转换器,测试一切正常技
6、巧小结定位可能故障点数据包分析法对比分析法使用到的知识点:分片计算icmp重组超时在线视频不定时异常中断故障环境故障现象故障分析故障解决技巧小结故障环境故障拓扑:说明:1.VOD在线视频是通过web页面观看的,通讯流全部使用HTTP的80端口传输数据2.客户端与服务器是纯路由环境下完成数据交互的故障现象客户端通过浏览器在线观看VOD视频时,不定时(有时几分钟、有时十几分钟,没有规律)的出现中断情况。使用ping命令长时间测试VOD服务器的连通性,一直正常。异常时,VOD服务器的web页面访问正常前期简单分析
7、Ping命令测试正常,说明不存在连通性问题不定时出现、无规律性说明应该不是策略(时间控制等)原因导致的其他应用未反应异常通过简单分析,没有什么明显的突破口,此类故障应属于较高层次的故障,只能借助科来抓包分析来找突破口了客户端抓包分析可能原因首先在客户端在线视频时,开启科来抓包,在故障出现后停止抓包,并分析故障时间段的数据包,看能否找到一些突破口。一般而言,这种应用都是服务器向客户端传输数据,而客户端仅对服务器端发送确认即可,这种确认不包含任何的数据,其大小在填充完后只有64B而在故障发生时,我们竟然发现了客
8、户端向服务器发送的大小为70B的ackTCP选项字段导致的70B的ackTCP选项解码1.选项字段解码,显示为客户端使用的为SACK选项,其左右边边界都已表示出2.科来抓包显示客户端多次向服务器发送带SACK选项的ACK包3.通过科来解码,显示SACK左左边界内容一致4.显示客户端没有收到来自服务器的某个数据段服务器端抓包确认问题原因1.查看服务器端是否收到客户端的带有SACK选项的ACK报文2.查看服务器端是否
此文档下载收益归作者所有