【电信宽带机房故障(宽带电信设备异常)】分享给互联网从爱好者学习参考。
2020年6月,公司迁至现址办公。在机房调试Cisco 4506E三层交换后,发现ping外网地址有数据包丢失,但不太严重,在可接受范围内。
但门禁系统和监控系统的部分设备连接到内网的交换机上,客户的WIFI系统与内网共用一个互联网专线出口。网元多,网络拓扑复杂,不急于排查隐患。
今年9月报修线路故障,电信运维工程师上门测量光损值在正常范围,笔记本单机测试5分钟数据包正常。聊天中,我提出了ping外网更改数据包的问题。工程师说他只负责光纤收发器出来的那段时间。可能是你自己要解决内网的问题,所以你匆匆忙忙的摆平了工单,赶去下一个。
今年10月份,我发现数据下降严重的时候,下降率达到了2%,影响了公司的业务系统。我暗暗下定决心要把问题找出来,彻底解决!
思考解决问题:
一、掌握包分析(最小化原则:断开各系统,分别分析)
第二,分析确定故障点。
三。解决方法
一、掌握数据包分析
1.内部网分析:
笔记本电脑上安装了Wireshark,在内网中捕获了约10000个数据包,但数据包中没有发现异常。
2.客户wifi系统分析:接入客户WIFI系统,在抓包中发现ARP告警异常。
客户端WIFI系统的网络拓扑是主路由h3cer8300
客户WIFI网络拓扑
线路或AP问题还是用户接入终端设备问题?我不确定。
只能最小化。单独对各层进行抓包分析后发现,只要在路由器上收到,就会出现ARP告警。
几经沉浮,在路由器上的“ARP安全”中启用“ARP保护”后,ARP告警异常得到解决,但外网丢包问题依然存在。
ARP安全保护
3.门禁系统及监控系统分析:抢包未发现异常。
转了一圈,问题又回到原点,换个方向查。
假设全网丢包是内网某个设备问题造成的,如果我用笔记本电脑(ping内网设备(三层交换机B,上网行为管理C),公网电信网的ip网关(D)和百度、163、qq等几个入口,同时,内外网都会有丢包;
另一方面,如果ping网络中的设备(B,C)没有丢包,网关(D)和外网有数据丢失,说明问题不在内网,而是来自WAN口端。
第二,分析确定故障点。
经过长时间连续ping测试,验证终端设备到三层交换机和互联网行为管理没有丢包,但是从电信网关和广域网有丢包。确认故障点来自广域网端口侧。
拿起电话,兴高采烈地拨打中国电信光纤专线报残。连接后报光纤接入号,等运维工程师过来处理。
PING测试
三。解决方法
打完电话半小时后,运维工程师接了,上午10点半左右上门,这期间我的笔记本电脑还在ping。
运维工程师上门后,挂了他的反馈电话,包也没丢。运维工程师回复先观察几个小时,下午还在这一带。有问题再来。
出门后,运维工程师微信给我发消息,告诉我电信室重做了数据,给我发了工单截图。
一看就发现这是电信路由策略的锅。新策略取消ICMP,如果启用了uRPF,我也不会失去它....................................................................................................................................
电信故障工单
调整电信路由策略后的Ping值
这个持续了一年多的网络异常已经彻底解决。