电信宽带机房故障(宽带电信设备异常)

【电信宽带机房故障(宽带电信设备异常)】分享给互联网从爱好者学习参考。

2020年6月,公司迁至现址办公。在机房调试Cisco 4506E三层交换后,发现ping外网地址有数据包丢失,但不太严重,在可接受范围内。

但门禁系统和监控系统的部分设备连接到内网的交换机上,客户的WIFI系统与内网共用一个互联网专线出口。网元多,网络拓扑复杂,不急于排查隐患。

今年9月报修线路故障,电信运维工程师上门测量光损值在正常范围,笔记本单机测试5分钟数据包正常。聊天中,我提出了ping外网更改数据包的问题。工程师说他只负责光纤收发器出来的那段时间。可能是你自己要解决内网的问题,所以你匆匆忙忙的摆平了工单,赶去下一个。

今年10月份,我发现数据下降严重的时候,下降率达到了2%,影响了公司的业务系统。我暗暗下定决心要把问题找出来,彻底解决!

思考解决问题:

一、掌握包分析(最小化原则:断开各系统,分别分析)

第二,分析确定故障点。

三。解决方法

一、掌握数据包分析

1.内部网分析:

笔记本电脑上安装了Wireshark,在内网中捕获了约10000个数据包,但数据包中没有发现异常。

2.客户wifi系统分析:接入客户WIFI系统,在抓包中发现ARP告警异常。

客户端WIFI系统的网络拓扑是主路由h3cer8300

客户WIFI网络拓扑

线路或AP问题还是用户接入终端设备问题?我不确定。

只能最小化。单独对各层进行抓包分析后发现,只要在路由器上收到,就会出现ARP告警。

几经沉浮,在路由器上的“ARP安全”中启用“ARP保护”后,ARP告警异常得到解决,但外网丢包问题依然存在。

ARP安全保护

3.门禁系统及监控系统分析:抢包未发现异常。

转了一圈,问题又回到原点,换个方向查。

假设全网丢包是内网某个设备问题造成的,如果我用笔记本电脑(ping内网设备(三层交换机B,上网行为管理C),公网电信网的ip网关(D)和百度、163、qq等几个入口,同时,内外网都会有丢包;

另一方面,如果ping网络中的设备(B,C)没有丢包,网关(D)和外网有数据丢失,说明问题不在内网,而是来自WAN口端。

第二,分析确定故障点。

经过长时间连续ping测试,验证终端设备到三层交换机和互联网行为管理没有丢包,但是从电信网关和广域网有丢包。确认故障点来自广域网端口侧。

拿起电话,兴高采烈地拨打中国电信光纤专线报残。连接后报光纤接入号,等运维工程师过来处理。

PING测试

三。解决方法

打完电话半小时后,运维工程师接了,上午10点半左右上门,这期间我的笔记本电脑还在ping。

运维工程师上门后,挂了他的反馈电话,包也没丢。运维工程师回复先观察几个小时,下午还在这一带。有问题再来。

出门后,运维工程师微信给我发消息,告诉我电信室重做了数据,给我发了工单截图。

一看就发现这是电信路由策略的锅。新策略取消ICMP,如果启用了uRPF,我也不会失去它....................................................................................................................................

电信故障工单

调整电信路由策略后的Ping值

这个持续了一年多的网络异常已经彻底解决。

电信宽带机房故障(宽带电信设备异常)