網絡丟包,看這一篇文章就夠

點擊上方網絡技術交流選擇「設為星標」

一手資訊及時查看

假設,你去 Ping ⼀個網站,如果能 Ping 通,且網站返回信息全⾯,則說明與網站服務器的通信是暢通的;

如果 Ping 不通,或者⽹站返回的信息不全等,則很可能是數據被丟包瞭。

網絡丟包最常見的就是水晶頭氧化,網卡適配器損壞,網線環路,光衰過大等原因。

當網絡有問題,首先我們會進行ping命令測試是否丟包,用過的人都知道,可以使用命令:ping -t 192.168.16.1或者ping 192.168.16.1。

但是丟包的原因其實很多,定位問題又難倒瞭不少萌新。今天分享一些常見的丟包故障定位⽅法,希望能讓你遇到丟包莫慌

01

什麼是網絡丟包

說明網絡丟包之前,你需要瞭解的是收發包的原理。

數據在 Internet 上是以數據包為單位傳輸的,單位為字節,數據在網絡上傳輸,受網絡設備,網絡質量等原因的影響,使得接收到的數據小於發送出去的數據,造成丟包。

瞭解瞭收發包的原理,可以瞭解到丟包原因主要會涉及⽹卡設備、⽹卡驅動、內核協議棧三⼤類。

在文章開頭說到一點,網絡丟包是在使用Ping對目的站進行詢問時,數據包由於各種原因在信道中丟失的現象。

Ping命令使用瞭ICMP回送請求與回送回答報文。

ICMP回送請求報文是主機或路由器向一個特定的目的主機發出的詢問,收到此報文的機器必須給源主機發送ICMP回送回答報文。

這種詢問報文,是用來測試目的站是否可到達以及瞭解其狀態。

需要指出的是,Ping命令是直接使用網絡層ICMP協議的一個例子,它沒有通過運輸層的UDP或TCP協議。

網絡丟包是網絡中常見的故障之一,它會引起網速降低甚至造成網絡中斷。

發生網絡故障在所難免,但是如何快速隔離和排除故障是網絡工程師應該具備的基本素質。

02

常見的丟包故障現象+處理方法

01 網絡數據包發送時通時斷,丟包嚴重

【故障現象】

通常故障發生時,該方向網絡出現震蕩性中斷。使用Ping命令測試,發現在一段時間內數據包發送延時比正常值略高,間隔一小段時間數據包又全部丟失,丟包率超過60%,丟包曲線成規則狀,網絡服務基本不可用。

【故障分析】

在局域網中引起網絡發生振蕩性時斷時通,一般可能是由於互連的交換機中的某兩個交換機間出現瞭環路,或者某個交換機的兩個端口直接相連。

這樣就會造成局域網的生成樹協議構建失敗,不斷重復檢查並試圖構建新的生成樹網絡,從而導致網絡振蕩性通斷。

同時,伴隨著交換機間不斷重復地發送廣播包,就會形成“廣播風暴”,使交換機負擔過重,網絡傳輸通道嚴重被堵塞,無法正常的處理通信數據。

環路雖然可能出現在某個接入交換機上,但會影響整個以三層交換機為核心的局域網的穩定運行。

【故障處理】

當發現網絡數據包發送時通時斷,丟包嚴重,特別是整個單位或整個樓層出現振蕩性中斷現象時,則可以判定應該是該單位的某個交換機上出現瞭環路所致。

作為網絡管理人員應首先查看各接入交換機的指示燈閃爍狀態,通常出現環路狀況會指示燈會急速閃爍,次數每秒4次以上,所環交換機更為突出。

逐個撥出交換機級聯接入網線,同時實時監控交換機狀態,在撥下某端口網線後,交換機指示燈恢復正常狀態,再進一步查找,會發現該連接線的末端有線路形成環路,清理該網線後,網絡恢復暢通。

02 網絡數據包發送超時現象嚴重,時有不規則丟包

【故障現象】

網絡突然出現嚴重堵塞,日常辦公程序不能正常運行,打開網頁速度緩慢,有時會因超時而中斷。未發現網絡設備有任何問題,該網絡中有幾臺計算機在入網後速度明顯變慢,在禁用網卡或者中斷網絡後恢復正常。

【故障分析】

首先,在一臺用戶終端上ping網關測試,結果可以ping通網關,但是數據包發送超時現象嚴重,丟包率30%左右,丟包不規律。

其次,登陸用戶交換機,運行arp -a命令,發現網關IP和網關MAC地址指向正確。

通過上面的測試基本排除網絡設置錯誤以及ARP欺騙,丟包表現瞭一定的隨機性而沒有連續性和振蕩性的通斷,基本排除網絡環路問題,初步判斷這種現象可能是病毒攻擊等引起的。

為此,需要進一步獲取ARP信息、網絡中傳輸的原始數據包等信息。

再次,部署抓包分析。在該交換機上配置鏡像端口,並將維護終端接到此端口上,啟動網絡協議分析工具(sniffer)捕獲分析網絡的數據通信,約10分鐘後停止。

在網絡分析系統主界面左邊的節點瀏覽器中發現,網絡中可能存在偽造IP地址攻擊或自動掃描攻擊。

選擇連接視圖,發現在10分鐘內,網絡中共發起瞭12000多個連接,且狀態大多都是客戶端請求同步。

據此,斷定網絡中存在自動掃描攻擊。

最後,詳細查看連接信息,發現這些連接大多都是由同一主機發起,選中任意一個連接,選擇數據包視圖,查看傳輸數據的原始解碼信息,發現這臺計算機正在主動對網絡中其它主機的TCP 445端口進行掃描攻擊,可能是主機感染病毒程序,或者有人正使用掃描軟件。通過分析圖表視圖,進一步確定主機肯定存在自動掃描攻擊。

【故障處理】

找到問題根源後,對主機進行隔離,經過一段時間的測試,網絡丟包現象有所緩解,但沒有從根本上解決問題。

於是再次啟動網絡協議分析系統捕獲並分析,又發現瞭1臺相似情況的主機。據此基本可以斷定兩臺主機都是感染瞭病毒,且該病毒會主動掃描網絡中其他主機是否打開TCP 445端口,如果某主機打開該端口,就攻擊並感染這臺主機。

如此循環,即引發瞭上述的網絡故障。立即對新發現感染病毒的兩臺主機進行物理隔離,網絡通信立刻恢復正常,再對該終端進行殺毒處理。

03 網絡數據包發生嚴重延時現象,下載、瀏覽等服務不能正常使用

【故障現象】

局域網內部日常數據共享正常,但是出局瀏覽外網和下載數據時速度明顯降低,使用Ping命令發現到某個方向網絡時延特別大,甚至有少量丟包現象。

【故障分析】

一般通過telnet遠程登陸到該方向的交換機,以華為系列交換機為例,輸入下列命令:

#Display cpu查看交換機CPU利用率

#Display memory查看內存利用率

發現兩者都非常高,再通過輸入命令#Display interface端口號,檢查各端口下的數據流。

對其數據流進行抓包分析,發現多線程指向某網站電影欄目,為避免影響整個網絡的暢通,對所接入交換機進行處理。

發現其中的兩個端口數據流量特別大,遠高於正常使用的網絡流量。對其數據流進行抓包分析,發現多線程指向某網站電影欄目,為避免影響整個網絡的暢通,對所接入交換機進行處理。

【故障處理】

進入該端口配置界面下,輸入Shutdown命令,強制關閉該端口使其斷網,聯系該終端使用人員,令其終止下載進程後,再恢復其網絡。

寫在最後:

最後想補充一點,很多網工用Ping命令來檢測丟包情況,但其實除瞭Ping,常用的tracert,nslookup 都可以用來判斷主機的網絡連通性。

而且 Linux 下有一個更好用的網絡聯通性判斷工具,它可以結合ping nslookup traceroute 來判斷網絡的相關特性,這個命令就是 mtr。

mtr 全稱 my traceroute,是一個把 ping 和 traceroute 合並到一個程序的網絡診斷工具。

traceroute 默認使用 UDP 數據包探測,而 mtr 默認使用 ICMP 報文探測,ICMP 在某些路由節點的優先級要比其他數據包低,所以測試得到的數據可能低於實際情況。

重磅!網絡技術交流圈-技術交流群已成立

掃碼可添加小編微信,申請進群。

一定要備註:工種+地點+學校/公司+昵稱(如網絡工程師+南京+蘇寧+豬八戒),根據格式備註,可更快被通過且邀請進群

華為配置命令手冊大全

2023新年新開始!

思科、華為、H3C交換機巡檢命令大全

赞(0)