孫海虹 張建強 馮旭 李選
摘?要:當今互聯網在生活中占有重要地位,而局域網則是保證互聯網信息穩定傳輸的前提,但在使用過程中也存在許多問題。本文利用局域網TCP/IP協議網絡各層相互獨立的特征,提出在網絡故障診斷過程中使用分層法可快速、準確定位故障點,提高故障排查的效率,確保局域網網絡穩定、可靠、安全地運行。
關鍵詞:分層法;局域網;網絡故障;故障診斷
現代互聯網生活中,局域網作為大多數政府機關、企事業單位信息化辦公的重要組成部分,具有舉足輕重的地位,然而網絡隨時都可能發生故障,因此必須掌握相應的技術排除故障,確保各類突發事件能夠及時、正確、果斷的處置。
1?分層法排除網絡故障流程
在局域網絡故障排查中,可利用分層法快速、準確定位故障點。即接到故障申告后盡可能地向故障申告方收集故障信息,按照網絡拓撲結構加以分析,追本溯源,初步定位可能發生故障的范圍,在后期故障探測時重點關注。首先測試網絡層是否正常,若不正常接下來檢測接入層;若測試正常,那么接下來檢測應用層和傳輸層,查看應用軟件程序的配置信息,以及網絡傳輸設備是否存在故障[1]。分層法排除局域網網絡故障流程如下圖所示。
分層法排除局域網網絡故障流程圖
2?分層法排除局域網網絡故障分析
故障排除時按照分層法逐一關注網絡層、接入層和傳輸層有無故障現象。
網絡層提供了兩個端點之間的數據通信,包括路徑選擇、擁塞控制、傳輸確認與中斷等。網絡層故障診斷的基本方法是:采用tracert命令檢驗數據包,對照查看路由表,檢查路由器接口地址,若下一跳地址或目的地址沒有在路由表中出現,則要確定是否已輸入靜態路由、默認路由或動態路由;否則必須重新添加丟失的路由信息,或者檢查動態路由選擇是否出現故障,包括RIP或者IGRP路由協議故障[2]。
接入層包括從服務器或工作站到數據接口的線纜,作為介質,包含數據接口、信息插座模塊、信息插頭模塊、集線器或交換機的各條連接的物理接口[1]。該層實現系統和通信媒體節點之間數據的打包和解包、差錯檢測、校正的透明傳輸。接入層網絡故障包括:物理連接故障、硬件和線路故障、設備接口配置故障。
傳輸層是對應用層數據添加必要的控制信息,在源節點和目的節點兩個進程實體間提供端到端的數據傳輸[3]。出現故障大多與路由器端口配置錯誤和訪問控制列表不正確有關。在傳輸層,可利用許多實用程序來協助故障排查。如使用Netstat命令和Tcpdump命令等。
3?分層法排除局域網網絡故障實例
3.1?實例1
故障現象:某控制大廳網絡化視頻雙流中PPT出現馬賽克,甚至雙流掉線,導致網絡化視頻無法正常運行。
故障分析:按照分層法第一步檢查網絡層。一是重啟設備,查看視頻會議系統連接某基層方向的音視頻及雙流中的PPT是否出現延遲、馬賽克、甚至掉線故障;二是通過系統監控軟件核查該基層終端網絡是否存在問題;三是用比較大的包如6000字節ping出現故障的基層視頻會議終端地址,查看是否存在丟包或者丟包率較高的現象。
ping對端ip地址l?6000t
Pinging?ip?with?6000?bytes?of?data:
Reply?from?ip:bytes=6000?time=8ms?TTL=61
Request?timed?out.
……
如上信息所示出現多條Request?timed?out,表示該條線路存在網絡丟包情況,再查看如下所示結果:
Ping?statistics?for對端ip地址
Packets:Sent=20,Received=12,Lost=8(40%loss)
第二步檢查從總部MCU到出現故障的基層終端的網絡線路是否存在問題,丟包現象說明從MCU到基層視頻終端每一個網絡節點都有丟包的可能性,需要排查從MCU到本級交換機、路由器、基層路由器、基層交換機、基層視頻終端這些環節[4]。采用tracert命令檢驗數據包通過路徑:
Tracing?route?to?ip?over?a?maximum?of?30?hops
1?<1ms?4ms?4ms?ip地址1
2?2ms?2ms?2ms?ip地址2
……
6?*?*?*?Request?timed?out.
由上顯示經過幾個環節到達對端路由器內部,但未到達終端,說明故障在基層內部局域網。
第三步從基層終端ping路由器內部地址,觀察ping信息,發現產生振蕩性時斷時通現象?;究梢耘袛酁榫W絡線路中其中兩個或多個交換機間出現環路,形成“廣播風暴”,使網絡線路通信數據處理速度受限,網絡傳輸信道擁塞,交換機數據處理異常,導致網絡出現時斷時通現象。
故障處理:檢查各級交換機指示燈閃爍狀態是否正常,如果指示燈閃爍次數在每秒4次以上,則可判斷出現故障。依次檢查并去掉交換機級聯網線,實時監控交換機端口指示燈狀態,如果某端口網線拔掉后,指示燈恢復正常,繼續檢查,發現該網線的末端有網線形成環路,拆除該網線,網絡恢復,網絡化視頻正常進行。
3.2?實例2
故障現象:指揮大廳綜合終端席位收不到基層運行數據。
故障分析:第一步檢查網絡層。Ping?127.0.0.1,發現工作正常,說明席位終端系統網絡適配器和驅動程序工作正常。Ping該本單位服務器及總部服務器,沒有丟包現象,說明網絡層正常。用Show?Interface命令檢查所經過的交換機的配置,查看交換機與席位終端連接的接口參數及運行情況,物理層狀態運行未發現異常。
在本級服務器終端抓包:
Tcpdumpxs?200?src?ip?and?poor?4001
No?suitable?device?founf
顯示未截獲從總部服務器傳送的端口號為4001的數據包
Tcpdumpxs?200?dst?ip?and?poor?4001
No?suitable?device?founf
顯示未截獲發送到基層服務器傳送的端口號為4001的數據包
第二步檢查應用層。主要排查服務器和席位終端運行狀態、測試應用程序以及相關應用程序的配置。網絡頁面可以打開,說明應用平臺運行正常,只是沒有該基層數據。詢問外單位,系統其他基層單位運行正常,相關應用程序沒有問題。
第三步檢查傳輸層。檢查基層防火墻與本席位有關的配置策略信息。發現協議訪問控制中信息化系統總部服務器與終端席位ip地址點對點臨時通道服務未開放,從而導致該席位無法收到基層數據包。
故障處理:登錄本級防火墻配置頁面,進入“協議訪問控制”,打開“臨時通道”,雙向添加總部服務器與基層終端席位ip地址、協議。登錄綜合終端,運行正常,基層傳輸數據正常,故障排除。
3.2?實例3
故障現象:本單位一終端申告該終端無法登錄單位信息網OA辦公系統。
故障分析:第一步檢查網絡層。首先由網管終端ping該故障終端IP地址,網絡層不通。其次在故障終端輸入ipconfig/all,顯示本機TCP/IP網絡配置情況,檢查IP地址、子網掩碼、網關、DNS服務器地址均正常。再次在該終端Ping本機地址:127.0.0.1,顯示正常,說明該終端系統網絡適配器和驅動程序工作正常。
第二步檢查物理層、數據鏈路層。首先檢查故障終端電源及網卡接口,連接正常。其次檢查該終端安全U盾,證書信息正常,在使用期內,可以保障安全上網。再次檢查與該終端連接的交換機端口,發現交換機綁定的該終端端口指示燈不亮,檢查交換機配置文件,信息正常,沒有丟失,說明交換機正常,那么只能說明故障為該網絡線路不通。使用測線儀檢測故障終端和交換機之間網線質量,發現測線儀指示燈有幾個不亮。測試配線架接入端口到交換機的網線狀態,線路正常。測試配線架接入端口到終端的網線狀態,線路故障,大致可以判斷故障原因可能出現在配線架。最后在網絡配線架機柜排查,發現機柜有移動的痕跡,檢查配線架背后的打線夾,發現有幾處網線松脫。
故障處理:在配線架背面用打線刀把故障網線壓接入打線夾并剪切好,重新測試網線斷通情況,網絡恢復正常,故障排除。
4?結語
在故障處理的實例中,彰顯了分層法排除局域網網絡故障的巨大優勢,該方法能夠快速縮小故障查找范圍,準確定位故障點,思路清晰,大大提高了網絡故障診斷的效率,希望對其他網絡運維人員有所幫助和參考作用。
參考文獻:
[1]朱云鵬,陳卓.基于層次分析法的網絡故障診斷技術研究[J].網絡安全技術與應用,2007,(07):3032.
[2]裴祥.網絡常見故障診斷及排除[J].技術與市場,2010,(08):2324.
[3]金霈,李德有.如何根據數據在TCPIP模型中的傳遞方式排查網絡故障[J].職業,2011,(14):136137.
[4]張建中,周若.省級氣象視頻會商網絡故障分析[J].計算技術與自動化,2014,(01):104107.
作者簡介:孫海虹(1973—?),女,漢族,碩士,工程師,研究方向:網絡安全。