劉玉峰
摘要:當今,越來越多的業務應用運行于網絡架構之上,保障網絡的持續、高效、安全的運行,成為網絡管理者面臨的巨大挑戰。然而,盡管做了周密的部署,配置了嚴格的安全策略,盡管在網絡管理上的投入越來越多,但是網絡的問題還是層出不窮。利用網絡分析技術快速查找問題根源,在網絡出現故障時要做到及時發現網絡故障、準確定位網絡故障并且能及時排除故障就顯得特別重要。
關鍵詞:網絡故障;軟件漏洞;病毒侵入;診斷分析;解決對策
1 前 言
網絡故障(network failure)是指由于硬件的問題、軟件的漏洞、病毒的侵入等引起網絡無法提供正常服務或降低服務質量的狀態。隨著電子政務、企業信息化和電子商務的迅速發展,計算機網絡正在融入社會生活的各個方面。計算機網絡的廣泛應用帶來了許多便利,人們對網絡的穩定運行提出越來越高的要求。但隨之而來的網絡故障也帶來了很多煩惱,輕則影響用戶網絡運行質量,重則導致整個網絡癱瘓,帶來巨大的經濟損失。網絡故障是指硬件的問題、軟件的漏洞、病毒的侵入等可以引起網絡的故障。網絡故障帶來了很多煩惱,輕則影響用戶網絡運行質量,重則導致整個網絡癱瘓,帶來巨大的經濟損失。在網絡出現故障時要做到及時發現網絡故障、準確定位網絡故障并且能及時排除故障就顯得特別重要。
2 按照網絡故障不同性質
2.1物理故障
指的是設備或線路損壞、插頭松動、線路受到嚴重電磁干擾等情況。例如,網絡管理人員發現網絡某條線路突然中斷,首先用ping或fping檢查線路在網管中心這邊是否連通。ping的格式為:ping 192.168.0.1(192.168.0.1是ip地址,可以是主機的ip也可以是網絡中另一臺計算機的ip)。ping一般一次只能檢測到一端到另一端的連通性,而不能一次檢測一端到多端的連通性,但fping一次就可以ping多個ip地址,比如c類的整個網段地址等。順便多說一句,網絡管理員經常發現有人依次掃描本網的大量ip地址,不一定就是有黑客攻擊,fping也可以做到。如果連續幾次ping都出現"requst time out"信息,表明網絡不通。這時去檢查端口插頭是否松動,或者網絡插頭誤接,這種情況經常是沒有搞清楚網絡插頭規范或者沒有弄清網絡拓撲規劃的情況下導致的。另一種情況,比如兩個路由器router直接連接,這時應該讓一臺路由器的出口連接另一臺路由器的入口,而這臺路由器的入口連接另一路由器的出口才行。當然,集線器hub、交換機、多路復用器也必須連接正確,否則也會導致網絡中斷。
2.2邏輯故障
邏輯故障中最常見的情況就是配置錯誤,就是指因為網絡設備的配置原因而導致的網絡異常或故障。配置錯誤可能是路由器端口參數設定有誤,或路由器路由配置錯誤以至于路由循環或找不到遠端地址,或者是路由掩碼設置錯誤等。比如,同樣是網絡中的線路故障,該線路沒有流量,但又可以ping通線路的兩端端口,這時就很有可能是路由配置錯誤了。遇到這種情況,我們通常用“路由跟蹤程序”就是traceroute,它和ping類似,最大的區別在于traceroute是把端到端的線路按線路所經過的路由器分成多段,然后以每段返回響應與延遲。如果發現在traceroute的結果中某一段之后,兩個ip地址循環出現,這時,一般就是線路遠端把端口路由又指向了線路的近端,導致ip包在該線路上來回反復傳遞。幸好traceroute可以檢測到哪個路由器之前都能正常響應,到哪個路由器就不能正常響應了。這時只需更改遠端路由器端口配置,就能恢復線路正常了。邏輯故障的另一類就是一些重要進程或端口關閉,以及系統的負載過高。比如也是線路中斷,沒有流量,用ping發現線路端口不通,檢查發現該端口處于down的狀態,這就說明該端口已經關閉,因此導致故障。這時只需重新啟動該端口,就可以恢復線路的連通了。還有一種常見情況是路由器的負載過高,表現為路由器cpu溫度太高、cpu利用率太高,以及內存剩余太少等,如果因此影響網絡服務質量,最直接也是最好的辦法就是——更換路由器。
2.3能訪問服務器
要先測試一下這一故障是否只影響一臺工作站,這可以通過其他工作站訪問服務器來證實。如果有類似故障的工作站出現在同一網段或連接在同一交換機上,那么就要分析這一網段子網掩碼是否設置正確,交換機是否正常工作。除此之外,還要看一下服務器是否禁止了這一網段工作站的服務。
3 按照網絡故障不同對象
3.1線路故障
線路故障最常見的情況就是線路不通,診斷這種情況首先檢查該線路上流量是否還存在,然后用ping檢查線路遠端的路由器端口能否響應,用traceroute檢查路由器配置是否正確,找出問題逐個解決。
3.2路由器故障
線路故障中很多情況都涉及到路由器,因此也可以把一些線路故障歸結為路由器故障。檢測這種故障,需要利用mib變量瀏覽器,用它收集路由器的路由表、端口流量數據、計費數據、路由器cpu的溫度、負載以及路由器的內存余量等數據,通常情況下網絡管理系統有專門的管理進程不斷地檢測路由器的關鍵數據,并及時給出報警。而路由器cpu利用率過高和路由器內存余量太小都將直接影響到網絡服務的質量。解決這種故障,只有對路由器進行升級、擴大內存等,或者重新規劃網絡拓撲結構。
3.3主機故障
主機故障常見的現象就是主機的配置不當。包括主機配置的IP地址與其他主機沖突,或IP地址根本就不在于網絡范圍內,這將導致該主機不能連通。發生類似的情況,可通過查看網絡鄰居屬性中的連接屬性窗口,檢查TCP/IP選項參數是否符合要求,包括IP地址、子網掩碼、網關和DNS參數,對錯誤的設置進行修復。主機安全性故障 主機主機性故障包括主機資源被盜和黑客入侵。對于主機資源要注意不要輕易地共享本機硬盤;對于主機被黑客 控制的故障可以通過監視主機的流量、掃描主機端口和服務,安裝防火墻和加補系統補丁來防止可能的漏洞。
參考文獻
[1]范慧霞,楊靜,鄭喜珍. 局域網常見故障分析及解決方法[J]. 科技信息(學術研究). 2017(32)
[2]崔凱. 智能型網絡故障診斷系統研究[J]. 河南教育學院學報(自然科學版). 2013(03)
(作者單位:勝中管理中心)