摘要:該文對(duì)網(wǎng)絡(luò)的故障進(jìn)行了分類,提出了解決網(wǎng)絡(luò)故障的一般步驟,常用工具,并對(duì)常見(jiàn)網(wǎng)絡(luò)故障進(jìn)行了診斷和處理。
關(guān)鍵詞:計(jì)算機(jī)網(wǎng)絡(luò)故障;步驟;工具;維護(hù)
中圖分類號(hào):TP393文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2009)26-7362-02
Failure and Maintenance of Computer Networks
LUO Xiu-di
(The State Administration of Radio Film and Television Station 751, Shaowu 354011, China)
Abstract: The failure of computer networks have been classified in a computer network failure put forward for resolving the general steps, common tools, as well as common computer network fault diagnosis and treatment.
Key words: computer network failure; steps; tools; maintenance
隨著電子政務(wù)、企業(yè)信息化和電子商務(wù)的迅速發(fā)展,計(jì)算機(jī)網(wǎng)絡(luò)正在融人社會(huì)生活的各個(gè)方面。計(jì)算機(jī)網(wǎng)絡(luò)的廣泛應(yīng)用帶來(lái)了許多便利,人們對(duì)網(wǎng)絡(luò)的穩(wěn)定運(yùn)行提出越來(lái)越高的要求。但隨之而來(lái)的網(wǎng)絡(luò)故障也帶來(lái)了很多煩惱,輕則影響用戶網(wǎng)絡(luò)運(yùn)行質(zhì)量,重則導(dǎo)致整個(gè)網(wǎng)絡(luò)癱瘓,帶來(lái)巨大的經(jīng)濟(jì)損失。在網(wǎng)絡(luò)出現(xiàn)故障時(shí)要做到及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)故障、準(zhǔn)確定位網(wǎng)絡(luò)故障并且能及時(shí)排除故障就顯得特別重要。
1 網(wǎng)絡(luò)故障的分類
計(jì)算機(jī)網(wǎng)絡(luò)按不同的方法可以分為許多種類[1],下面介紹常見(jiàn)的三種分類方法。
1.1 按故障性質(zhì)分類
以網(wǎng)絡(luò)故障的性質(zhì)可分為物理故障和邏輯故障。物理故障也稱為硬件故障,一般指的是設(shè)備或線路損壞、插頭松動(dòng)、線路受到嚴(yán)重電磁干擾等情況,或?yàn)槿藶槭韬鰧?dǎo)致網(wǎng)絡(luò)連接錯(cuò)誤等現(xiàn)象。此類故障所引起的故障表現(xiàn)通常是時(shí)斷時(shí)續(xù)或網(wǎng)絡(luò)完全斷開(kāi)。
邏輯故障也稱為軟件故障,主要是軟件安裝或配置錯(cuò)誤引起的網(wǎng)絡(luò)異常或故障,相對(duì)來(lái)說(shuō)比硬件故障要復(fù)雜得多。主要是網(wǎng)卡驅(qū)動(dòng)問(wèn)題、網(wǎng)絡(luò)協(xié)議問(wèn)題、IP地址沖突問(wèn)題等。通常表現(xiàn)為無(wú)法瀏覽網(wǎng)頁(yè)、時(shí)斷時(shí)續(xù)、網(wǎng)速緩慢等。
1.2 按TCP/IP模型分類
TCP/IP協(xié)議將網(wǎng)絡(luò)分為四層,分別是網(wǎng)絡(luò)接入層,網(wǎng)絡(luò)層,傳輸層和應(yīng)用層。各層中的主要故障劃分為網(wǎng)絡(luò)接入層故障、網(wǎng)絡(luò)層故障、傳輸層故障和應(yīng)用層故障。
1.3 按覆蓋范圍分類
按照網(wǎng)絡(luò)故障覆蓋的區(qū)域劃分,可分為小范圍故障、網(wǎng)段內(nèi)故障、局域網(wǎng)故障和廣域網(wǎng)連接故障等。
2 網(wǎng)絡(luò)故障診斷和排除的一般步驟
網(wǎng)絡(luò)故障診斷以網(wǎng)絡(luò)原理、網(wǎng)絡(luò)配置和網(wǎng)絡(luò)運(yùn)行的知識(shí)為基礎(chǔ)。從故障現(xiàn)象出發(fā),以網(wǎng)絡(luò)診斷工具為手段獲取診斷信息,確定網(wǎng)絡(luò)故障點(diǎn),查找問(wèn)題的根源,排除故障,恢復(fù)網(wǎng)絡(luò)正常運(yùn)行[2]。
2.1 了解故障,歸納癥狀,找出故障點(diǎn)
排除網(wǎng)絡(luò)故障的第一步就是要確定故障的具體現(xiàn)象,發(fā)現(xiàn)癥結(jié)所在,并確定其對(duì)網(wǎng)絡(luò)產(chǎn)生的影響。搜集與當(dāng)前故障相關(guān)的準(zhǔn)確信息,縮小故障原因排查范圍。尋找故障點(diǎn)的思路為:嘗試重新執(zhí)行用戶任務(wù)再現(xiàn)故障狀況,排除應(yīng)用程序操作不當(dāng)、權(quán)限設(shè)置問(wèn)題、本地計(jì)算機(jī)故障等原因,然后再將故障原因鎖定在網(wǎng)絡(luò)系統(tǒng),再逐步明確到服務(wù)器、路由器、集線器或線纜等特定組件;最后再將各特別組件故障的原因定位到部件的軟件故障還是硬件故障上。
2.2 確定原因,制定實(shí)施解決方案,測(cè)試效果
在網(wǎng)絡(luò)故障排查過(guò)程中,應(yīng)從最明顯的跡象開(kāi)始尋求最有可能導(dǎo)致故障的原因,制定詳細(xì)的故障排除方案,并嚴(yán)格按照方案的相關(guān)措施進(jìn)行故障排查,在故障排查的過(guò)程中做好故障排查記錄。在故障得到解決后,還應(yīng)測(cè)試網(wǎng)絡(luò)的相關(guān)效果,確保在排除網(wǎng)絡(luò)故障的同時(shí)不至于引發(fā)另一故障隱患。
2.3 分析解決方案,編制解決方案文檔
在故障排除過(guò)程中,應(yīng)將網(wǎng)絡(luò)當(dāng)成一個(gè)不可分割的整體,避免將精力過(guò)分集中于某個(gè)用戶、應(yīng)用或局域網(wǎng)的故障—這一點(diǎn)非常重要。在某些情況下,在實(shí)施某項(xiàng)故障解決方案的同時(shí),可能引發(fā)更加嚴(yán)重或波及更多用戶的故障。
建立健全事件管理體系,將每次故障登記在冊(cè),并包含與問(wèn)題和隔離解決步驟相關(guān)的完整記錄。認(rèn)真記錄檔案資料還可為以后的網(wǎng)絡(luò)管理工作提供經(jīng)驗(yàn)和資料。
3 常用的網(wǎng)絡(luò)故障診斷工具
常見(jiàn)的網(wǎng)絡(luò)故障診斷工具有很多,下面簡(jiǎn)單介紹幾個(gè)。
3.1 Ping命令
Ping命令[3]通過(guò)向遠(yuǎn)程目的設(shè)備發(fā)送ICMP回應(yīng)報(bào)文并且監(jiān)聽(tīng)回應(yīng)報(bào)文的返回,來(lái)校驗(yàn)與遠(yuǎn)程設(shè)備的連通性。帶“-t”,“-l”命令參數(shù)的Ping命令還可以檢查網(wǎng)絡(luò)連通的可靠性,如果大包的Ping命令成功返回,就可以證實(shí)源點(diǎn)到目標(biāo)之間所有物理層、數(shù)據(jù)鏈路層和網(wǎng)絡(luò)層的運(yùn)行功能基本正常。Ping網(wǎng)址還可以檢查位于應(yīng)用層的DNS是否工作正常。
3.2 Tracert應(yīng)用程序
Tracert命令提供了數(shù)據(jù)包從源到達(dá)目的地的網(wǎng)絡(luò)路徑的路由器列表,所顯示的路徑是源主機(jī)與目標(biāo)主機(jī)間的路徑中,路由器的近側(cè)接口列表,主要用于路由追蹤。
3.3 PathPing命令
PathPing命令主要用于提供在來(lái)源和目標(biāo)之間的中間躍點(diǎn)處的網(wǎng)絡(luò)滯后和網(wǎng)絡(luò)丟失信息。PathPing將多個(gè)回響請(qǐng)求消息發(fā)送到來(lái)源和目標(biāo)之間的各個(gè)路由器,然后根據(jù)各個(gè)路由器返回的數(shù)據(jù)包大小計(jì)算路由器或鏈接的數(shù)據(jù)包的丟失程度,從而確定引起網(wǎng)絡(luò)問(wèn)題的路由器或子網(wǎng)。
3.4 CHARIOT軟件
CHARIOT是一種多功能網(wǎng)絡(luò)業(yè)務(wù)測(cè)試軟件,支持FTP,HTTP,IPTV,Netmeeting,RealAudio等120多個(gè)應(yīng)用層網(wǎng)絡(luò)功能測(cè)試,通過(guò)它可以測(cè)量點(diǎn)到點(diǎn)之間的傳輸速率,主要用于網(wǎng)絡(luò)Ping命令測(cè)試,屬應(yīng)用層網(wǎng)絡(luò)故障分析診斷工具。
3.5 SNIFFER類軟件
SNIFFER類軟件可以捕捉TCP/IP協(xié)議模型各個(gè)層次上網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù)包,通過(guò)對(duì)網(wǎng)絡(luò)實(shí)時(shí)信息進(jìn)行監(jiān)控,對(duì)保存的歷史數(shù)據(jù)報(bào)進(jìn)行統(tǒng)計(jì)分析,從而定位網(wǎng)絡(luò)故障發(fā)生的原因,SNIFFER類工具有很多,較常用的有SINFFER,OMNIPEEK等。
3.6 線纜測(cè)試儀
線纜測(cè)試儀是針對(duì)TCP/IP模型的物理層設(shè)計(jì)的,這是一種便攜的、能快速排查線纜故障的診斷儀器,常用的測(cè)試電纜儀表有萬(wàn)用表、RJ45或RJ11網(wǎng)絡(luò)線纜測(cè)試儀等,測(cè)試光纜的有激光筆、光功率計(jì)等。
3.7 網(wǎng)絡(luò)測(cè)試儀
網(wǎng)絡(luò)測(cè)試儀通過(guò)檢查所有通過(guò)儀器的信息,發(fā)現(xiàn)相關(guān)的線索,從中得到故障診斷信息,這種設(shè)備是為TCP/IP下3層故障診斷設(shè)計(jì)的。
4 常見(jiàn)故障的維護(hù)
4.1 電纜連接故障或端口
線路故障[4]一般包括線路的損壞及線路受到嚴(yán)重的電磁干擾等,該故障的發(fā)生幾率非常高,大約占所有物理故障的70%。對(duì)于線路損壞故障的檢檢測(cè)方法為:若線路短,可將網(wǎng)絡(luò)線一端插入一臺(tái)能夠正常接入局域網(wǎng)主機(jī)的RJ45插座,另一端插入正常的HUB端口,然后從主機(jī)上Ping線路另一端的主機(jī)或路由器,根據(jù)通斷來(lái)判斷;假如線路稍長(zhǎng),或者網(wǎng)線不方便調(diào)動(dòng),可用網(wǎng)線測(cè)試器測(cè)量網(wǎng)線的好壞;假如線路很長(zhǎng),是由電信部門提供,那就需要他們檢查線路,確定線路情況。對(duì)于嚴(yán)重的電磁干擾,可以用屏蔽性較強(qiáng)的屏蔽線在該段網(wǎng)絡(luò)上進(jìn)行通信測(cè)試。若通信正常,則表明存在著電磁干擾,這時(shí)應(yīng)將網(wǎng)絡(luò)遠(yuǎn)離高壓電線和電磁場(chǎng)較強(qiáng)的設(shè)備;若通信不正常,則應(yīng)考慮其他原因。
端口故障通常包括插頭松動(dòng)等物理故障,一般影響與其相連的設(shè)備,可以通過(guò)檢查信號(hào)指示燈的狀態(tài),判斷故障的發(fā)生范圍及原因,也可以使用其他端口檢查連接是否正常。其中最為常見(jiàn)的是網(wǎng)卡故障,采取的措施多為重新插卡或換卡的方法進(jìn)行。
4.2 集線器或路由器故障
集線器或路由器故障[4]有軟故障和硬故障。若為硬故障導(dǎo)致網(wǎng)絡(luò)不通。最簡(jiǎn)易的方法是替換排除法,用通信正常的網(wǎng)線和主機(jī)來(lái)連接集線器(或路由器),如能正常通信,則集線器或路由器正常;否則,再轉(zhuǎn)換集線器端口排查,是端口故障還是集線器(或路由器)的故障;很多時(shí)候,集線器(或路由器)的指示燈也能提示其是否有故障,正常情況下對(duì)應(yīng)端口的燈應(yīng)為綠燈。如始終不能正常通信,則可認(rèn)定是集線器或路由器故障。
路由器軟故障通常包括路由器端口參數(shù)設(shè)定有誤、路由器路由配置錯(cuò)誤、路由器CPU利用率過(guò)高和路由器內(nèi)存余量太小等。路由器端口參數(shù)設(shè)定有誤,會(huì)導(dǎo)致找不到遠(yuǎn)端地址,用Ping命令或用Traceroute命令,查看在遠(yuǎn)端地址哪個(gè)節(jié)點(diǎn)出現(xiàn)問(wèn)題,對(duì)該節(jié)點(diǎn)參數(shù)進(jìn)行檢查和修復(fù)。路由器路由配置錯(cuò)誤,會(huì)使路由循環(huán)或找不到遠(yuǎn)端地址,解決路由循環(huán)的方法就是重新配置路由器端口的靜態(tài)路由或動(dòng)態(tài)路由,把路由設(shè)置為正確配置,就能恢復(fù)線路了。路由器CPU利用率過(guò)高和路由器內(nèi)存余量太小,導(dǎo)致網(wǎng)絡(luò)服務(wù)的質(zhì)量變差,解決這種故障,只有對(duì)路由器進(jìn)行升級(jí)、擴(kuò)大內(nèi)存等,或者重新規(guī)劃網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。
4.3 軟件系統(tǒng)故障
架構(gòu)網(wǎng)絡(luò)[3]的目的就是為了提供各項(xiàng)網(wǎng)絡(luò)應(yīng)用服務(wù)。由于網(wǎng)絡(luò)軟件系統(tǒng)(包括網(wǎng)絡(luò)操作系統(tǒng)、網(wǎng)絡(luò)協(xié)議軟件以及網(wǎng)上應(yīng)用系統(tǒng))自身存在各種缺陷,再加上各類病毒軟件的危害,造成主機(jī)安全性故障。排除此類故障通常采用升級(jí)系統(tǒng)、安裝補(bǔ)丁、安裝殺毒軟件進(jìn)行查殺病毒和防防火墻來(lái)防范病毒蔓延和攻擊。新的應(yīng)用系統(tǒng)在投入使用之前應(yīng)根據(jù)運(yùn)行環(huán)境、數(shù)據(jù)量的大小和用戶數(shù)量做好相應(yīng)測(cè)試和小范圍試運(yùn)行的工作,然后再投入正常使用。
主機(jī)的網(wǎng)絡(luò)地址參數(shù)設(shè)置不當(dāng)是常見(jiàn)的邏輯故障。包括主機(jī)配置的IP地址與其他主機(jī)沖突,或IP地址根本就不在于網(wǎng)絡(luò)范圍內(nèi),這將導(dǎo)致該主機(jī)不能連通。發(fā)生類似的情況,可通過(guò)查看網(wǎng)絡(luò)鄰居屬性中的連接屬性窗口,檢查TCP/IP選項(xiàng)參數(shù)是否符合要求,包括IP地址、子網(wǎng)掩碼、網(wǎng)關(guān)和DNS參數(shù),對(duì)錯(cuò)誤的設(shè)置進(jìn)行修復(fù)。
4.4 主機(jī)安全性故障
主機(jī)主機(jī)性故障包括主機(jī)資源被盜和黑客入侵。對(duì)于主機(jī)資源要注意不要輕易地共享本機(jī)硬盤;對(duì)于主機(jī)被黑客
控制的故障可以通過(guò)監(jiān)視主機(jī)的流量、掃描主機(jī)端口和服務(wù),安裝防火墻和加補(bǔ)系統(tǒng)補(bǔ)丁來(lái)防止可能的漏洞。
5 結(jié)束語(yǔ)
網(wǎng)絡(luò)故障的發(fā)生是不可避免的,當(dāng)網(wǎng)絡(luò)故障發(fā)生后,如何快速地定位網(wǎng)絡(luò)故障點(diǎn),恢復(fù)網(wǎng)絡(luò)的正常運(yùn)行,是網(wǎng)絡(luò)維護(hù)技術(shù)人員必修的課題。在面對(duì)網(wǎng)絡(luò)故障時(shí),我們不僅要具有相關(guān)的知識(shí)和豐富的經(jīng)驗(yàn),還應(yīng)注意遵循網(wǎng)絡(luò)故障診斷的一般方法和步驟。
參考文獻(xiàn):
[1] 劉伯華,李新強(qiáng),魏宏昌.網(wǎng)絡(luò)故障的診斷和排除[J].計(jì)算機(jī)與網(wǎng)絡(luò),2008(10):47-51.
[2] 劉建友.常見(jiàn)網(wǎng)絡(luò)故障的維護(hù)[J].裝備制造技術(shù),2008(7):133-134.
[3] 徐新件,朱健華,宋艷.基于TCP/IP的網(wǎng)絡(luò)故障分層定位研究[J].電力系統(tǒng)通信,2009,30(195):55-57.
[4] 白建彬.計(jì)算機(jī)網(wǎng)絡(luò)常見(jiàn)故障的種類及檢查方法[J].鐵道通信信號(hào),2008,44(11):57-58.