◆徐 博 王寧邦 陳 彬 杜陳艷
(云南師范大學信息處網絡科 云南 650500)
網絡設備故障解決一體化平臺初探
◆徐 博 王寧邦 陳 彬 杜陳艷
(云南師范大學信息處網絡科 云南 650500)
移動技術方便了管理,本文針對復雜的管理環境對網絡設備管理方法以及依托的技術進行了闡述,提出了網絡設備故障管理一體化平臺解決方案,詳述了各個模塊的具體內容,其中很多已經融合到了現實管理指導和各種系統的實踐中。
移動技術;網絡設備管理;一體化平臺;解決方案
基于ICMP[1]協議的監測技術比較成熟,具有通用性強,可靠性高,實現簡單等優點,但輪詢網絡設備,勢必會給被監測設備所在的網絡注入大量的測試流量,占用的網絡資源,造成網絡擁塞、網絡的癱瘓,同時該方法的實時性較差[2]。
基于SNMP協議的監測方法是目前比較智能化的方法,具有較高的實時性,占用網絡資源少,但要求被監測的網絡設備必須支持SNMP協議,通用性弱,當網管軟件死機或通信鏈路出現問題時,告警信息無法由被管對象發送至管理端,由于故障關聯性的存在,會導致系統定位不準確[2]。繼承了SNMP協議智能化和ICMP協議通用性、可靠性的優點。通過構造一種事件觸發與輪詢相結合的模型,可以有效地克服傳統方法的缺點,提高準確度和監測的可靠性,增加實時性并減少對系統資源的占用,這就是基于ICMP和SNMP協議的綜合監測方法[2]。
Ping命令充分利用了ICMP協議的特點,如網絡監測和查詢功能,同時其參數易掌握,結果簡單明確,還有多種搭配方式和返回信息值得我們進一步探究,而ICMP作為網絡層的—個基本協議,如何將其功能有效地運用到更多的場合和工具中去,值得我們進一步挖掘和研究[3]。
無論是針對網絡故障檢測還是質量保障,對Ping命令的多種搭配方式和返回信息可以進一步探究,提高準確度和監測的可靠性、增加實時性、減少對系統資源的占用、使網絡及設備的維護得到保障,是今后的研究方向。同時,對網絡進行輪詢的操作是很有必要的,通過優化輪詢算法的速度也是解決網絡故障和保證質量的途徑。
ICMP的使用會占用的網絡資源、造成網絡擁塞、網絡的癱瘓、導致實時性差等問題,所以提高ICMP的使用效率如精確計算對網絡Ping的次數、提高算法效率等是很有必要的。此外ICMP的使用不僅僅只與網絡以及算法等問題有關,還涉及到網絡維護問題,如基于ICMP的短信報警平臺在設備出現故障時能夠第一時間向故障維護人員提供短信報警,故障維護知識庫平臺能夠為故障處理提供先驗性知識保障,設備位置導航能夠最快引導故障維護人員找到故障位置,設備故障情況的可視化可以為故障維護人員對設備的健康狀況進行預處理(如提前籌備備份設備、提前維護)提供依據等,這些都可以提高網絡服務的質量。
本文提出校園網絡故障解決一體化解決方法,如下圖1所示。

圖1 校園網絡故障解決一體化平臺
1.1 基礎信息模塊
基礎設施不齊全、設備老化、資金短缺、環境復雜(如強電對弱電影響很大、網絡節點很多)、龐大的校園網絡環境影響改造。如果不做好每一臺交換機摸底工作,就會產生硬件備份不足、運行資金沒有憑據、業務交叉頻發、整合困難等問題。
交換機的設備地址、設備用途、管理IP地址、上級互聯IP地址需要進行登記管理,其中設備地址是指所在樓層、具體樓宇等,設備用途即包括接入、匯聚、核心等,上級互聯IP地址把所有IP地址管理成樹狀,這些IP是管理交換機登錄的首要條件。
交換機出故障的時候,無法取得聯系。在網絡故障排查時,首先得定位交換機的具體位置,在復雜的樓宇里面,找到交換機具體位置也成為管理交換機的一部分,此時可以引入交換機的地理坐標進行管理。
1.2 配置文件管理
交換機配置文件需要以文檔的形式上傳保存于系統,以防由于交換機損壞無法備份導出配置清單。一旦交換機壞了,但是配置信息沒有備份,就需要重新對交換機信息進行配置,影響了工作效率。
1.3 交換機故障解決知識庫
知識庫記錄交換機故障情況、維護信息,為今后解決同一臺交換機、其他交換機知識庫提供保障,很好地規避了現實中只知道某一棟樓宇某一臺交換機出問題,而沒有對出現的問題進行處理跟蹤、解決記錄的情況。只能憑借記憶去解決問題往往會出現解決工具準備不齊全的問題。
1.4 設備故障情況可視化
量化設備故障情況,以可視化方式呈現,讓ICMP工作范圍縮小到這些經常出問題的設備上面。如設備的故障情況與斷電的定量以及可視化能夠為設備環境的改造提供依據。故障情況與解決辦法的可視化能夠為新的故障解決提供直觀思路。
從可視化的情況可以知道哪些設備即將出問題,可以預先備份好配置文件,發生狀況及時通過備份進行還原救災。
1.5 故障檢測監控模塊
引入多叉樹的數據結構形式進行存儲,引入廣度優先遍歷算法等配合ICMP的使用,判斷父節點的設備工作情況來監控整個網絡的運行狀況。在龐大的樹形網絡中,按照父節點工作則子節點工作的必要不充分條件,逐一進行監控。并在最優的監控算法[4]次數的指導下,提供設備故障位置信息。
1.6 導航模塊
隨著移動技術的發展,移動設備的導航也隨之流行。樓宇的復雜性導致交換機所在位置往往會難以尋找,所以引入設備的位置導航,根據故障檢測監控模塊提供的設備位置信息,引導維護人員進入故障現場。
設備故障短信來自于網絡監測平臺,并將數據進行存儲,如果后臺檢測到設備維護人員的移動客戶端處于在線狀態,后臺輪詢故障情況,則可以推送設備維護情況以及知識庫給客戶端,并附上導航鏈接,以供導航設備使用。
1.7 一體化平臺物理架構
ICMP監控平臺檢測到網絡設備不工作,則借助電信網關給維護人員發送故障信息,同時將故障信息存儲到網絡設備基礎信息平臺。平臺檢測移動客戶端是否在線,并發送網絡設備的導航信息到移動設備,維護人員便可以方便找到故障設備。解決好故障后將解決方案在網絡設備基礎平臺反饋。物理架構如下圖3。