洪行
(銅陵有色金屬集團企業管理部,安徽 銅陵 244001)
隨著企業信息化的飛速發展和應用普及,ERP管理系統、BI商務智能系統等各類重要系統的部署應用,網絡可靠性已經成為企業最關心的問題之一。作為信息化的重要基礎,進一步提高網絡的可靠性,最大程度地保障網絡的連續正常運行,就成了我們今天所必須面對和需要解決的新課題。
在組建信息通信網絡的過程中,交換機與交換機之間采用生成樹算法(Spanning Tree Algorithm)可以實現它們之間的鏈路冗余,能保證交換機無單點故障;交換機與主機之間采用鏈路聚合(Link-aggregation)等技術可以實現它們之間的鏈路冗余并有效提高鏈路之間的帶寬;網絡使用多條鏈路,可以實現在某條鏈路意外故障時,備用鏈路瞬間替代,確保鏈路的穩定性。這樣任何單點故障都不會影響網絡的連通性。
本文主要討論網絡鏈路故障判斷機制,以及如何實現自動判斷、自動切換的功能。通常懷疑線路存在故障的時候Ping一下,根據Ping的結果來判斷線路正常與否,想要實現自動判斷的話,我們就必須引用NQA網絡技術。NQA的全名叫網絡質量分析(Network Quality Analysis),是用于測量端到端網絡質量的,它的原理如下:
(1)根據用戶設置,定期執行一些操作,最簡單的操作就是Ping(回聲探測機制);
(2)自動記錄每次探測的結果,如Ping成功就是OK,失敗就是FAILED;
(3)根據用戶設置,自動根據結果采取動作,如連續3次FAILED,那么就觸發機關;
(4)觸發機關可以和一些特性關聯,比如靜態路由,機關一旦被觸發,靜態路由自動失效;
(5)有失效就有生效,也就是線路備份機制也被啟發了,所有數據切換到備用線路。
從這里我們可以得知NQA相當于一個自動代理,執行探測、聯動功能。
以兩臺異地放置的H3C 7506E交換機作為核心交換,之間兩條物理鏈路連接——公網VPN鏈路和2M專線鏈路,拓撲圖如下:


以上靜態路由的配置,只實現了默認從一條優先級高的鏈路通過,但存在這條鏈路中斷,無法自動切換到另一條鏈路的問題,因此我們采用H3C NQA技術來解決
Switch A上配置Track組探測Switch B的地址192.168.1.2是否可達,如果探測失敗,將Switch A上優先級高的靜態路由失效
Switch B上配置Track組探測Switch A的地址192.168.1.1是否可達,如果探測失敗,將Switch B上優先級高的靜態路由失效
配置步驟如下:


配置完成后,用戶A 嘗試ping對端服務器地址172.16.32.1,反饋正常通訊,此時查看Switch A路由表,可以看到從優先級較高的專線鏈路通過;

保持用戶A ping對端服務器地址以查看鏈路狀態,中斷專線鏈路,可以看到掉3個ping包,然后恢復,與nqa 3次ping探測失敗則使靜態路由失效配置吻合,查看Switch A路由表,此時從優先級較低的公網VPN鏈路通訊,鏈路自動切換成功;

繼續保持用戶A ping對端服務器地址以查看鏈路狀態,恢復專線鏈路,可以看到掉1個ping包,然后恢復,此為鏈路自動切換的結果,查看Switch A路由表,此時從優先級較高的專線鏈路通訊,鏈路自動切換,恢復成功;

1)配置NQA探測組,其中關鍵配置是Reaction的配置
2)配置Ttack跟蹤組,并和Reaction綁定
3)將靜態路由和Track組綁定
4)使能nqa agent和nqa調度
NQA技術原理雖然不復雜,但是很實用,并且功能強大,大致可以應用在兩大方面。一是局域網的網絡出口鏈路上,對于網絡穩定性需求較高的企業,必定擁有多條運營商鏈路,此時NQA技術可以實現故障鏈路自動切換;二是跨地域網絡鏈路的可靠性保障,在重要的系統中,異地網絡連接往往會部署雙鏈路,如VPN、專線等,采用NQA技術可以實現路由自動切換,保障網絡可靠性與穩定性。
在網絡組建設計中,單鏈路存在發生故障即會中斷業務的隱患,基于NQA技術的雙鏈路可極大地提高網絡的穩定可靠性。由于其可以自動判斷網絡通暢性、自動切換網絡鏈路,能最大程度的保障網絡的連續正常運行,因而具有良好的應用前景。