徐江紅,馬 蕾
(北京電子科技職業學院,北京 100176)
北京電子科技職業學院電信工程學院由于校區合并,面臨網絡系統的改造升級,以實現網絡的統一管理和資源的安全使用。圖1為學院改造之前的網絡系統設計。

圖1 改造之前網絡拓撲圖
由圖1可以看出,網絡中采用接入層、匯聚層和核心層三層構架結構。其中核心層存在很明顯的單點故障問題,即核心交換機只有1臺cisco公司的設備6509,這樣當這臺設備出現down機問題,將會導致整個網絡通信完全中斷,勢必造成難以估量的損失。針對這一問題,本文提出了對網絡中的核心層進行擴容升級改造,即通過添加另一臺cisco公司的設備6509作為備份設備,并在核心層交換機上配置HSRP協議,實現雙機熱備份方案。這樣,在一個主核心設備不能工作的情況下,作為備份的設備迅速接管,不影響整個網絡的正常運行,以此提高網絡的高可靠性需求。
HSRP 全稱為 Hot Standby Router Protocol,是Cisco公司開發的熱備份路由器協議,屬于Cisco的私有協議。HSRP協議的基本原理是將系統中由多臺路由器設備組成一個“熱備份組”,這個組形成一個虛擬路由器,具有自己的IP地址和MAC地址。通過比較組內優先級的值,最大的將作為該組中的主設備,又稱活動設備,其余設為備份設備。在任何時刻,一個組內只有一個路由器設備是活動的,并由它來轉發數據包,如果該設備發生了故障,備份路由器設備轉化成主路由器,接管主路由器之前的工作。在本網絡內的主機看來,是虛擬路由器為其轉發數據,連接仍然保持,不會受到故障的影響,這樣就較好地解決了路由器切換的問題。如圖2所示,路由器A和路由器B形成了一個熱備份組,路由器A優先級為180,大于路由器B的優先級150,所以被選擇為當前這一熱備份組的活動路由器,路由器B作為備份路由器,PC1的網關設置成虛擬路由器的IP地址。正常情況下,PC1要訪問PC2時,都走路由器A出去。當路由器A出現故障時,路由器B立刻由備份狀態進入到活動狀態,接管路由器A的工作。而對于PC1來說,始終是以192.168.10.254為網關轉發數據,并不關心物理設備的切換。

圖2 HSRP工作原理
北京電子科技職業學院電信工程學院的網絡接入層選擇Cisco2960二層交換機,核心層交換機采用Cisco6509交換機。該網絡系統根據部門劃分成4個vlan,即學工部劃分到vlan10、教學部vlan20、行政部vlan30、后勤部vlan40。每個vlan中的地址段分別為 192.168.10.0/24,192.168.20.0/24,192.168.30.0/24 和192.168.40.0/24,對應的默認網關分別為 192.168.10.1,192.168.20.1,192.168.30.1,192.168.40.1。考慮到北京電子科技職業學院電信工程學院之前的網絡設備全部是Cisco公司的產品,為了更好地兼容原來的網絡,選用的依然是Cisco公司的6509設備實現核心備份。根據HSRP的工作原理,如果單純將某一臺核心設備(如S3A)作為主設備,另一臺核心設備作為備份設備,那么當主設備正常的情況下,所有數據流量都經過主設備,而同樣高性能的備份設備卻沒有得到利用,造成主設備負擔過重,而備份設備資源浪費的局面。所以此處采用負載均衡的設計,即將其中一臺核心設備作為學工部和教學部的主設備,對于行政部和后勤部來說,該設備是備份設備,反過來,另一臺核心設備作為行政部和后勤部的主設備,同時是學工部和教學部的備份設備。這樣在設備正常的情況下,數據被兩個核心設備分擔,當出現故障時,其中一臺會擔負起全部流量。
圖3給出了網絡改造方案的拓撲圖。圖中S3A和S3B共同組成了雙機熱備份核心層。其中S3A為vlan10和vlan20的主設備,又是vlan30和vlan40的備份設備,S3B為vlan30和vlan40的主設備,也是vlan10和vlan20的備份設備。

圖3 網絡改造方案的拓撲圖
首先根據備份網關方案的設計規劃網關IP地址。vlan 10所在網段默認網關的地址為192.168.10.1,vlan 20所在網段默認網關的地址為192.168.20.1,vlan 30所在網段默認網關的地址為192.168.30.1,vlan 40所在網段默認網關的地址為192.168.40.1。在 S3A 設備上配置 vlan10、vlan 20、vlan 30、vlan 40 的地址分別為 192.168.10.254,192.168.20.254,192.168.30.254,192.168.40.254,在 S3B設備上配置 vlan10、vlan 20、vlan 30、vlan 40 的地址分別為 192.168.10.253,192.168.20.253,192.168.30.253,192.168.40.253。所有主機的默認網關配置均為相應網段的默認網關地址。圖4為兩個核心交換機S3A和S3B設備上與HSRP協議相關聯的配置。從圖4可以看出,在S3A上配置vlan10和vlan20的優先級為180,高于S3B上的150,因此對于vlan10和vlan20,S3A是主設備。同樣的,對于vlan30和vlan40,S3B上配置的優先級為180,高于S3A設備上的150,S3B是主設備,以此實現負載均衡的目的。正常情況下vlan10和vlan20的數據走S3A,vlan30和vlan40的數據走S3B。當一臺核心設備(如S3A)出現故障,備份設備(如S3B)接管全部任務。如果主設備S3A的故障被排除,通過preempt配置搶占,使S3A很容易地從S3B中將vlan10和vlan20的數據轉發權搶過來,從而恢復到之前的負載均衡狀態。代碼中通過跟蹤上行接口f0/0,如果f0/0出現故障,當前設備的優先級自動降低50,使另一臺設備的優先級高于自己,從而實現自動激活備份設備為主設備。

圖4 核心交換機上HSRP協議配置代碼
HSRP協議運行起來之后,讓PC機ping自己的網關1000次,觀察連通性效果,并在過程中讓主設備shutdown,繼續觀察PC機與網關的連通性。圖5所示是vlan10的PC機訪問自己的網關的實驗效果。從圖5可以看出當S3A正常的情況下,PC機能夠ping通自己的網關,當人為地讓S3A shutdown之后,系統顯示先丟失1個包后,又能連通了。丟失數據包是因為HSRP協議運行,把S3B從備份狀態激活成活動狀態的過程需要一定的時間。圖6是S3B交換機設備在S3A交換機down掉后的狀態轉換圖。由圖6可以看出,S3B設備已經由standby(備份)狀態變成active(活動)狀態,此時代替S3A成為vlan10的主網關設備。一旦S3B變成活動狀態,就接管了數據的傳輸任務,所以又ping通了。由于HSRP協議運行中,狀態轉換發生的時間很短,對于客戶機來說,感覺不到丟包,從而實現了在單點故障發生的情況下,不影響整個網絡通信。需要說明的是備份設備被激活的時間因為路由器本身的性能不同,丟失數據包的數目也不同。

圖5 HSRP協議運行測試結果1

圖6 S3B在S3A交換機down掉后狀態轉換圖
通過上述的研究表明,利用HSRP確實改善了網絡的穩定性和可靠性,解決了之前網絡中的單點故障問題。需要說明的是,HSRP畢竟是Cisco公司私有,不能很好地兼容其他公司的設備,這是本文研究的一個局限,下一步的研究將繼續針對不同網絡公司產品的兼容性作深入探討。
[1]孫東,白龍江,范璽斌.HSRP在艦載IP網絡可靠性設計中的應用[J].艦船電子工程,2011(10):140-142.
[2]盧葦,譚文浩.熱備份路由協議HSRP在校園網維護中的應用[J].計算機應用,2002(4):45-47.
[3]吳剛.HSRP協議在IP網絡設計中的研究與應用[J].綿陽師范學院學報,2011(8):84-87.