信息系統實施容災備份建設,主要技術可分為四個部分:通信鏈路備份與切換、路由設備及協議備份與切換、內網核心交換虛擬化和應用平臺應急備份與恢復。
此外,為提升終端設備和存儲設備的穩定性,可視物理環境和保障需要,增加終端備份和存儲備份手段。
為保證系統整體容災備份能力,采用“整體模型、分系統構建、整體實現”由總—分—總的分析方法。在完成模型設計后,將信息系統從硬件配置、通信線路、網絡協議、路由協議等多個方面,劃分為通信鏈路、網際路由、內網互聯和應用平臺應急恢復四個分系統,應用Packet Tracer和GNS3仿真器,或依據測試目標和內容搭建相應的網絡環境,對其分別進行模擬和測試分析。
如圖1所示,通信鏈路分系統采取雙鏈路互為備份的機制,配置動態路由協議接口優先級,實現鏈路優化選擇和自動切換,達到對通信鏈路備份保護的目的。
信息系統通信鏈路主要有光纜網和衛星資源網電路,通常固定開設階段以光纜網為主用,衛星資源網為備用信道,機動或短停階段以衛星資源網為主用,固定光纜網為備用信道。
衡量通信鏈路質量指標主要是網絡時延大小,在不計算數據報文排隊處理時間的前提下,網絡時延T主要由傳輸時延TS和傳播時延TB組成。
其中,傳輸時延是所有數據在鏈路上傳輸的時間,由數據分組長度L和傳輸速率R決定,即TS=L/R;傳播時延是數據在鏈路物理媒體上傳播的時間,由傳播距離S和傳播速率C決定,即TB=S/C。因此,網絡時延≈傳輸時延+傳播時延,即T≈TS+TB= L/R+ S/C。
以icmp報文為例(PING報文長度設定1500字節,要考慮發送和接收雙向),在光纜網鏈路傳輸時,2Mbps速率,通信距離200Km,傳播時延為微秒級,網絡時延以傳輸時延為主,T≈2TS=2*L/R=2*1500*8/2000000=12ms;在衛星資源網傳輸時,網絡時延以傳播時延為主,T≈2TB=2*S/C=2*2*35800/(3*105)=477ms(以地球同步衛星通信計算)。
可見,固定光纜網鏈路網絡時延較小,衛星資源網鏈路時延較大,根據業務和通信要求,選擇適當的通信鏈路。

圖1 信息系統通信鏈路模擬圖
網際路由分系統是信息系統與外部通信的主要環節,對其實施的保護主要包括路由設備熱備份、路由參數同步、虛擬路由技術及外聯接口切換等。
如圖2所示,信息系統外部鏈接由邊界路由器1和邊界路由器2實現,分別與上聯節點路由器建立各兩條冗余通信鏈路,采用動態路由協議OSPF進行路由同步和調整,1臺邊界路由器故障終端,另一臺仍能保持網絡正常通信,邊界路由器1和邊界路由器2運行VRRP協議,對內部網絡虛擬為一臺路由設備,提高內網出聯的冗余備份能力。
(1)鏈路自動切換。
模擬上聯節點和邊界路由器1之間光纜網和衛星資源網鏈路自動調整,前面已分析過固定光纜網時延小,應是優先選擇的鏈路,如何做到路由設備優選固定光纜網鏈路。分析路由選擇策略,那條鏈路優選主要決定于兩個因素:
首先是接口優先級,優先級高的接口優先被選用。
再次是開銷COST,這個值等于參考帶寬/接口帶寬,一般參考帶寬為100Mbps,接口帶寬越大COST值越小,被選擇的可能性越大。
實際工作中,衛星鏈路接口帶寬可能會比較大(實際傳輸速率低,但接口可能使用10M網口),在接口默認優先級一樣的情況下,往往會選擇衛星鏈路為主用路由。
因此,想優先選擇光纜網鏈路,應在光纜網鏈路接口上配置OSPF優先級高于衛星鏈路。
如圖3所示,S0/3/0接口連接光纜網鏈路,F0/1接口連接衛星資源網鏈路,優先級改變后路由變化結果,衛星鏈路接口優先級變為100,優先使用S0/3/0接口,設備重啟后路由發生了相應變化,此時光纜網為主用鏈路。
(2)路由設備備份。
從模擬路由設備互聯圖6看出,信息系統采用兩臺邊界路由器對上鏈接,配置OSPF協議,能根據鏈路狀態實時調整路由信息,當一臺路由設備故障時,另一臺能保持網絡正常通聯,從而實現路由設備及路由數據備份。
(3)虛擬路由技術。
為了保證我們網絡的穩定性和可靠性,或用一條出口鏈路接兩臺路由器做熱備份路由,當主路由器功能出現故障時,應用VRRP(虛擬路由器冗余協議, RFC2338)由另外一個路由器來接管相應的工作。
通過設置虛擬路由器為缺省路由器,用戶在路由器發生故障時可以繼續通信。
如圖4所示,利用同一個以太網中的兩臺路由器R1、R2設置一臺虛擬路由器。
在實際運行中,兩臺路由器中的任一臺成為主路由器,該主路由器模擬虛擬路由器。備份路由器監控主由器狀態。一旦主路由器出現故障影響網絡運行,備份路由器立即進入主路由器狀態以模擬虛擬路由器。IP地址被分配給虛擬路由器。指定虛擬路由器IP地址為缺省路由器的服務器將不會覺察主路由器的切換而繼續進行正常通信。VRRP具體配置過程:

圖2 信息系統路由設備互聯

圖3 優先級改變后路由變化結果圖

圖4 VRRP配置結構圖
進行R1路由器配置,首先創建VRRP組1,虛擬網關為192.168.100.1
[R1-Vlan-interface10]vrrp vrid 1 virtual-ip 192.168.100.1
其次,設置VRRP組優先級為120,缺省為100
[R1-Vlaninterface10]vrrp vrid 1 priority 120
然后,設置為搶占模式
[R1-Vlaninterface10]vrrp vrid 1 preempt-mode
最后,設置監控端口為為interface vlan 20,如果端口Down掉優先級降低30
[R1-Vlaninterface10]vrrp vrid 1 track Vlan-interface 20 reduced 30
下 面 進 行R2路由器配置,首先創建VRRP組1,虛擬網關為192.168.100.1
[R2-Vlan-interface10]vrrp vrid 1 virtual-ip 192.168.100.1
其次,設置為搶占模式
[R2-Vlan-interface10]vrrp vrid 1 preempt-mode
內網互聯分系統是要素節點是核心交換設備,對其保護就是通過采用虛擬交換技術,實現把兩臺核心交換設備虛擬成一臺,使用聚合端口進行連接,能夠有效利用冗余鏈路的同時提升系統的轉發能力。
模擬測試虛擬交換技術,要根據核心交換設備類型,選用相應廠家的專用協議,這里以銳捷交換設備采用VSU協議為例進行測試。內網互聯采用虛擬交換技術結構圖如圖5所示。
下面按照網絡鏈接結構圖,選用兩臺S7808交換機為核心交換機,三臺華為S2700為接入交換機構建模擬網絡,核心交換設備VSU基本配置如下:
首先,配置核心交換機1
Switch1(config)#switch virtual domain 1
Switch1(config-vsdomain)# switch 1
Switch1(configvs-domain)# switch 1 priority 200
//默認優先級為100,配置為較高的優先級,VSU建立成功后將會成為管理主機。
Switch1(config-vsdomain)# exit
Switch1(config)# vslaggregateport 1

圖5 內網互聯采用虛擬交換技術結構圖
//VSL鏈路至少需要2條,一條鏈路可靠性較低,當出現鏈路震蕩時,VSU會非常不穩定。
Switch1(configvsl-ap-1)# portmember interface TenGigabitEthernet 2/1
//配 置 VSL鏈 路,VSU主備核心之間的心跳鏈路和流量通道
Switch1(configvsl-ap-1)# portmember interface TenGigabitEthernet 2/2
Switch1(config-vslap-1)# exit
其次配置核心交換機2
Switch2(config)#switch virtual domain 1//domaind id 必須和第一臺一致
Switch2(configvs-domain)# switch 2//第二臺設備必須更改ID為2
Switch2(configvs-domain)# switch 2 priority 150
Switch2(config-vsdomain)# exit
Switch2(config)#vsl-aggregateport 1
//VSL鏈路至少需要2條,一條鏈路可靠性較低,當出現鏈路震蕩時,VSU會非常不穩定。
Switch2(configvsl-ap-1)# portmember interface TenGigabitEthernet 2/1
//配 置VSL鏈 路,VSU主備核心之間的心跳鏈路和流量通道
Switch2(configvsl-ap-1)# portmember interface TenGigabitEthernet 2/2
Switch2(config-vslap-1)# exit
完成配置后,轉換交換機工作在VSU模式,確認VSU建立成功,展開功能測試,VSU主機的引擎Primary燈綠色常亮,VSU從機的Primary燈滅,可用來判斷主從機關系。對主機進行斷電和關閉端口測試,從機能在2秒以內接替主機工作,網絡保持正常運行。
Switch1# show switch virtual檢查主備是否符合預期,如圖6所示。
應用平臺應急恢復分系統是對應用系統、數據庫及中間件、操作系統進行保護的機制,采用多業務應急系統(CDAP)技術,為應用平臺提供應急保障與維護支持,通過部署一臺CDAP設備,可隨機應急不少于6臺故障X86服務器, 5-10分鐘完全接管原機,系統和數據保持完全一致。配置結構圖如圖7所示。
CDAP實現虛擬化映像的實時備份,不需要暫停系統IO讀寫。備份格式與虛擬機VMDK兼容,備份后立即可以使用,且與VM快照格式完全一致,實現虛擬機映像多版本自動管理,能夠實現映像卷內單個數據文件的恢復。能夠將系統和數據一次性完整備份成虛擬磁盤格式,及將主機接近實時備份成虛擬磁盤VMDK文件。最短時間間隔為10秒,即RPO為10秒左右。
為了對應用性能影響最小,實時備份調整在5分鐘左右,滿足對數據容災指標要求備份主機系統上安裝虛擬化插件,當本地主機出現邏輯或設備物理故障后,調用備份虛擬系統進行應急接管。
實時備份虛擬磁盤文件將會產生多時間點快照,快照策略設定在30分鐘一份快照,從而大大減少邏輯錯誤發生概率,快照采用自動合并策略,實現30天內稀疏不同邏輯恢復點。

圖6 檢查設備是否符合預期

圖7 多業務應急系統配置結構圖
通過以上仿真模擬,以及實際操作測試驗證,在不改變現有硬件配置的基礎上,適當選用或增加新的軟系統,能夠大幅度提高信息系統運行的穩定性和可靠性。
就4個要素分析論證得出:
一是通信鏈路采用光纜網為主衛星資源網補充的模式,可實現系統上下節點路由器間雙鏈路互聯備份,在物理層面上提高主通信鏈路可靠性。
二是路由設備選用動態路由協議,并配置相應路由策略,當出現網絡故障時,能自動調整路由狀態,實現了鏈路接口自動切換和路由設備互為備份,提高了路由設備穩定性。
三是采用VSU等虛擬交換技術,實現了多臺(2臺)核心交換設備虛擬備份,達到了保護內部網絡互聯的要求,提高了核心交換設備工作穩定性。
四是應用平臺應急恢復系統可實現系統和服務應急備份接管,解決了應用系統因硬件故障恢復慢、數據易丟失等問題,提供應用系統持續性及安全性。