黃楠

摘要:該文在調研災備系統背景及原理的基礎上,闡述了交行卡中心虛擬機及網絡現狀,分析了目前交行卡中心虛擬機災備系統設計當中的相關難點問題并針對交行卡中心虛擬災備系統的建立提出了在數據復制方案以及網絡切換方案選擇上的對策方案。
關鍵詞:災備系統;交行卡中心;數據復制;網絡切換方案;對策
中圖分類號:TP393? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2021)14-0240-03
1 緒論
1.1 研究背景
災備系統是保證企業業務正常運轉,為企業和用戶提供優質服務的重要組成部分。電子計算機技術的發展為更多的企業帶來業務上的發展機遇,但受限于機器設備的落后,在很大程度上影響了工作的正常運行,常常出現企業相關系統癱瘓的現象,一些企業的業務無法正常開展而使得企業遭受了巨大的損失。目前交行卡中心有A、B、C、D四級災備系統,其中A級災備系統與B級災備系統在災備管理要求上一致,但是A級災備系統要求在實施之前必須先按照B級和C級的管理要求實施災備管理,在此基礎上為A級災備系統的實施提供數據、應用的技術信息支持。
1.2 災備系統原理
多個虛擬機如果要在一臺物理服務器上實現同時運行需要依托虛擬化技術為基礎的云平臺,依托虛擬化云平臺可以實現硬件設備與軟件系統之間的強耦合,同時帶來了封裝、分區及隔離等多方好處。災備系統很重要的一點就是虛擬機備份的問題,備份主要涉及虛擬存儲、虛擬機系統狀態等兩個方面的內容,而內存、虛擬磁盤及其他配置信息組成了虛擬機存儲。
2 交行卡中心虛擬機及網絡現狀
目前,交行卡中心已經建立的虛擬機災備系統當中,包括兩個重要組成部分,虛擬機應用部分以及相應的網絡架構設置部分。通常情況下,災備系統當中,虛擬機實際上是作為信息備份、數據存儲的應用操作點,各地區之間的網絡架構通過各個點位連接在一起,使得虛擬機各個點位有效結合在一起,成為一套有機統一的災備系統。本文主要對交行卡中心虛擬機應用現狀以及網絡架構現狀兩個方面進行分析。
2.2 交行卡中心虛擬機現狀
虛擬機作為計算機平臺與用戶終端之間創建的一種聯系紐帶,可以讓用戶帶來操作軟件,也可以模擬硬件設備的實現。
目前,交行卡中心的災備系統使用的都是VMware虛擬機和SRM系統。該系統的總體架構共分為4層:第一層為數據存儲層,所有虛擬機都存放在數據存儲層中。第二層為物理機層,是所有虛擬機載體。第三層為虛擬機層,每臺虛擬機為一個單獨的業務系統。第四層為虛擬映射設備層,包括虛擬映射串口、虛擬映射USB等。
2.2 網絡現狀
交行卡中心主體網絡結構分為兩個部分,辦公測試網絡區域和生產網絡區域,兩個網絡區域依靠管理網絡、虛擬機交互網絡和VMotion網絡三部分來實現區域之間信息數據的交互傳遞。管理網絡主要是為了方便部門管理人員對兩個子網絡進行信息數據的查詢與監管;虛擬機網絡和VMotion網絡則是實現異地的信息備份與復原。交行卡中心生產網絡區域的結構設置與XX企業生產區域核心機房的地理位置設置相類似。在交行卡中心辦公測試網絡區域之中,設置了辦公VCenter區域網絡以及測試PaaS VCenter兩個子網絡區域,而在交行卡中心生產網絡區域之中設置了生產VCenter、生產金京PaaS VCenter和生產富特PaaS VCenter三個子網絡區域。
3 災備方案流程及設計難點
3.1 設計方案流程
交行卡中心在建立整體災備方案之前,首先要明確構建災備系統的目標與原則;其次需要建立完善的災備中心,需要包含同城災備中心與異地災備中心;接著建立起重要業務恢復災備等級;最后建立災備系統的IT基礎架構。在建立網絡IT基礎架構方面,主要包含了三項內容:(1)建立良好的存儲系統;(2)建立性能完善網絡整體結構;(3)建立良好的數據庫系統。
3.2 設計難點
(1)同城、異地災備中心的網絡切換
在交行卡中心災備系統的建立過程中,由于不同的機房之間的網絡IP地址不同,因此要解決同城、異地災備情況下進行合適的網絡切換的問題。在進行網絡切換時,往往需要考慮的因素包含了從網絡層、存儲層、主機系統層三個層次的網絡切換問題。當選擇不同的災備方案時,具體的網絡切換需求也有所不同,也就是說當生產中心出現災難時,選擇同城災備與選擇異地災備時,會產生不同的網絡切換方案。
(2)不同機房的虛擬機之間的數據復制
在交行卡中心災備系統正常使用的過程之中,不同的虛擬機之間的數據需要進行復制,此復制過程關系到各個站點機房(生產中心、同城災備中心、異地災備中心)之間的數據信息能否正常且高效地傳遞,因為,良好穩定的數據復制傳輸才可以有效保證虛擬機災備系統的正常運行,交行卡中心現有的災備系統中,虛擬機之間的位置關系、網絡架構較為復雜,因此就需要設計出完善的虛擬機數據復制過程。
4 虛擬機災備系統建立對策
4.1 數據復制方案的設計與實施
4.1.1 通過存儲進行復制
通過綜合考慮,我們選擇了通過存儲來實現進一步復制的方案,將所有需要災備管理的虛擬機所在的LUN通過存儲復制到災備端。正常工況下,災備端虛擬機的LUN呈現只讀的模式,會通過腳本的方式把所有虛擬機清單建立;非正常工況下,例如處于災備演練狀態或者主站點出現災難而需要進行災備管理的時候就需要通過腳本啟動虛擬機。
(1)方案拓撲
(2)災備流程
災備流程主要針對非正常工況下需要進行災備管理的狀態,虛擬機會實現從主機房切換到災備機房,通過存儲復制方式,由腳本把虛擬災備機房掛載到災備的VCenter的清單中,然后開啟虛擬機,再通過腳本的方式配置IP地址、網關和DNS,然后進行應用驗證其是否正常,最后進行業務驗證。
(3)優缺點分析
優點是成本低,部署方便;缺點是恢復復雜,腳本套腳本,容易出錯,耗時長,RTO沒有保障。
4.1.2 通過SRM進行復制
交行卡中心虛擬機系統設計通過SRM進行VR復制,通過SRM進行調度恢復,在部署SRM服務器和vCenter、ESXi和VR版本實現兼容的前提下當遇到需要進行災備管理的情況時,故障主站點如果要實現切換到同城災備站點,只需要一個按鈕,就可以按事先的設置方案進行切換,無須人工和腳本干預,IP地址和DNS都會按事先的設置方案自動配置。
4.1.3 方案選擇
根據前期的調研和對比,我們使用SRM站點恢復管理軟件的方式來做虛擬機同城災備,因為需要災備的虛擬機有400多臺,后期可能因為系統的調整,需要做災備的虛擬機會越來越多,怎么在滿足監管要求的同時,做到滿足業務的實際需求,做到操作便利都是需要進行考慮的問題。
4.2 網絡切換方案選擇
4.2.1 同城災備網絡切換
同城災備實施全網切換的時候需要考慮網絡層、存儲層以及主機系統層三個方面的切換。
網絡層:網絡層的主要作用是當生產中心網絡完全不可用的時候來實現所有分行的切換和連接。
存儲層:儲存層作為災備中心儲存數據的一層,當主機的存儲設備被控制或者同步數據復制鏈路被斷開后來進行自動切換。當同步數據復制鏈路恢復后,儲存層中更新的數據會自動復制回生產中心的存儲設備中。
主機系統層:同城災備系統使用的是DNS機制,因此,主機系統層的應用訪問可以平滑的在生產中心和同城災備中心間遷移,無須進行切換。
4.2.2 異地災備網絡切換
網絡層:當出現同城災備中心及生產中心網絡斷開而無法服務時,所有的網點切換、分行及外聯都由異地災備中心的網絡層進行連接。
存儲層:異地災備中心的主機持續進行遠程復制(CRR)災難恢復模式的時候,可對異地災備中心的存儲數據進行訪問。當停止對異地災備中心存儲的訪問的時候,再將全系統的同步數據復制關系進行重新恢復,來實現對更新的數據進行回切。等數據同步完成后通過對全系統的數據復制關系進行反轉,最后恢復到原生產模式。
主機系統層:異地災備的實現通過采用DNS訪問方案,對原有應用服務的訪問方式的IP地址進行修改實現。
4.2.3 DNS方案設計
本次DNS為硬件設備,DNS切換總體方案采用緩存遞歸和權威分離的架構,可以實現流量精細化的控制、區域之間的邊界安全策略、滿足客戶端和服務端快速查詢的需求以及分離DMZ區用于權威域名資產安全的管理。
本次部署的設備總計8臺,數據中心劃分為生產區、辦公區、測試區。每臺DNS設備生產端口均雙上聯交換,綁定模式為動態鏈路聚合,實現鏈路冗余。采用與負載均衡設備聯動方式進行部署,所有的DNS由SLB提供VS訪問入口,所有的服務端DNS主指向本區域SLB VS地址,備指向異地中心相同區域的SLB VS地址。
5 結束語
在災備方案設計當中會牽扯到各種各樣的虛擬化內容,包括機房的建設、網絡方案的設計選擇、DNS方案的設計選擇、存儲方案的設計選擇等,這些內容都需要虛擬化的災備和恢復方案。筆者在本次同城災備的研究之中從前期的準備到方案調研、IP地址的變換、使用DNS方式等過程都經過了反復的論證最終得出適合交行卡中心的方案。在關于虛擬機災備方案的選擇之上,筆者以數據信息的復制與恢復、災備系統各模塊之間的關系、建立保護組等作為重點研究內容,在確定好最終網絡方案后對其進一步做了實現。確保交行卡中心的虛擬機災備系統的建設能夠滿足監管和實際業務的要求,當主機房發生故障時,可以快速切換到災備機房,為交行卡中心的同城災備系統的信息化、數字化、現代化建設,打下了良好的基礎。
參考文獻:
[1] 閆瑾,宮思明,姚丹,等.信息系統容災備份技術探討[J].信息與電腦(理論版),2020,32(12):46-48.
[2] 韓瑩利.數據同城災備系統的建設思考[J].數字技術與應用,2019,37(12):232,234.
【通聯編輯:代影】