韋宇星
(廣西壯族自治區信息中心,廣西 南寧 530000)
壯美廣西·政務云于2019年3月基本建成,建設有互聯網區和公用網絡區的獨立云平臺。政務云在規劃建設之初,僅規劃建設本地備份系統,實現對政務云上的數據本地備份,主要向自治區級政務部門提供統一的IAAS層政務云資源服務,隨著廣西政務數據資源管理與改革的推進,現已承載800多個系統。壯美廣西·政務云是廣西政務服務開展的重要基礎設施,為保證政務云上信息系統的數據可靠,提供多種更安全的數據保護模式,因此開展壯美廣西·政務云災備體系的擴展建設十分必要。
較常見的容災模式可分為同城容災、異地容災、兩地三中心、雙活中心等模式。同城災難備份和異地災難備份各有所長,為達到最理想的防災效果,數據中心應考慮采用同城和異地各建立一個災難備份中心的方式[1]。綜合考慮容災模式的成熟度、建設成本等因素,結合自治區級各政務部門提出的具體需求,壯美廣西·政務云災備體系架構在原有本地災備的基礎上,構建“兩地三中心”模式,建設同城雙中心和異地災備中心。
壯美廣西·政務云構建的“兩地三中心”模式,RPO/RTO指標應至少達到以下要求。
1.2.1 同城數據備份與恢復
普通業務(等保備案3級系統),同城數據級全備份與恢復,RPO<60 s;重要業務(等保備案3級系統),同城數據級持續備份與恢復,RPO<10 s[2]。
1.2.2 同城應用切換及發布
重要業務(等保備案3級系統),同城基于軟件備份的系統恢復與發布服務,RPO<60 s;關鍵業務(等保備案5級系統),同城應用級應急接管與發布服務,RPO<10 s。
1.2.3 異地數據備份與恢復
全部業務,同城災備數據異地備份與數據恢復,RPO≤30 min;生產中心本地備份數據異地備份與數據恢復,RPO≤24 h。
經過統籌考慮,“兩地三中心”的災備服務內容包括數據備份服務和關鍵應用系統接管服務設計,服務如下。
1.3.1 同城數據級全備份與恢復服務
對生產中心主機(含虛擬機和物理機,不包含實施應急接管服務和重要數據庫系統實時備份與恢復服務的主機)基于備份軟件進行準實時同步備份,實現每臺備份主機在同城災備中心有一份準實時克隆備份數據。
1.3.2 同城數據磁盤陣列級異步復制備份
對生產中心所有存儲在政務云集中式存儲系統上的數據進行磁盤陣列級異步復制備份,實現政務云集中式存儲系統上的數據在同城災備中心有一份克隆備份數據。
1.3.3 同城數據級持續備份與恢復
在同城數據級全備份與恢復的基礎上,可選擇部分主機中的重要目錄文件或數據庫進行持續數據保護,保留多份備份數據,并可恢復7天內任一時間點數據[3]。
1.3.4 同城應用級應急接管
對部分重要信息系統進行應急接管服務,應急接管服務實現生產中心的應用快速切換至同城災備中心運行。
1.3.5 同城重要數據庫系統實時備份與恢復
對部分重要應用的數據庫系統進行實時備份服務,服務支持數據庫系統的快速恢復及啟動運行。
1.3.6 同城應用級應急運行
在同城數據級全備份與恢復、同城數據級持續備份與恢復、同城應用級應急接管和同城重要數據庫系統實時備份與恢復的基礎上,可實現部分應用手動切換到同城災備中心運行,并向政務外網或互聯網提供服務。
1.3.7 同城災備數據異地備份與恢復
將同城災備中心的所有數據,包括同城數據級全備份與恢復服務、同城數據級持續備份與恢復服務、同城應用級應急接管服務和同城重要數據庫系統實時備份與恢復服務產生的數據遠程復制到異地災備中心保存,當發生災難時可將相關數據恢復到同城災備中心或生產中心。
壯美廣西·政務云生產中心位于南寧良慶區,同城災備中心在考慮機房條件和距離的情況下,機房選擇在南寧市高新區,距離生產中心直線16 km;異地災備中心機房選擇在來賓市運營商機房,距離生產中心162 km。
如圖1所示,在南寧同城容災中心的組網上,網絡區域化分為互聯網區、公用網絡區、安全管理區。在互聯網區、公用網絡區各自搭建同城災備云平臺,互聯網區云平臺負責生產中心互聯網區域業務的災備,公用網絡區域負責生產中心公用網絡區域業務的災備。安全管理區域承載本次項目所有的管理流量以及整個災備中心的網絡安全保障。在同城災備中心部署獨立的互聯網出口,可以實現互聯網區應用系統的切換發布;來賓異地備份中心僅做數據級災備,利用備份軟件實現操作系統層面數據存儲備份,不再建設云平臺。具體同城與異地災備的網絡互連設計如下:

圖1 網絡架構
(1)互聯網區域與公用網絡區物理上隔離,通過部署跨區域的數據交換系統實現受控的數據訪問和網絡互通。
(2)同城災備中心互聯網交換機與生產中心互聯網核心路由器之間通過2*10GE專線三層互連,實現信息系統應急接管后的業務發布訪問;公共網絡區與互聯網區域一致。
(3)災備中心互聯網接入交換機與生產中心互聯網核心交換機之間通過4*10GE專線互連,其中兩根接云廠商A核心交換機,兩根接云廠商B核心交換機,每兩根通過鏈路聚合的模式捆綁為一個邏輯接口,并在邏輯接口下配置trunk模式放通相關VLAN,生產中心接口也做相關配置,實現二層互通,打通災備中心與生產中心云平臺資源網絡,滿足備份數據流;公共網絡區與互聯網區域一致。
(4)災備中心所有區域的網絡、安全等設備均實現冗余部署,保證網絡可靠性。
針對容災項目實施,網絡設計為同城災備中心與生產中心網絡3層互通,保證同城災備云平臺上備份軟件控制機與所需安裝備份軟件包的虛擬機網絡互通。
2.2.1 同城數據級全備份服務網絡架構
數據級全備份涉及生產中心上所有信息系統,用20對1的方式進行數據實時同步,網絡采用三層互通的方式。
(1)備份軟件通過備份控制機進行策略下發,控制機分別與生產中心、災備中心虛擬機網絡可達。
(2)備份軟件數據同步工作是通過生產中心業務IP與同城災備中心對應災備機的數據復制IP可達實現。目前20個生產虛擬機數據同步至1臺災備中心的備份虛擬機內。
2.2.2 同城生產中心持續數據保護服務網絡架構
基于數據級全備份服務架構的網絡架構,可實現持續數據保護服務。
(1)災備中心承載災備數據的虛擬機與災備中心連續保護機器網絡可達,實現關鍵業務數據的連續保護,20個災備虛擬機數據同步至1臺連續保護虛擬機內。
2.2.3 異地數據級全備份服務網絡架構
異地數據級全備份涉及全網所有業務系統,采用20對1的方式進行數據定時同步,網絡采用三層互通的方式。
(1)異地備份軟件通過異地控制機進行策略下發,控制機與同城災備中心的備份虛擬機、異地備份虛擬機網絡可達。
(2)備份軟件數據根據帶寬完成對同城災備虛擬機在來賓異地的數據同步,實現20對1的備份。
2.3.1 同城數據級備份實施
采用多對一數據集中備份方式。生產中心4 000臺虛擬機,比例為20∶1,則在同城災備中心云平臺上開通200臺實時備份虛擬機。在生產中心的虛擬機、同城災備中心的實時備份虛擬機上安裝備份軟件,在災備控制機上啟動實時備份規則,全服務器備份任務首先會將源端系統所有數據(包括文件系統、用戶數據目錄)一次性同步到備份虛擬機上。
2.3.2 同城數據級持續備份實施
采用多對一數據集中備份方式。同城災備中心的200臺實時備份主機中獲取數據(原主機為≥1 000臺),按照20∶1的比例,開通10臺同城容災中心持續備份虛擬機,屬于一種級聯備份,啟動備份軟件的CDP功能,實現7天的數據持續性保護。
2.3.3 同城重要數據庫系統備份實施
同時采用一對一、多對一數據集中備份方式。未來將根據調研云租戶的具體結果,混合采用復制和備份技術開展備份。選擇采用備份軟件的解析數據庫在線日志的實時復制技術或基于文件系統實施復制的高可用技術。
2.3.4 同城應用級應急接管實施
采用一對一備份形式。生產中心虛擬機與同城災備中心的虛擬機一一對應,使用備份軟件的復制規則,將生產虛擬機直接復制至備份虛擬機,并且啟用應用高可用功能。
2.3.5 同城災備數據的異地備份實施
采用多對一的數據集中備份方式。備份同城災備中心的所有數據,包括200臺實時備份主機,50個數據庫的災備主機,50個應用(200個虛擬機),利用來賓異地中心的物理服務器開展備份。
一是構建異構解耦容災云平臺。具備云平臺無關性,實現生產中心和災備中心之間使用異構云平臺進行的統一災備,避免了品牌鎖定,增加整個政務云的數據可靠性,打造國內電子政務領域首例異構云容災方案。二是應用字節級復制技術。基于異構政務云的場景,采用業界領先的字節級復制技術,以傳統容災20%的資源實現政務云上信息系統的數據業務容災。三是提供全棧化的災備服務。提供從網絡、存儲、數據庫、虛擬化到應用的全棧容災技術,提供多樣化的容災服務,實現低成本、高可靠、高安全、滿足電子政務外網業務運行的主要場景災備。
本次項目災備體系建設,實現對壯美廣西·政務云生產中心進行同城災備及異地備份,實現生產中心每臺備份主機在同城災備中心有一份準實時克隆備份數據,并且可支持部分核心業務系統在同城災備中心同時進行恢復數據和啟動應用,滿足RPO小于30 s,RTO小于30 min的要求。