安徽省交通運輸綜合執法監督局 劉新華
執法數據是交通運輸領域的重要數據,快速可靠的數據備份是系統穩定可靠運行的重要保障。隨著云服務技術的飛速發展和日趨成熟,云災備提供了兼顧本地數據備份和異地云端備份的功能。本文闡述了交通運輸行政執法系統云災備服務的建設背景和技術方案研究。
現代信息管理越來越網絡化,數據共享程度越來越高。安徽省部省共建交通運輸行政執法綜合管理系統(以下簡稱“部省共建執法系統”)隨著業務發展和信息化建設的推進,應用系統和存儲數據不斷增加,各應用系統間數據共享程度越來越高,系統故障、病毒破壞、自然災難等不可測突發事件造成的應用系統服務中斷及數據丟失會給管理造成很大影響。因此建設一個可以有效應對突發情況、抵御或者化解風險的異地災備系統,以保障系統的高可靠性、可用性是非常必要的。異地災備系統的核心就在于將災難化解,一是保證行業數據的安全,二是保證業務的連續性。云災備兼顧傳統的本地數據備份和異地災備,具有基礎設施投入減少,成本節約,高度機動性和靈活性,快速恢復,安全可靠諸多優勢。
部省共建執法系統旨在提供全省“一站式”交通運輸行政執法綜合服務,建設任務概括為:“一中心平臺+多系統+多終端+一支撐+一安全+一云災備”。
(1)“一中心平臺”:執法數據中心及交通行政執法數據共享平臺建設。搭建交通運輸行政執法數據中心,完善數據交換共享接口,建立統一的信息發布和共享交換機制。(2)“多系統”:面向全省交通運輸行政執法業務應用對象,搭建統一執法平臺,包含:執法協同辦案系統、執法人員管理系統等10個子系統,實現省市縣三級的執法協同與處置聯動管理。(3)“多終端”:根據一線執法業務需要,建設多套執法終端系統,提升一線執法線索證據信息采集能力,智能感知能力。(4)“一支撐”:依托現有安徽省軟硬件支撐環境,擴充本次工程相關支撐環境:包括主機及存儲系統、網絡系統、應用支撐軟件等。(5)“一安全”:安全運維保障建設。按照安徽省安全等級防護要求,升級完善已有安全運維軟件環境:包括安全門戶、安全運營維護、遠程監控檢測等功能,全面提升加強整體安全防護能力。(6)“一云災備”:提供部省共建執法系統異地災備專業服務,對異地災備平臺進行運維監控管理和服務。云災備將實現應用系統及重要數據異地備份,建立災難恢復機制,保證系統在遭遇人力不可抗拒災難期間的對重要數據的保護及恢復,并且隨著后期數據量的快速增長,支持備份空間快速擴容需求。如表1所示。

表1 云平臺與傳統物理服務器建設模式優勢對比Tab.1 Comparison of advantages of cloud platform and traditional physical server construction mode
災備服務部署采用“云”部署模式,具體建設方案如下:
部省共建執法系統,異地災備系統應該達到以下目標:
(1)建設異地數據中心,為關鍵業務系統及核心數據提供數據異地備份,實現系統重要數據異地存放,當本地發生災難后,從災備中心能及時恢復數據,實現災難發生后災備中心對系統數據恢復還原。異地容災技術指標達到:RPO(允許丟失數據時間)為24h;機房網絡正常時,RTO(恢復時間目標)為24h;機房網絡不通時,RTO為48h。(2)提供云災備專業服務,對部省共建執法系統異地災備平臺進行運維監控管理和服務,制定災備演練方案和流程,定期驗證異地容災的可用性,確保災備系統穩定運行。
災備基礎平臺基于云計算技術建設,通過云平臺上虛擬化生成的云主機構建災備基礎平臺,至少保留3份全量數據備份副本文件,通過安全接入區設備實現對災備基礎平臺安全防護并部署出口、訪問源限制等有效安全保障措施。系統框架如圖1所示。

圖1 系統框架Fig.1 System framework
本項目的云平臺構建從接入層、傳輸層、應用層、數據存儲層及運維層的全方位信息安全保障,通過專線電路接入云平臺,具有以下技術安全保障:
(1)云平臺邊界防護。云平臺在其內網邊界設置有專門的邊界防護區,所有的應用訪問請求將通過邊界防護區與互聯網進行連接,邊界防護區通過專門的邊界防護手段保證內網應用系統和業務數據的安全性。包括:防火墻、DDOS防護、入侵防御、流量分析。(2)網絡隔離技術。每個項目對應一個VLAN,每個項目的虛擬機位于該VLAN內部,VLAN的隔離性由交換機及各主機上的虛擬化引擎保證。(3)數據安全保護。云平臺對信息進行全生命周期的安全管控,包括信息的創建、存儲、應用、共享、存檔與銷毀,具體技術手段包括:數據隔離、數據加密、剩余信息保護、數據備份等。
容災平臺采用“本地前置備份+遠程云備份”相結合的整體方案,災備技術方案系統框架如圖2所示。

圖2 災備技術方案系統框架Fig.2 System framework of disaster recovery technical solution
災備平臺由云災備管理服務器、策略服務器、客戶端服務器及備份空間4部分組成,通過高速、安全的IPRAN專線電路與系統所在機房聯接。災備中心基于云計算平臺,配置與部省共建執法系統性能相當的云主機做為核心系統的備份服務器,主控服務器將備份策略下發到備份服務器,相應備份服務器負責發出指令通知部省共建執法系統所部署客戶端進行異地容災備份,在出現災難性事件的緊急情況下按約定容災策略恢復。具體實現流程為:
(1)在云災備中心部署云災備管理主機和云災備系統控制臺,集中管理云災備系統。(2)在本地數據中心部署災備一體機,數據先備份到災備一體機上,再災備到云災備中心。(3)在云災備中心部署2臺云災備管理主機,與備份存儲空間相連接,用于存取備份數據,并管理去重計算。(4)在本地生產中心的生產主機上部署相應的IDA軟件(備份代理軟件),負責讀取生產數據傳送到云災備管理主機。(5)在云災備中心,部署數據恢復測試機,平時可進行數據恢復測試,供開發測試使用及數據驗證,發生災難時作為生產機使用,從而保證業務的正常運行。
部省共建執法系統選用的是運營商的云災備服務。
電信運營商容災機房運營由全職技術骨干組成專業化維護團隊,提供7×24h一體化監控,故障告警及閉環處理管控,面向用戶實現一個窗口提供機房運營管理服務。
根據部省共建執法系統容災備份服務項目要求,當部省共建執法系統出現故障時,災備服務提供商將在接到通知或監測到后10min內做出響應,在規定時間內啟動災備系統進行接管。
容災不是簡單的設備冗余。還應著重考慮管理層面的問題。容災應急預案根據系統運行實際,按照GB/T-20988《信息系統災難恢復管理規范》等我國政府出臺的相關方針、政策中的要求設計,滿足系統災難恢復需求,內容包括:
(1)災難應急恢復組織:包括災難應急恢復組織涵蓋范圍、災難管理組織結構。災難管理組織結構中定義災難發生前、中、后各相關人員的職責;災難恢復流程書面化各恢復工作的流程和執行步驟。(2)容災恢復場景管理:根據生產系統發生災難導致現有環境不能對外提供服務的情況,梳理細化與異地災備中心容災恢復切換場景,并針對不同容災場景制定業務切換、恢復重要操作,實現在接到災難宣告后,下達指令即可快速啟用異地災備中心,隨后通過生產中心的恢復,重新啟動生產中心業務系統,將業務從異地災備中心切回至生產中心實現正常對外服務。(3)容災恢復切換流程:根據設定的容災場景進行相應的實施操作,保證業務系統始終對外提供服務,做到用戶無感知,保障核心業務訪問。(4)容災演練實施:災備演練關鍵步驟、災備演練服務目標、災備恢復及重續工作流程、災備重建及回退工作流程等。
自部省共建執法系統上線以來,已備份數據近900G,通過建設部省共建執法系統的云災備中心,實現應用系統重要數據備份,保證系統在遭遇人力不可抗拒災難期間的對重要數據的保護及對數據的恢復,具有穩定性、自動化、擴展性、快速恢復、操作簡單、易管理等優點。