摘要:文章針對目前主流的災備技術進行深入分析,通過剖析現有災備關鍵技術,將災備技術體系化,為信息化系統的災備建設提供強有力的技術支撐,讓更多的人關注災備系統的建設,提升信息系統的安全保障水平。
關鍵詞:數據復制;持續數據保護;副本數據管理;網絡切換
doi:10.3969/J.ISSN.1672-7274.2023.02.060
中圖分類號:TP 309.3" " " " " " " "文獻標示碼:A" " " " " " " "文章編碼:1672-7274(2023)02-0-03
Research on Disaster Recovery Technology System
QI Ke, ZHAO Hongwei, PANG Songtao
(Henan Information Consulting Design and Research Co., Ltd., Zhengzhou 450000, China)
Abstract: This paper makes an in-depth analysis of the current mainstream disaster recovery technology, systematizes the disaster recovery technology by analyzing the existing key technology of disaster recovery, provides a strong technical support for the construction of the disaster recovery of the information system, allows more people to pay attention to the construction of the disaster recovery system, and improves the security level of the information system.
Key words: data replication; continuous data protection; replica data management; network switching
本文通過對災備關鍵技術的跟蹤研究,探討建立災備技術體系,主要包括數據復制技術、持續數據保護技術、副本數據管理技術、網絡切換技術、重復數據刪除技術和數據傳輸技術等內容。
1" 數據復制技術
(1)基于存儲設備的復制技術,將磁盤陣列的控制器分散部署于兩地,通過控制器對磁盤陣列中的數據塊進行遠程復制,從而實現生產數據的災難保護。這種方式需要同構存儲,一般要求同等品牌甚至同等型號的存儲陣列之間才能實現,復制性能相對較高,但由于是塊級別的數據拷貝,對傳輸的要求較高,一般需要采用裸光纖直連的方式。基于存儲設備的復制是雙向的,與上層主機和應用無關,實施難度相對較小,采用這種方式的容災方案對網絡連接及硬件的要求均較高,投資相對較大,主要適合采用集中式存儲、存儲平臺單一的信息系統[1][2]。
(2)基于存儲虛擬化的復制技術是伴隨著存儲局域網的出現被引入的,通過構建虛擬化存儲,把物理存儲介質抽象為邏輯存儲空間,利用位于服務器與存儲之間的存儲網關,對后端的存儲數據提供遠程數據復制、異構化存儲融合、數據遷移等功能。這種方式與存儲平臺無關,可以異構存儲,有效利用已有的硬件資源,將各種異構的存儲統一成單一視圖的存儲資源,適合用于采用集中式存儲、擁有較多型號存儲平臺的信息系統[2][3]。
(3)基于主機的復制技術是通過磁盤卷的鏡像或復制進行的,業務進行在主機的卷管理器層,對硬件設備尤其是存儲設備的限制小,基于主機的數據復制也不需要兩邊采用同樣的存儲設備,具有較大的靈活性,缺點是復制功能會占用一些主機的CPU資源,對軟件要求較高,對主機的性能有一定的影響。基于主機的數據復制技術通常適合單一應用或系統在I/O規模不大的情況下使用[1][2]。
(4)基于數據庫的復制技術包括物理復制和邏輯復制兩種方式。物理復制是通過redo log日志或者歸檔日志在副本站點的同步或者異步持久化寫來實現復制功能,同時副本站點的數據可以提供只讀功能;邏輯復制是利用數據庫的重做日志、歸檔日志,將主本所在站點的日志傳輸到副本所在站點,通過重做SQL的方式實現數據復制。基于數據庫的復制技術一般包括由數據庫廠商提供相關模塊和第三方廠商提供遠程復制管理軟件兩類,對主機和存儲的限制較小,基于IP網絡,帶寬要求較低,但會占用部分生產系統數據庫資源,對數據庫的性能有一定的影響,主要適合用于異構平臺的信息系統[1][2][4]。
(5)基于應用層的復制技術通過應用系統與主備中心的數據庫進行同步或異步的寫操作,以保證主備中心數據的一致性。災備中心可以和生產中心同時正常運行,既可容災,也可實現部分功能分擔。但是該技術的實現方式復雜,與應用軟件業務邏輯直接關聯,需要對現有業務軟件系統做比較大的修改升級,甚至重新開發,對業務系統性能有較大的影響[1][4]。
2" 持續數據保護
持續數據保護(CDP)通過持續監控數據變化,將數據的變化實時傳輸至災備環境。在恢復時,可以指定時間點和目標位置進行快速恢復,保持業務連續性。CDP兼具數據備份與數據恢復的功能,通過采用CDP技術,可以實現秒級的細粒度抓捕效果。目前,主流的CDP有很多維度,采取不同的技術維度,所獲得的數據還原細粒度也有所差別,根據恢復的細粒度的大小,業界將CDP分為真CDP(True CDP)和準CDP(Near CDP)。真CDP可以實現數據零丟失,可恢復到過去任意時間點;準CDP的功能接近CDP的功能,數據備份存在延時,存在部分數據丟失的風險[2]。
CDP技術有多種實現模式,從操作方式看,主要可以分為卷級CDP、文件級CDP和應用級CDP[2]。
(1)卷級CDP:以磁盤分區為保護粒度,磁盤驅動程序監控磁盤塊數據變化,當有數據塊寫入生產數據的存儲設備時,通過記錄數據差異事件日志的方式或通過對數據卷持續快照的方式,將變化數據和時間戳等一同通過網絡傳輸到備份端保存[6][7]。
(2)文件級CDP:以文件/目錄為保護單位,文件驅動程序監控文件系統上的數據變化,將文件的變動記錄下來,將變化的數據和時間戳等一同通過網絡傳輸到備份端保存。備份數據在目標端有一份基準數據,變化的備份數據存儲在log區內。當需要恢復某一時刻的數據時,可將最原始的基準數據與某一時刻之間的變化數據進行臨時合成,按需選擇恢復[6][7]。
(3)應用級CDP:以應用系統為保護對象,以SQL語句為單位,通過分析數據庫日志,得到數據庫操作的SQL語句并將發送到備份端保存,直接運行CDP功能對應用系統進行保護。應用級CDP能夠和應用進行深度融合,數據的一致性更高,管理也比較靈活,易于用戶部署和實施,但對應用系統會產生一定的影響[6][7]。
3" 副本數據管理
副本數據管理(CDM)是指從生產環境通過快照技術獲取具有應用一致性保證的數據,在非生產存儲上生成一個完整副本,完整副本是克隆最近一個時間狀態生產環境中的全量數據。完整副本通過快照和虛克隆方式,可以生成任意多個虛擬副本,用于呈現某特定歷史時間的數據,并可直接掛載使用。當需要對源主機數據或系統數據進行更改時,副本會通過變化塊跟蹤技術進行實時或定時地捕捉變化的數據,在需要進行數據恢復時,通過數據快照技術虛擬出多份數據副本,用戶可以進行讀寫操作,提高數據處理速度[8][9]。
副本數據管理通常采用“首次全量+永久增量”的備份方式,在系統層、數據庫層等進行數據快速采集,然后根據用戶環境設置相關策略,通過直接掛載服務器的方式,快速恢復用戶的數據及業務。副本數據管理可實現任意備份時間點數據直接掛載供外部系統讀寫使用;數據副本的任何讀寫操作不改變原始備份數據;一個完整副本可虛擬出多個副本供多個外部系統使用,互不影響;虛擬副本不占用單獨的完整存儲空間[8]。
副本數據管理應用較為廣泛,在生產環境中可以實現應急接管、容災演練等,可極大降低災難恢復RTO;在非生產環境中,數據副本可供開發測試、數據分析、數據審查等任意需要使用數據的工作掛載使用;另外還可進行災難恢復能力的驗證,以保障數據恢復的可用性和有效性。
4" 網絡切換技術
目前,網絡切換技術主要有三種:IP地址手工切換、DNS重定向切換、負載均衡切換。
(1)IP地址手工切換。基于C/S架構開發的應用系統其業務選擇一般都基于IP地址進行選路,要求業務系統能夠基于IP地址對外發布。在主備模式下,生產中心和災備中心應用服務器配置相同的IP地址,但正常情況下,災備中心的IP地址是關閉著的,用戶通過唯一的IP地址訪問生產中心應用服務器。當生產中心發生災難時,管理員通過手動操作設置災備中心的IP地址可用,這時用戶通過唯一的IP地址訪問災備中心應用服務器[10][11]。
(2)DNS重定向切換。DNS重定向是雙活數據中心常使用的一種網絡切換技術。要實現DNS重定向切換,需要在生產中心和災備中心分別部署一臺具有應用感知功能的DNS服務器,并使兩臺DNS服務器保持同步。當用戶需要訪問某一個應用服務器時,系統首先會將請求發送到DNS服務器進行處理,DNS服務器根據發送的用戶請求,會將一個URL對應兩個IP地址(即生產中心的主IP地址和災備中心的備IP地址),當生產中心正常運行時間,DNS會將生產中心服務器的IP地址回傳給用戶,用戶可以正常訪問生產中心的應用服務器;當生產中心發生故障報錯或整體癱瘓時,會導致生產中心檢測不到應用服務器甚至會停止服務。此時災備中心服務器會將IP地址回傳給用戶,使得用戶訪問災備中心應用服務器,從而保證了用戶的應用操作[10][11]。
(3)負載均衡切換。負載均衡設備的切換是通過部署跨數據中心的全局負載均衡和服務器負載均衡高可用集群技術,實現應用負載流量分發,為用戶提供服務,并對服務器可用性進行維護。負載均衡設備具有應用感知功能,可以監控數據中心應用服務器等的狀態,當生產中心正常時,負載均衡器接收來自客戶端的傳入流量,并將請求路由到一個或多個可用區的后端云服務器實例上進行處理。通過路由策略設置IGP的COST值、BGP的MED、AS_PATH屬性使得業務流量優選生產中心。當生產中心發生災難時,請求連接的用戶只能收到來自災備中心的主機路由,使得用戶只能訪問災備中心應用服務器,從而實現應用的切換。負載均衡結合DNS是實現業務雙活的關鍵技術,可以滿足兩地同時提供業務服務的需求,減少資源浪費[11]。
5" 重復數據刪除技術
根據備份策略,通常備份的數據會保存多個數據副本,留存較長一段時間,且備份數據中有大量的相同的數據,比如同一個數據源的多個完整副本,又或者是不同數據源擁有大量相似數據。如果備份系統要保存所有數據源的多個副本的備份數據,將會消耗巨大的存儲空間。基于此產生了比數據壓縮更加節省空間的重復數據刪除技術,其執行過程如下。
首先,將備份數據流進行切片處理,即將數據流切割成一小塊一小塊的,重刪將以數據塊為單位進行;其次,通過算法得出的數據塊的特征值,若兩個數據塊特征值相同則說明兩個數據塊是相同的;最后,通過對比查詢僅將未重復的數據塊發送并存儲。
重刪技術涵蓋源端去重和目標端去重,技術分類包括相同數據的檢測技術、相似數據的檢測與編碼技術。需要注意的是,并非所有的災備技術都需要用到數據重刪,CDP技術在源端就可以有效解決數據重復傳輸的問題。
6" 數據傳輸技術
生產中心與災備中心之間數據傳輸技術一般分為基于IP的互聯和基于裸光纖+波分的互聯。基于IP的互聯只需要保證在生產中心與災備中心的邊緣設備之間IP可達就可以實現數據中心間的互聯互通,成本較低,但是這種方式僅支持以太網報文傳輸,且無法保障傳輸時延。
采用基于裸光纖+波分的數據傳輸方式是在生產中心和災備中心分別部署DWDM設備,DWDM設備之間采用裸光纖進行互聯,通過將不同路由的兩條線路互聯來保證線路的冗余性及可靠性。通過DWDM平臺,可在每對光纖中實現多路波長,每個波長均可實現光通道保護,并可承載多種協議,例如FC協議、IP協議等,可透明傳輸不同的業務,較好地解決了裸光纖的利用率和多協議復用的問題。基于裸光纖+波分的互聯需要投入DWDM設備和裸光纖資源,一般投資較大,但DWDM光纖網絡可以充分利用光纖的帶寬資源,傳輸容量巨大,且時延較低,在雙活場景中應用較為廣泛。■
參考文獻
[1] 劉彩霞.災難備份核心技術選擇[J].電腦知識與技術,2011,7(27):6650-6651.
[2] 吳其斌,周春磊,劉延東,等.信息系統災難備份技術綜述[J].國土資源信息化,2011(01):12-15.
[3] 瞿秋楊,武緯,劉曉明.淺談災難備份系統的技術選型[J].電子世界,2017(14):103-104.
[4] 楊珺.信息系統災備技術分析及方案設計[J].鐵路計算機應用,2022(08):52-56.
[5] 王雅超,黃澤剛,翟鑫.云計算環境下CDP數據保護技術探討及實現[J].信息安全與通信保密,2015(09):72-73.
[6] 劉建毅.持續數據保護技術[J].中興通訊技術,2010,16(05):5-8.
[7] 范昊,彭超.持續數據保護技術的研究[J].科技資訊,2006(31):17-18.
[8] 黃亮,郭穎.數據副本管理的技術應用實踐[J].網絡安全和信息化,2021(11):73-75.
[9] 曾祥洪.數據云化的實現——以數據副本管理激活備份數據[J].中國新通信,2019,21(13):50-51.
[10] 羅坤明.人民銀行省級單位災備中心網絡設計[J].金融科技時代,2015(04):87-89.
[11] 劉人元.保險行業應用級災備方案設計[D].北京交通大學,2014.