熊延萍
容災備份是指為防止系統出現軟硬件故障、人為誤操作、自然災害等造成系統宕機、數據丟失,而將全部或部分系統文件和數據資源復制到備份介質中。當系統宕機、數據丟失時,可從備份介質中恢復。為確保北京數字檔案館(電子文件中心)系統數據的安全性和可持續性,建設高效可靠的容災備份體系是至關重要的。
一、概述
北京數字檔案館(電子文件中心)的容災備份體系建設,本著先進性、可靠性、可擴展性的原則,針對系統中不同數據對象和數據量,設計相應的備份架構,采用不同的備份策略,確定相應備份頻率、介質、容量等,在北京市檔案館專網、政務外網、因特網分別建設部署。
其中,北京市檔案館專網與政務外網和因特網是完全物理隔離的,而政務外網和因特網則采用的是邏輯隔離。
二、備份架構
北京數字檔案館(電子文件中心)的容災備份體系主要通過高性能共享文件系統、備份軟件和物理磁帶庫等,在北京市檔案館專網與政務外網、因特網上實現自動化的本地備份,確保系統和數據的有效備份與恢復。總體架構圖如圖1所示:
在北京市檔案館專網部署獨立的備份系統域(圖1中備份域1),使用一套備份數據管理軟件和備份設備,實現網內業務系統的自動化集中備份;同時考慮應用需求,采用先進的共享文件系統,以滿足多應用同時訪問同一數據對象的需求。
在北京市檔案館政務外網和因特網內部署統一的備份系統域(圖1中備份域2),兩網共用一套備份數據管理軟件和備份設備,使兩網內業務系統可自動化集中備份,實現備份系統在兩網間的統一管理。
備份架構在設計選型時考慮如下因素:
一是備份服務器應可建立在集群服務器上,實現物理冗余;還可在異地部署災備備份服務器,實現邏輯冗余,以便本地備份系統發生重大故障時及時恢復。
二是多個介質服務器可共享同一物理磁帶庫設備,介質服務器與物理磁帶庫之間采用冗余備份鏈路,避免單一鏈路失效導致備份失敗。
三是為便于靈活操作,備份軟件還應支持數據庫圖形化備份/恢復操作;對于文件和數據庫的備份/恢復,應支持自動斷點續傳和異機恢復等功能等;還應支持單文件、單虛擬機、物理機等不同恢復方式,以及傳統客戶端備份配置的全備份、增量備份等備份方式。
(一)專網備份架構
專網備份架構設計應考慮網內各個業務系統,包括數據庫應用及文件類應用,涉及的數據包括結構化數據(如數據庫文件)及非結構化數據(如紙質檔案數字化副本、照片檔案、音視頻檔案數字化副本等)。結構化數據采用一體化備份數據管理平臺實現集中備份管理;非結構化數據采用集成高性能共享文件系統,在實現數據共享訪問的同時,利用基于共享文件系統的存儲管理功能,結合近線存儲和大容量物理磁帶庫多級存儲設備,實現數據的自動分層歸檔和分級存儲,并可歸檔多份數據副本,實現歸檔數據的備份。因此,專網備份以傳統備份和遷移歸檔兩種方式結合完成。專網備份架構如圖2所示:
其中,物理磁帶庫分為兩部分:一是作為傳統備份軟件的專用備份設備;二是作為高性能共享文件系統的專用歸檔設備,作為分層存儲體系中的三級帶庫存儲。
該架構可實現磁盤-磁盤-磁帶(D-D- T)的備份模式,只需在二級大容量低速存儲陣列中劃出一塊磁盤空間(圖2中磁盤備份空間)給備份服務器,將數據庫數據及需要快速恢復的業務數據備份到此空間,通過備份軟件的輔助拷貝功能將備份數據拷貝到物理磁帶庫。磁盤數據應設置較短的保留周期,便于騰出空間繼續備份新的數據,磁帶庫的備份數據應設置較長的保留時間,以便長期保存。
(二)政務外網和因特網備份架構
政務外網和因特網之間采用邏輯隔離,故在不影響業務系統和網絡運行的前提下,在兩網間部署一體化的備份管理系統,共享一套備份物理磁帶庫資源,在節省投資的同時,更有利于兩網備份的統一管理和資源優化利用。政務外網和因特網的統一備份架構如圖3所示:
物理磁帶庫同時接入到政務外網和因特網的存儲區域網絡(SAN),為兩網分配不同的磁帶驅動器。各業務服務器分別部署備份軟件的客戶端模塊,通過專用備份通信鏈路接收來自政務外網、因特網備份管理服務器的控制指令,經各自的存儲區域網絡將各業務服務器上的數據備份到磁帶、磁盤陣列等設備中。整個過程中,政務外網與因特網僅共享同一個物理磁帶庫資源,并沒有備份數據流交互,從而實現了邏輯隔離。
該架構同樣可實現磁盤-磁盤-磁帶(D-D-T)的備份模式,具體策略同專網備份架構相同。
三、備份策略
備份策略需要考慮備份方式、備份對象、備份頻率等,按照備份對象的不同確定相應的備份頻率、介質、容量等。
北京數字檔案館(電子文件中心)主要采用LANFREE備份方式,此種備份方式中數據流不經過局域網(LAN)而直接從磁盤陣列通過存儲區域網絡備份到物理磁帶庫中,無需占用局域網網絡帶寬,從而提高業務系統的網絡資源利用率。
由于磁帶介質較其他備份介質單位容量成本更低、保存期更長(最長可達50年)、性能更穩定、耗能更低,且磁帶讀寫分離,運輸更方便,是一種性價比較高、更可靠的大容量長期保存和備份介質,是北京數字檔案館(電子文件中心)備份介質的首選,同時結合選取大容量低速(較低成本)磁盤陣列作為磁盤輔助備份,達到快速恢復的目的。
另外,應根據現有檔案數據、系統管理數據及工作增量計算出所需磁帶的數量,并結合當前信息技術的現狀及發展趨勢,確定性價比較優的磁帶類型、物理磁帶庫和磁盤陣列設備。其中,物理磁帶庫可以方便擴容,如可增加磁帶數目或增加磁帶驅動器數目,提高備份容量和并行備份能力。
(一)操作系統和應用系統的備份
服務器操作系統和應用系統是支撐業務系統正常運轉的基礎,一旦這些系統文件丟失或出錯,重新安裝系統所需時間較長,為了快速恢復系統,需對這些系統文件和數據進行備份。
備份對象主要包括操作系統和應用系統的安裝、配置文件,由于其重要性,采取全備份方式。操作系統和應用系統正式投入運行后,產生變更的情況較少,故采取每月一次的定期全備份;此外,需在系統初次安裝完成及每一次配置更改后,由系統管理員手動執行一次全備份。此部分數據量不大,可在磁帶和磁盤中進行雙備份,用于快速恢復,磁帶和磁盤的數據保留時間可設置為3個月。
當然,有一些系統文件,存有與日常業務運行相關的數據文件,且這些文件變化較頻繁,具體的備份策略應視系統文件的大小、更新頻率及系統恢復時間點目標、系統恢復時間目標而靈活確定。
(二)數據庫的備份
數據庫是北京數字檔案館(電子文件中心)系統中關鍵應用,也需要快速恢復,故對數據庫采取每周做一次定期全備份;同時,考慮到數據實時變化,故每周其他時間做定期增量備份,縮短備份時間,減少對磁帶的使用。可設置為:周一至周六晚做定期增量備份,周日晚做定期全備份等。此種策略結合定期全備份和增量備份兩種方式,保證數據快速恢復到指定時間點,靈活與可靠并行。此部分數據量也不大,也可在磁帶和磁盤中進行雙備份,磁帶和磁盤的數據保留時間可設置為3個月。
(三)檔案數字資源的備份
北京數字檔案館(電子文件中心)系統的核心是檔案數字資源,一般包括傳統載體檔案數字化副本、電子檔案、電子資料和數字編研成果等以數字形式存在的各類檔案資源,因此,檔案數字資源備份容災是備份體系的核心所在。考慮到檔案數字資源數據量巨大,目前為數百TB,將來會繼續增多,故選取磁帶作為大容量長期保存介質。由于數據量大,采用每年一次的定期全備份方式,考慮每天可能會有新增檔案數字資源,故每天固定時間點做定期增量備份,如每晚做定期增量備份。
為確保檔案數字資源的安全,不僅要做好本地備份,還應開展同城、異地備份工作。
北京市檔案局(館)按照國家檔案局的相關要求,開展重要檔案異地備份工作,于2012年制定了《館藏檔案數字資源備份策略》與《館藏數字檔案資源備份實施方案》,明確了每兩年進行一次數據同城(市災備中心)、異地(陜西省檔案館)備份工作,定期將磁帶自動出庫,由專人負責運輸到異地保存。
截止2016年10月,北京市檔案館已完成了兩輪全市檔案異地備份數據(市檔案館及十六區檔案館的數據)同城、異地數據備份工作以及第一輪同城、異地備份數據恢復驗證工作,經驗證,全市檔案異地備份數據可讀、正確。
四、結語
隨著電子政務和信息化技術的快速發展,檔案管理工作越來越依賴信息系統,業務數據的丟失、應用系統的停止、網絡的異常等造成的損失也越來越大。因此,積極建設容災備份體系,對檔案部門具有越來越重要的價值。我們將結合實際工作,總結經驗,不斷完善本地、同城、異地備份和恢復策略,完善容災備份體系建設,確保北京數字檔案館(電子文件中心)系統中檔案數字資源的安全、長期保存,進一步提升災難應對能力。
參考文獻:
王建文.北京數字檔案館(電子文件中心)存儲體系建設[J].北京檔案,2017(5):7-9.