中國中鋼集團公司 瞿秋楊 武 緯 劉曉明
淺談災難備份系統的技術選型
中國中鋼集團公司 瞿秋楊 武 緯 劉曉明
很多大型企業或集團公司都應用了ERP系統等信息系統,企業的日常業務和信息系統的結合越來越緊密,傳統的磁帶備份技術所能達到的指標已經無法滿足基于數據庫的業務系統對可靠性和數據丟失容忍度的要求。通過災難備份(以下簡稱“災備”)系統的建設,企業一方面可以進一步提升信息系統的風險控制管理能力,提高災難恢復水平,保障業務持續運作,另一方面也可以滿足國家和行業主管部門的規范性要求,與此同時,還能對外樹立良好的社會形象,以增加客戶對企業的信心。
由于上線比較早且受到企業自身特點的限制,很多企業的信息系統未使用分布式存儲或云架構,關系型數據庫仍然是很多企業IT架構的組成部分。因此,我們接下來分析的災難備份系統主要適用于基于關系型數據庫的ERP系統,不包括分布式部署和云架構等架構。本文將以本企業視角來分析對比不同技術的特點和優劣,從而最終完成災備技術選型,希望能給同類企業以參考和啟發:
DataGuard是ORACLE 推出的一種高可用性(HIGH AVAILABLE)的數據庫方案,在8i之前稱之為standby database,從9i開始,正式更名為Dataguard,它是在主節點與備用節點間通過日志同步來保證數據的同步,可以實現快速切換與災難性恢復。
DataGuard是一種單一針對數據庫的災備技術,如果要滿足企業對ERP系統整體的備份需求,需要選取對數據庫代碼及應用服務的備份技術或單獨開發shell腳本完成對應用層的災難備份,所以基于DataGuard理念的純數據庫災備解決方案不能滿足完全滿足信息系統對災備系統的需求。
存儲設備鏡像復制技術的解決方案,主要依靠集成在存儲設備上的控制軟件管理,在存儲邏輯卷上生成快照,在通過生產中心和災備中心存儲設備(光纖交換機)間建立光纖鏈路完成數據的復制。在災備過程中數據流向示意如圖1所示:

圖1
基于存儲設備鏡像技術原理是生產環境數據的復制和保護通過存儲完成,磁盤快照生成、拷貝和傳輸通過光纖存儲的管理模塊實現,再將生產環境生成的鏡像通過光纖鏈路復制到災備中心的存儲設備,這個過程對生產中心和災備中心的主機是透明的。
基于存儲設備鏡像技術的解決方案依賴于存儲廠商的存儲產品,其典型的代表有IBM、EMC、日立、HP等存儲廠商,一般低端的存儲產品不支持用于災備的鏡像拷貝相關技術,故在災備中需要使用和生產中心同廠商的中端光纖存儲產品;另外,基于存儲鏡像拷貝的技術需要光纖鏈路來進行數據的傳輸。此類解決方案的案例覆蓋了很多電信企業、大型企業ERP系統,如山東聯通、云南聯通、中國鋁業ERP系統等。
結合案例分析可以發現,基于存儲設備鏡像復制技術更多的應用于通信行業的企業中,這是由于其對數據傳送帶寬有較高的要求,甚至需要在生產中心和災備中心間通過光纖鏈路來實現數據復制,而一般的企業難以承擔建設或租用光纖鏈路的昂貴費用。在災備方案的選型是要選取最適合企業現有災備需求的方案,以避免投資的盲目性,同時也是從經濟可行性的角度分析,基于存儲設備鏡像技術的容災解決方案不適合大部分ERP系統的中小型企業用戶。
持續數據保護,Continuous Data Protection(CDP),作為一種災備的概念提出,是對傳統數據備份技術的一次的重大突破。CDP技術通過在操作系統核心層中植入文件過濾驅動程序,來實時捕獲所有文件訪問操作。對于需要CDP連續備份保護的文件,當CDP管理模塊經由文件過濾驅動攔截到其改寫操作時,則預先將文件數據變化部分連同當前的系統時間戳(System Time Stamp)一起自動備份到UnaCDP存儲體。從理論上說,任何一次的文件數據變化都會被自動記錄,因而稱之為持續數據保護。
CDP持續數據保護技術分為真CDP(True CDP)和準CDP(Near CDP)兩類。CDP的分類是相對于數據保護時間點而言的。準CDP技術是按照一定的時間頻率,持續的記錄并備份數據變化,每次備份有一定時間窗口,需要數據恢復時,可以恢復到過去備份的時間點,并不能形成完全意義上的持續保護,因此稱為準CDP技術。而真CDP技術是持續不間斷的監控并備份數據變化,可以恢復到過去任意時間點,是真正的實時備份。
通過與技術廠商溝通交流后發現,按實現的原理區分,CDP的技術也可分為兩種:一種是通過操作系統層面的鏡像實現;另一種是通過光纖交換機的端口復制技術實現。
3.1 基于操作系統磁盤鏡像的C D P解決方案
基于操作系統磁盤鏡像的CDP技術,反映其原理的數據流示意圖如圖2所示:

圖2
生產環境的數據通過操作系統的鏡像保存為兩份,一份在原有的生產存儲上,另一份鏡像數據通過CDP服務器再連接到存儲設備,在操作系統上安裝CDP設備的驅動,改寫的驅動將生產環境數據傳遞到CDP主機,這樣CDP服務器就可以獲取生產數據的變化,以此建立映射和生成快照,并通過網絡鏈路傳輸實現災備。
基于操作系統磁盤鏡像的CDP解決方案需要在生產中心和災備中心添加CDP服務器,其在架構中的位置在光纖交換機到備份存儲設備之間,對生產環境的鏡像通過主機操作系統實現,CDP服務器主要用于數據分析、快照的管理和傳輸,并可使用窄帶傳輸,其典型代表有美國公司的IPStor產品等。此類解決方案在國外有這廣泛的應用,在國內也有一定的案例,如韓國電信、中國移動、華北電網、深圳市國家稅務局等。
3.2 基于光纖交換機端口轉發技術的C D P解決方案
基于光纖交換機端口轉發的CDP技術,反映其原理的數據流示意圖如圖3所示:

圖3
與基于操作系統鏡像技術的CDP不同,基于光纖交換機端口復制的CDP技術,對生產環境主機透明,生產環境數據在經過光纖交換機時,使用類似網絡交換機端口轉發的技術,將光纖協議數據包同步復制到CDP主機的光纖端口,這樣CDP主機獲取到生產環境的數據并以此建立映射和生成快照,并通過網絡鏈路傳輸實現災備。
基于光纖交換機端口轉發技術的CDP解決方案需添加光纖交換機、CDP服務器;其特點是對生產環境數據的鏡像通過光纖交換機的端口轉發技術實現,此技術是硬件實現技術,理論上會比基于操作系統鏡像的技術更節省系統資源,同樣可使用窄帶傳輸,此類技術其典型代表有EMC的RecoverPoint和InMage CX產品等使用此類技術解決方案的案例大多在國外,如Citrix公司、Seagate公司等。
根據存儲網絡聯合會(Storage Networking Industry Association,SNIA)官方對于存儲虛擬化技術(Virtualization)的定義,如下:
①將存儲(子)系統內部功能與具體應用、主機及通用網絡資源分離、隱藏及抽象的行為。以期達到存儲或數據管理的網絡無關性。
②對于存儲服務及設備的虛擬化應用,以期達到整合設備功能、隱藏復雜細節以及向已經存在的底層存儲資源添加新的應用。
當前有許多的技術在不同層中對存儲層中進行虛擬化,包括物理存儲,RAID磁盤,LUN(Logical Unit Number),存儲區域,LUN分區,LUN遮罩及影射,文件系統,數據庫對象。相應地實現這些虛擬化技術的設施有磁盤陣列,陣列控制器,存儲交換機,路由器,分布式虛擬設備,總線適配器,操作系統以及相應的應用層軟件。這些不同的技術表明對于解決共有的存儲問題,虛擬化是一個很關鍵的技術方向。
存儲虛擬化技術由于類型眾多,而它們所處于存儲棧位置也不一樣,因此其實現技術也相當的多,而且所關注的面也不一樣。比如RAID技術其實就是基于存儲設備的存儲虛擬化技術實現之一,還有卷管理技術LVM邏輯鏡像,包括 SoftRAID 也都是存儲虛擬化的實現技術。作為與本文所討論的存儲分層存較為接近關系原因,這里重點介紹一下基于主機及存儲設備的虛擬化技術的實現。而對于基于網絡的虛擬化技術實現主要用于數據中心級的存儲規劃中。特別的,這三種實現技術可以同時結合起來,或者一個以另一個為基礎來實現。
存儲虛擬化技術是近年出現的新技術之一,其依靠智能光纖交換機實現存儲虛擬化,也就是使存儲對操作系統的透明,可以集中管理分配企業范圍內所有異構的存儲。而將這種技術用于災備系統,反映其原理的數據流示意圖如圖4所示:

圖4
基于存儲虛擬化的解決方案,需要在生產中心和災備中心部署智能交換機和災備SVM主機。存儲虛擬化技術可以實現存儲設備對主機的透明,所有的生產數據都由主機→光纖交換機→智能交換機→光纖交換機→存儲設備的路徑傳送,通過智能交換機生成數據快照,經SVM主機通過網絡鏈路復制到災備端SVM主機送達災備中心的虛擬存儲環境。
基于存儲虛擬化的解決方案此解決方案需添加光纖智能交換機(用于虛擬化)、存儲虛擬化服務器(SVM),對生產環境架構改動較大,其智能交換機光纖交換機和主機、存儲之間,災備中心也需要同樣的架構部署,可使用窄帶傳輸;此類技術典型代表有Stor-Age公司的SVM產品等,在國外有很多成熟案例,如以色列最大的銀行Hapoalim、德國領先的BHF-BANK銀行等,國內案例相對較少,有天津天獅集團等。
通過對上述主流災備技術的分析,通過技術類型、建設費用、帶寬需求等方面與本企業現有災備需求進行比對,詳見表1:

表1
通過對比,由于ERP系統備份除了關系型數據庫外,還包括應用系統,單純的虛擬帶庫和DataGuard都無法完全滿足需求,而在輔助以文件系統復制或腳本等其它技術,會使得技術方案復雜性增加,因此從技術可行性方面排除了虛擬帶庫和DataGuard的技術方案;由于處于成本和擴展性的考慮,基于存儲設備鏡像的災備技術,雖然能完全滿足對ERP數據庫和應用系統的災備需求,但是基于該技術的解決方案會需要光纖鏈路來進行數據復制,將會帶來較高的成本,同時存儲設備的選擇也會受到廠商和設備型號的限制,從經濟可行性方面排除了基于存儲設備鏡像的災備技術。最終,本企業的ERP系統災備系統的選型初步確定為基于CDP技術的災備技術。
在確定了基于CDP技術的災備解決方案后,我們通過POC測試驗證了基于快照的CDP技術和基于光纖交換機端口復制的CDP技術方案。兩者對災備復制鏈路的帶寬需求不高,且適用RPO均為分鐘級,前者屬于準CDP技術,成本相對更低,方案更靈活,而后者屬于TrueCDP技術,基于光纖交換機的硬件技術,對生產系統的性能影響更小,RPO指標更低,可實現恢復到任意時間點,但需要現有系統的光纖交換機支持“端口鏡像”的復制技術,如不支持則需要級聯一臺支持該技術的光纖交換機。
最終,考慮到企業對ERP系統的RPO需求只需要在2小時內,同時考慮到現有的光纖交換機并不支持“端口鏡像”的復制技術,如采用基于光纖交換機端口復制的CDP技術,需要額外采購光纖交換機與現有設備級聯,成本和技術風險更高,因此我們選擇了基于快照的CDP技術作為災難備份的技術解決方案。