


引言:近年來,以計算機和網絡為基礎的信息產業獲得了空前的發展,人們對數據的安全性越來越重視。數據備份和災難恢復逐漸成為了熱點問題。由于各種客觀原因,人們無法預測何時、何地會發生何種程度的災難,也不可能完全防止、控制其發生。但高性能的數據備份和災難恢復方案能充分保護系統中有價值的信息,保證災難發生時系統仍然正常工作。
本文從企業數據丟失的原因、數據備份的必要性、方法與災難恢復的手段等方面加以闡述、探討,使大家明白這一工作的重要性以及基本的工作機制和方法。介紹了容災技術的原理,最后介紹了幾家主流供應商所提出的產品和解決方案,以便于更好的理解和應用容災技術。
信息系統是支撐網絡的核心業務系統,系統上的數據極其重要。因而,如何保護好信息系統里存儲的數據,保證系統穩定可靠地運行,并為業務系統提供快捷可靠的訪問,是系統建設中最重要的問題之一。而要保證系統穩定可靠地運行一個關鍵的要素就是要保護存儲在信息系統內的數據。
雖然,多媒體移動通信的發展給人們的日常生活提供了很多便利,然而,人為的操作錯誤,系統軟件或應用軟件的缺陷、硬件的損毀、電腦病毒、駭客攻擊、自然災難等等諸多因素都有可能造成多媒體數據的丟失,從而給企業造成無可估量的損失。
為了保護信息系統的關鍵業務數據,盡可能少的減少客戶的損失,王灘電廠建設集中備份系統,對業務數據進行有效的備份,并支持快速恢復。
一、王灘集中備份平臺的總體規劃
1.1系統建設目標
對數據進行備份是為了保證數據的一致性和完整性,消除系統使用者和操作者的后顧之憂。不同的應用環境要求不同的解決方案來適應,一般來說,一個完善的備份系統,需要滿足以下原則:
穩定性
備份產品的主要作用是為系統提供一個數據保護的方法,于是該產品本身的穩定性和可靠性就變成了最重要的一個方面。首先,備份軟一定要與操作系統100%的兼容,其次,當事故發生時,能夠快速有效地恢復數據。
全面性
在目前發電廠信息系統中,包括了各種操作平臺,包括windows、Linux、Unix,并安裝有各種應用系統,如OA系統、數據庫、中間件系統等。 選用的備份軟件,要支持各種操作系統、數據庫和典型應用。
自動化
很多系統由于工作性質,對何時備份、用多長時間備份都有一定的限制。因此,備份方案應能提供定時的自動備份,在自動備份過程中,還要有日志記錄功能,并在出現異常情況時自動報警。
高性能
隨著個人多媒體移動業務的不斷發展,數據越來越多,更新越來越快,在休息時間來不及備份如此多的內容,在工作時間備份又會影響系統性能。這就要求在設計備份時,盡量考慮到提高數據備份的速度。
維持業務系統的有效性
備份對業務系統的性能將會產生一定的影響,有時會很大;如何采取有效的技術手段避免備份對服務器系統、數據庫系統、網絡系統的影響,將是非常重要的。
操作簡單
數據備份應用于不同領域,進行數據備份的操作人員也處于不同的層次。這就需要一個直觀的、操作簡單的圖形化用戶界面,縮短操作人員的學習時間,減輕操作人員的工作壓力,使備份工作得以輕松地設置和完成。
實時性
有些關鍵性的任務是要24小時不停機運行的,在備份的時候,有一些文件可能仍然處于打開的狀態。那么在進行備份的時候,要采取措施,實時地查看文件大小、進行事務跟蹤,以保證正確地備份系統中的所有文件。
容災考慮
在建設備份系統的時候需要考慮到容災的要求,如將備份后的數據通過技術手段,存放一份或者多份在其他地方,如容災中心,以防數據中心發生不可預測的災難等。
1.2系統平臺結構說明
備份軟件
優秀備份軟件包括加速備份、自動操作、災難恢復等特殊功能,對于安全有效的數據備份是非常重要的。
備份網絡
備份網絡可以是SAN,也可以是LAN /WAN,或SAN+LAN/WAN混合方式,它是數據傳輸的通道,數據備份的效率高低與備份網絡有密切關系。
備份介質
介質是數據的負載物,它的質量一定要有保證,使用質量不過關的介質無疑是拿自己的數據冒險。
備份管理
一個好的備份/恢復系統,除了配備有好的軟硬件之外,更需要有良好的備份策略和管理規劃來進行保證。對于一個復雜的系統,必須根據各種應用和業務的處理類型來分別制定具體的備份策略。但總體上來講,一個好的備份策略,必須考慮多方面的因素。
1.3系統/設備部署規劃
王灘電廠按照設備集中、集約管理、滿足應用、方便擴展、安全穩定的建設要求,遵循高起點、高標準、高質量的建設原則,立足當前,著眼發展,建立開放式多層架構體系,優化整合現有設備資源,為中心數據庫和應用系統建設提供統一的運行環境,并實施系統資源的統一管理和維護,提高硬件設備的集約化管理水平和可擴展能力,增強應用系統和數據的運行效率和管理水平,降低各類應用系統建設成本,滿足數據庫和應用系統的建設需要,建立了集中備份平臺。集中備份平臺為電廠信息化開展應用系統建設、信息數據集中整合、方便信息分析以及信息化建設的健康持續發展奠定良好的基礎。
備份系統的拓撲圖規劃如下:
備份系統主要軟硬件如下:
SEPATON虛擬磁帶庫1臺;
華為VTL3500虛擬磁帶庫1臺;
光纖交換機2臺;
備份服務器1臺;
Veritas 6.5備份軟件1套。
二、王灘電廠集中備份平臺實施方案
2.1方案構成概要說明
王灘電廠考慮新建備份系統的先進性、開放性、擴展能力、管理能力,采用業界領先,市場占有率高,成熟穩定的Symantec公司的NetBackup備份軟件、Septon公司的虛擬磁帶庫和華為公司的VTL3500虛擬磁帶庫硬件建設集中備份平臺,為數據中心各個業務系統提供備份服務。
建成后的集中存儲備份平臺結構如下:
方案說明
在信息中心內部署一臺主控備份服務器,安裝Netbackup Enterprise Server 軟件,負責整個備份系統的管理,包括備份策略的制訂、備份工作的調度、備份數據庫的保存、數據恢復等。
考慮到備份數據的數據量及業務網壓力較小,我們建議采用Lan-base的備份方式,進行備份時,在備份窗口內備份數據通過應用服務器寫入備份介質中。
在所有需要備份的服務器(Unix系統、Linux系統及Windows系統)上,安裝Netbackup Client軟件,保證數據備份系統的完整性。
在所有需要備份的數據庫服務器上安裝數據庫代理,保證數據庫的在線備份。
采用Septon虛擬磁帶庫和華為VTL3500虛擬帶庫作為備份介質。虛擬帶庫承襲了物理帶庫的操作習慣又兼容了硬盤介質的高性能,同時虛擬帶庫獨有的硬件加密、帶庫緩沖、重復數據刪除、遠程復制等特性為以后備份方案的完善和容災系統的建設打下基礎。
2.2方案構成部分詳細說明
2.2.1定制備份策略
備份系統的建立是為了能夠存儲歷史數據,同時在數據丟失后,能夠恢復需要的數據。備份策略的定制應遵循以下原則:
備份對業務和網絡的影響盡可能小
備份窗口盡可能短
恢復時間盡可能短
恢復的時間點能夠達到要求
占用磁帶盡可能少
這些之間有的內容相互矛盾,這就需要根據實際要求,進行平衡,并且通過實踐,總結出適合的合理備份策略。
備份的方式可以分為四種:全備份、增量備份、差量備份、合成備份。
全備份:每次備份定義的所有數據,優點是恢復快,缺點是備份數據量大,數據多時可能做一次全備份需很長時間。
增量備份:備份自上一次備份以來更新的所有數據,其優點是每次備份的數據量少,缺點是恢復時需要全備份及多份增量備份。
差量備份:備份自上一次全備份以來更新的所有數據。
合成備份:將全備份與增量備份組合生成新的全備份,目前只針對文件備份。
2.2.2備份容量規劃
容量規劃與如下因素有關:備份系統設計適用年限、備份源數據量、數據增量、備份策略、保存周期。
規劃示例如下:
A:備份系統設計適用*年
B:初始源數據量 ****GB
C:日增量:**G
D:備份策略:**全備、**增量
E:保存周期:**個月
備份介質容量=[(源數據量A+適用時間*數據增量C)*(保存周期/全備周期+1)+C*(保存周期/增量周期)]
2.2.3備份作業管理
對于備份作業,備份系統管理員應定期執行以下操作:
觀察備份作業運行狀態
通過觀察備份作業運行狀態來判斷備份作業是否正常,如果發現作業異常或者失敗應盡快排除故障使備份作業正常運行。
觀察備份介質使用率
當備份介質使用率超過 80% 時,可以考慮是否需要調整備份數據保存策略或者對備份介質進行擴容。
觀察備份軟件是否有告警等關鍵事件相關記錄
通過備份軟件告警功能可快速跟蹤并查找到即將導致或者已經導致備份系統故障的信息,并通過該信息排除備份系統故障。
根據業務變化調整備份策略
備份系統管理員應根據實際業務變化,適時調整備份策略。
2.2.4備份介質管理
對于備份作業,備份系統管理員應定期執行以下操作:
觀察備份作業運行狀態
通過觀察備份作業運行狀態來判斷備份作業是否正常,如果發現作業異常或者失敗應盡快排除故障使備份作業正常運行。
觀察備份介質使用率
當備份介質使用率超過 80% 時,可以考慮是否需要調整備份數據保存策略或者對備份介質進行擴容。
觀察備份軟件是否有告警等關鍵事件相關記錄
通過備份軟件告警功能可快速跟蹤并查找到即將導致或者已經導致備份系統故障的信息,并通過該信息排除備份系統故障。
根據業務變化調整備份策略
備份系統管理員應根據實際業務變化,適時調整備份策略。
2.2.5恢復演練
備份的目的就是為了能夠在生產系統發生故障需要進行數據恢復時能夠為主機提供某個時間點的完整、正確的數據。所以確保備份數據的可恢復性是構建備份系統時必須要考慮的問題。
當業務主機的業務數據被破壞時,直接通過Netbackup 創建恢復作業選擇對應的備份集恢復數據即可。
當業務主機操作系統破壞時,可以選擇操作系統快速恢復功能對客戶主機或者新購主機進行恢復。
容災演練是為了驗證數據的完整性以及災難恢復的操作熟練度。以確保災難發生時能快速有效的進行災難恢復,以防止災難恢復時操作的不正確導致恢復失敗。下面提供兩種恢復演練的方法。
利用虛擬機進行恢復演練
為了保證恢復演練不影響業務主機,可以在空閑的服務器上搭建虛擬機,將業務主機的備份數據通過Netbackup恢復到虛擬機的方法,對恢復操作及數據完整性進行確認。
利用空閑服務器進行恢復演練
如果覺得虛擬機不能完全模擬真實的環境,需要利用物理機來進行恢復演練,可以準備一臺空閑的服務器,通過Netbackup將備份數據恢復到空閑的服務器上,然后開啟業務,驗證數據的完整性及操作的正確性。
三、王灘電廠集中備份平臺應用分析
集中備份平臺可以自動執行高級技術,標準化各種應用程序、平臺和虛擬環境上的操作,幫助信息化企業簡化數據保護流程。這意味著,企業可以在異構操作系統和存儲硬件(包括磁帶和磁盤)環境中實現全面保護、有效存儲、隨處恢復和集中管理。單一的控制臺實現了多站點監控、分析和報告功能,可以幫助客戶標準化操作和風險管理。Symantec NetBackup易于擴展,可以保護最大型的UNIX、Windows和Linux環境,目前已得到全球各地的企業廣泛采用。
王灘電廠集中備份平臺實現并達到了以下目標:
3.1方案要點
·異構環境的數據保護—可以在異構操作系統、應用程序、管理程序以及磁盤和磁帶架構上實現數據保護功能。
·集中式管理—可以從一個位置管理所有數據保護技術與多個 NetBackup 服務器和域,提高工作效率。
·虛擬機保護既全面又簡單—可以對VMware和Microsoft Hyper-V環境應用獲獎的備份和恢復技術。
·快速全面地恢復應用程序和管理程序的數據—可以快速全面恢復Microsoft Exchange、SharePoint、Active Directory以及VMware、Hyper-V等管理程序的文件、電子郵件和其他項目。
·可伸縮性高—提供了靈活的三層架構,可以滿足當今數據中心不斷增長的需求。
·有效的災難恢復—可以通過NetBackup Bare Metal Restore、內置的復制功能和異地磁帶管理功能實現全自動的集成式系統恢復。
·全面的數據保護 — 提供了靈活的加密技術,可以最大程度保護傳輸中的或介質上的數據。
3.2全面保護
3.2.1客戶端保護
NetBackup提供了一套簡單而又全面的創新客戶端和代理,可以優化備份和恢復環境的性能及有效性。這些客戶端能夠為關鍵業務數據庫和應用程序提供高性能的在線備份與恢復、支持通過存儲網絡執行備份和恢復操作,并且可以提供高級別的數據安全性和全面的系統級恢復。企業可以通過圖形用戶界面(GUI)集中管理備份和恢復操作的各個方面,從而能夠在整個企業中建立統一的數據防護策略,無需考慮部署的客戶端類型和數量。
3.2.2應用程序防護
要防止關鍵業務應用程序保護過度或不足,企業必須制定分層保護戰略。NetBackup平臺提供了各種旨在幫助企業制定經濟可靠型分層保護戰略的技術。要點包括:
·應用程序和數據庫代理— 為了保護關鍵業務應用程序和數據庫,NetBackup提供了應用程序代理,這些代理可以實現熱備份和在線備份,提供向導型配置,并支持應用程序特定的工具,如Oracle Recovery Manager(RMAN)。
·快照的集成 — 為了增強保護功能,NetBackup還集成了各種磁盤陣列和軟件快照方法,如脫機備份和即時恢復。主要優勢是,您可以使用相同的NetBackup策略、目錄和日程界面將快照作為磁帶或其他任何類型的分流備份來管理。
3.2.3持續數據保護和復制
為了實現高級保護功能,NetBackup集成了NetBackup RealTime。這樣,您就可以通過持續數據保護(CDP)和實時IP復制功能,大幅降低本地保護和遠程災難恢復的恢復點目標(RPO)和恢復時間目標(RTO)了。
3.2.4數據安全
NetBackup提供了靈活的數據保護技術,如訪問和授權控制與磁盤和磁帶加密方法。要點包括:
·源/客戶端加密,實現了最高級別的安全性,讓您甚至可以保護傳輸中和介質上的數據。
·Media Server Encryption Option,可以提高磁帶備份的靈活性,還可以利用NetBackup介質服務器。這樣,客戶端的性能就不會受到影響了。
·集中式的集成密鑰管理服務,可以管理加密磁帶驅動器的密鑰。
3.2.5虛擬機保護全面又簡單
虛擬化技術在給數據中心帶來機遇的同時也帶來了挑戰,如降低了備份和恢復速度、增加了存儲使用量以及需要了解和管理更多的技術。
NetBackup 7 基于 NetBackup 6.5 獲獎的 VMware 支持技術,它可以提供既簡單又全面的數據保護功能。另外,它還簡化了虛擬機保護功能,如集中了 Microsoft Hyper-V 和 VMware 上的備份,通過管理程序集成技術(如 vStorage API)、重復數據刪除技術和增量備份技術,縮短了備份時間并實現了高效的單個文件恢復。
3.3隨處恢復
NetBackup提供了各種技術,可以確保數據快速、即時、隨處恢復,并使數據丟失最少。
3.3.1裸機恢復(BMR)
裸機恢復功能是通過集成方式免費提供的,可以執行系統恢復必需的所有文件和服務,包括能夠執行無盤網絡啟動、臨時操作系統安裝和磁盤配置。此功能可以使任何平臺上的全面系統恢復時間大約僅為 15 分鐘。
3.3.2有效的災難恢復
NetBackup平臺提供了各種災難恢復功能,這些功能可以在數據中心因環境因素或其他因素導致永久性損壞后將數據遷移到異地災難恢復位置。
·管理異地磁帶介質—NetBackup Vault Option可以在自動將磁帶介質遷移到異地災難恢復位置的同時跟蹤該流程。
·復制已刪除重復數據的數據—NetBackup提供了各種復制和管理功能,這些功能不但可以通過電子方式在WAN上安全地復制數據,而且還可以在NetBackup圖形用戶界面上集中管理這些數據。由于它只會復制不重復的數據,因此可以優化帶寬和后端存儲。另外,它還可以將這些數據遷移到災難恢復位置的磁帶設備上進行長期存儲。
·實時的數據塊級復制—NetBackup RealTime 7讓NetBackup可以實現實時的數據塊級異步或同步復制。如果用于保護NetBackup目錄,它是免費的。
3.3.3全面的恢復技術
NetBackup 正在申請專利的全面恢復技術可以快速恢復Microsoft Exchange、Active Directory、SharePoint、VMware、Hyper-V 等環境中的文件、電子郵件和其他單個對象。這意味著,映像只需備份一次、存儲一次,就可以實現兩種恢復方式,即用于災難恢復的完整映像恢復方式和單個文件恢復方式。
3.4集中管理
Symantec OpsCenter 提供了一個可以集中監控和報告異構數據保護環境運行狀況的控制臺。要點包括:
·定制的警報功能和實時的監控功能 — 可以通過易用的分類和過濾功能管理意外事件,讓您可以更好地排除故障、設置工作優先級以及控制備份環境。
·跨域監控和管理功能 — 可以將多個 NetBackup 域和多個產品版本連接起來,簡化管理和控制。
·點擊式環境運行狀況報告功能 — 可以快速了解 NetBackup、Symantec Backup Exec、NetBackup PureDisk 和 Enterprise Vault 環境中的磁帶驅動器利用率、成功率和未受保護的環境。
通過 OpsCenter Analytics實現高級業務環境報告功能
您可以通過許可證密鑰輕松將 OpsCenter 升級到 OpsCenter Analytics,實現高級的集成式業務環境報告功能,這樣,您就可以根據地理位置或異構環境中的應用程序為目標用戶(如業務部門)定制相關內容。要點包括:
·報告第三方應用程序 — 可以在集中報告賽門鐵克和第三方備份應用程序(如 EMC NetWorker 和 IBM Tivoli Storage Manager)的同時對報告進行標準化。
·長期保留數據以供趨勢研究和分析之用 — 讓您可以不斷地跟蹤數據增長率(包括為了簡化投資回報率的跟蹤流程刪除重復數據前后的數據增長率),更好地預測備份和電子郵件歸檔存儲的使用量。
·服務級別遵從、成本分析和計費 — 可以實現閾值報告功能,確保您遵從服務級別,還可以通過配置定價模型整合并分配備份和歸檔服務成本,幫助您滿足業務需求。
3.5Netbackup的其他功能和優勢
3.5.1性能
·合成備份—能夠通過單個備份映像快速恢復客戶端,減少恢復對應用程序主機的影響和網絡帶寬。
·高級磁盤緩沖—由于不存在磁帶設備延遲,并且非復用備份映像可用于進行更快速的恢復,因此磁盤緩沖功能有利于進行更快速的備份和恢復。
·檢查點/重新開始—允許失敗的備份作業或恢復作業從上一個檢查點恢復。
·多路復用備份—將多個數據流從一個或多個客戶端/服務器寫入一個磁帶驅動器,以獲得最佳性能。
·內聯復制—可以創建多個并行備份映像,每個映像都具有獨特的保留屬性,與主備份同時運行或在完成主備份后運行。
3.5.2介質管理
·自動機械/磁帶驅動器配置 — 可以自動生成驅動器名稱并自動配置交換的磁帶驅動器,縮短磁帶驅動器的配置時間。
·介質共享 — 允許多個 NetBackup 介質服務器主動共享指定的磁帶介質,以便寫入。
·廣泛的磁帶設備支持 — 支持所有領先的磁盤設備提供商,包括 Dell、Exabyte、HP?、IBM?、Overland Data、Qualstar、Quantum、Sony、Spectra Logic 和 Sun? StorageTek。
3.5.3用于數據庫、應用程序、磁盤、磁帶和災難恢復的代理和選件
NetBackup 代理
NetBackup 代理可以優化重要數據庫和應用程序的性能,包括 IBM DB2、Informix、Lotus? Notes/Lotus Domino? Server、Microsoft Active Directory、Microsoft Exchange Server、Microsoft SharePoint? Portal Server/Microsoft Office SharePoint Server、Microsoft SQL Server、Oracle、SAP、Sybase 和 Symantec Enterprise Vault。
NetBackup 選件
NetBackup 選件可以實現虛擬磁帶庫支持、重復數據刪除、異地磁帶介質管理等功能,從而改善數據保護環境。
四、總結
通過上述各方面功能與性能分析,王灘電廠集中備份平臺建設達到了我們預期的目標,滿足了保護各個業務系統關鍵數據,快速恢復,自動備份,利于管理的要求。起到了對業務系統關鍵數據的保護作用,從而保障系統的連續運行。
參考文獻
[1]王利林,許榕生;網絡安全最后防線-網絡備份[J];計算機工程與應用;2002年14期.
[2]蔡皖東,何得勇,韓蕾,劉成光;一種網絡容災系統的設計與實現[J];計算機工程;2004年07期.
[3]王德軍,王麗娜;容災系統研究[J];計算機工程;2005年06期.
[4]張艷,李舟軍,何德全;災難備份和恢復技術的現狀與發展[J];計算機工程與科學;2005年02期.
[5]王志明;李濤;劉穎娜;趙奎;沈洪敏;項京;;一種快速災難恢復方法[J];計算機應用研究;2006年11期.
[6]曹安麗;網絡備份系統元數據存取方法的研究與實現[D];華中科技大學;2004年.
[7]侯麗珍;自動安全數據備份系統的設計與實現[D];上海交通大學;2007年.
[8]吳東;網絡文件備份工具的設計及實現[J];重慶工學院學報(自然科學版);2008年07期.
[9]黃世權;遠程備份及其安全分析[J];重慶科技學院學報(自然科學版);2009年05期.
[10]王洋洋;廖曉閩;杜浩;史建國;;基于FC的SAN網絡容災恢復實現[A];2007北京地區高校研究生學術交流會通信與信息技術會議論文集(下冊)[C];2008年.
[11]潘偉;基于Oracle10g數據庫系統高可用性框架研究與設計[D];大連海事大學;2010年.
[12]魏強;一種網絡備份系統的存儲優化研究與實現[D];解放軍信息工程大學;2009年.
[13]梅小玲;基于廣域網的虛擬磁盤技術研究[D];華中科技大學;2010年.
[14]張艷;信息系統災難備份和恢復技術的研究及實現[D];四川大學;2006年.
[15]黃晶;數據備份系統的研究與實現[D];華中科技大學;2008年.
作者簡介
劉文梅,1970.6.25,女,河北大唐國際王灘發電公司信息高級主管,主要從事信息管理工作。
(作者單位:河北大唐國際王灘發電有限責任公司)