胡 穎
(中移(蘇州)軟件技術有限公司,江蘇 蘇州 215153)
醫院業務系統包括HIS,LIS,EMR以及PACS等。業務系統故障以及人為誤操作導致的數據丟失不僅給醫院造成了經濟損失,還影響對病人的及時救治,造成人員傷亡,甚至影響醫院的名譽[1]。因此,采取有效的技術手段保護數據安全就顯得非常重要。當前,數據保護的方式很多,包括應用層的數據容災、系統層的數據保護以及存儲層的數據保護。其中,從應用層面實現數據的容災保護,系統耦合性強,專業性要求高,費用投入大,運維難度大,應用場景非常有限。系統層的數據保護采用專業的備份軟件,支持各種業務數據的自動備份,兼容性強,適用面廣,但涉及軟硬件平臺的建設及運維,建設成本以及運維難度都對中小型客戶構成較大壓力,因此,只適合大型客戶。存儲層的數據保護方式采用磁盤陣列自帶的遠程復制功能,該方式基于各廠家的私有協議,不同品牌的磁盤陣列無法互聯互通,遠程復制等技術無法有效使用,從而導致品牌綁定、建設成本高,專業性強,不適合大范圍推廣[2-5]。同時,采用本地化部署不僅涉及存儲、服務器、交換機以及數據保護軟件等軟硬件設備的安裝部署、調試運行、使用運維,還對機房的空間、供電、制冷、安防等都有較高要求,整套系統的投資大、運維難度高、運維工作量大、運維管理復雜等。
公有云是指第三方提供給用戶使用的云,通過Internet訪問,能夠為客戶提供計算、存儲、網絡、安全以及數據庫等一系列服務,具有成本低、免運維、彈性擴展、安全可靠、按需訂購、按量付費等優勢,可為醫院業務系統的云上備份提供全套服務以及安全保障[6]。
本文針對醫院數據保護,提出以公有云為基礎,構建醫院業務系統的云上備份系統,結合云專線,實現備份數據的安全可靠傳輸,并通過完善的數據備份機制,實現醫院業務數據在公有云的自動備份以及有效保護。
醫院備份系統由公有云服務、網絡鏈路以及備份軟件3部分組成。公有云服務包括云主機、對象存儲、VPC以及安全組等服務。云主機提供CPU、內存以及云硬盤等云服務資源,用于安裝備份軟件,為備份系統提供備份管理云主機和備份介質云主機。
對象存儲通過內網與備份介質云主機相連,用于存儲備份數據,具備彈性擴展、按量付費、安全可靠、低成本等優勢,滿足海量備份數據的高可靠、低成本、長期保持的需求。VPC用于構建公有云上的虛擬私有網絡,實現不同租戶之間的網絡隔離,保障云主機的網絡安全。安全組采用白名單機制,通過控制云主機端口的流入流出權限以及網絡訪問協議,構建云主機的安全訪問策略,保障云主機安全訪問。網絡鏈路采用醫院機房到公有云數據中心的點對點云專線,構建與公網隔離的網絡傳輸通道,保障備份數據的傳輸安全和網絡帶寬。
備份軟件包括客戶端、介質端以及管理端??蛻舳税惭b在醫院業務服務器,用于抓取HIS,LIS以及EMR等業務系統數據。介質端安裝在備份介質云主機,結合對象存儲,實現備份數據在云端的存儲。管理端部署在備份管理云主機上,用于備份系統的管理、備份策略的設定、備份進度的展示、備份結果的查詢、監控告警的處理等。備份過程中,通過備份管理端發起備份,備份客戶端收到指令后,開始抓取醫院業務系統數據,并通過云專線,把備份數據寫入備份介質服務器并保存在對象存儲,從而實現醫院業務數據的云端備份。備份系統架構如圖1所示。

圖1 備份系統架構
云主機作為整個備份系統的基礎,在實現備份軟件的穩定運行、醫院業務數據的快速備份、備份系統的管理運維等方面具有決定性作用,因此,備份介質云主機和備份管理云主機都采用高性能云主機。其中,備份介質云主機采用32核vCPU、64 GB內存和100 GB高性能云硬盤,備份管理云主機采用16核vCPU、32 GB內存和100 GB高性能云硬盤。
對象存儲采用標準對象存儲,利用對象存儲的分布式架構以及三副本存儲方式,滿足備份數據的高速讀寫和安全可靠的存儲需求,同時,對象存儲具備彈性擴展以及按量付費等優勢,簡化運維管理,節約存儲成本,讓存儲空間使用更高效、便捷。備份軟件采用愛數AnyBackup,其采用三層架構,支持Windows,Linux等主流操作系統,能實現文件、MySQL數據庫、MS SQL數據庫、Oracle數據庫的備份,支持塊存儲、文件存儲以及對象存儲等多種備份介質,并支持全量備份、增量備份、差異備份等多種備份方式以及lan free和lan base等組網方式,完全滿足醫院業務數據的備份要求。
網絡安全包括鏈路安全、云上網絡安全和數據存儲安全3個方面。鏈路安全是指從醫院機房到公有云數據中心的網絡鏈路安全,通過采用點對點的云專線,保障備份數據的傳輸安全和網絡帶寬,降低網絡時延和丟包率,同時,實現備份數據和公網的完全隔離,從而在保障備份數據傳輸安全的同時,保持醫院業務系統與公網相隔離的狀態,確保醫院業務系統滿足監管要求。
云上網絡安全包括租戶隔離和訪問流量控制。其中,租戶隔離采用虛擬私有網絡,實現公有云中不同租戶的云主機的網絡隔離,保障云主機的網絡安全。訪問流量控制方面,通過安全組,基于最小權限開放原則,僅開放備份與管理運維相關的網絡端口、網絡協議以及授權地址段,實現云主機網絡流量的安全管控,保障云主機的網絡。
數據存儲安全依托對象存儲的分布式存儲架構以及三副本存儲方式,提供11個9的數據持久性以及99.95%的數據可用性,實現備份數據的長期可靠存儲,同時,利用對象存儲的安全認證機制,通過AccessID和AccessSecretKey相結合的認證信息,強化對象存儲的訪問安全。
為了實現醫院業務數據的快速備份,縮短備份窗口,同時,確保業務數據丟失時能快速恢復,縮短恢復時間,本系統采用每周1個全備、6個增備、數據保存4周的備份策略。為了避免備份過程對醫院業務系統造成影響,減少備份系統對生產服務器的計算資源以及IO資源的爭搶,全備和增備均選擇在醫院業務量波谷時進行。其中,全量備份在周一晚上8點開始,增量備份在周二至周日晚上8點開始。以典型的二甲醫院為例,HIS,LIS,EMR等結構化數據量為1 TB,每天增量數據約2 GB,PACS的非結構化數據約5 TB,每天增量數據約10 GB,通過源端的重刪壓縮,全量備份按照25%的可重刪壓縮比例,第一周的數據備份量為4 680 GB。從第二周開始,通過重刪壓縮,每周一全量備份實際上傳到云端的數據量不超過10%,即100 GB,因此,第二周開始每周的備份數據量為172 GB。同時,為了提高數據的可恢復性,第五周的全量備份完成后,通過備份合成技術,把第一周的全備和6個增備與第二周的全備相融合,實現第二周全備的非重刪壓縮并刪除第一周的所有備份數據。因此,備份數據的最大存儲空間需求為5 296 GB。備份數據量如表1所示。

表1 備份數據量
當業務數據丟失,需要采用備份數據進行恢復時,首先確定需要恢復的時間點,再從備份數據中選擇該時間點之前最新的全備進行全量數據的恢復,待全量備份恢復完成,再選擇該全備之后的第一個增備進行數據恢復,依此類推,直到把該時間點的數據恢復完成。
將公有云這種彈性伸縮、按量付費的云計算技術應用于醫院業務數據備份,具有傳統IT技術所不具備的優勢。本文提出了基于公有云的醫院備份系統的設計方案,詳細介紹了系統架構和各個重要組成部分,包括公有云服務、網絡鏈路以及備份軟件。通過采用云主機以及對象存儲,實現備份系統的計算資源和存儲資源的快速上線以及彈性擴容,滿足備份系統當前以及未來對計算和存儲資源的需求,降低系統的建設成本,縮短系統的上線時間,簡化系統的運維管理。同時,通過安全組與云專線,保障云主機的網絡安全以及備份數據的傳輸安全。結合專業的備份軟件,配合完善的備份與恢復策略,實現醫院業務數據的自動備份、全生命周期管理以及快速恢復,提高了整個系統的應用價值,擴大了系統的使用范圍。