呂佩吾
(江蘇省鐵路集團有限公司信息中心,南京 210000)
近年來,云計算技術得到極大的發展和普及,“業務上云”“系統上云”“應用上云”逐步走入各行各業,上云有助于系統運營商擺脫物理主機、網絡的束縛,使其更專注于業務本身,因此得到了大家的青睞[1],IDC調研顯示,2021年全球云計算市場規模為7050億美元,并預測到2025年將達1.3萬億美元[2]。當前國內云市場百家爭鳴,阿里云、騰訊云、華為云、電信天翼、移動和云、聯通沃云等公有云、私有云都已得到廣泛使用和廣大用戶的認可。然而在實際中,經常出現系統從公有云遷移到公有云,從公有云遷移到私有云,從私有云遷移到公有云的場景。由于需要考慮網絡組網、系統穩定、數據完整、數據安全和服務能否停用等問題[3],耗費精力大且存在風險,因此云遷移是一個紛繁復雜的工程,需要考慮的因素眾多,而數據是系統的核心,是服務運營商的核心資產[4],數據完整和數據安全是云遷移中的重要目標。本文通過對云遷移中的數據進行分類梳理,研究不同類型數據的遷移過程和數據安全保障措施。
云遷移需要考慮網絡遷移、服務器遷移、數據遷移等多種要素,而云遷移的數據主要指系統涉及數據,因此要對遷移系統的數據進行分類。當前主流系統使用的數據有存放關系類型數據的關系數據庫、存放系統緩存數據的Redis數據庫和存儲文件類型數據的對象存儲數據庫,此外,系統的配置文件、程序等應視為配置程序類靜態數據,還有系統產生的系統日志數據,因此云遷移中的數據即包含數據庫數據,又包含服務器中的配置、程序和日志等數據,梳理出的數據分類如圖1所示。
(1)關系數據:系統使用的如MySQL、Oracle等關系類數據庫數據,當前大多云平臺提供的云數據庫集成了容災、備份、恢復、監控、遷移等全套解決方案功能[5];
(2)對象存儲數據:對象存儲是當前流行的文件存儲方式,與自建存儲相比,對象存儲有著更高安全性、更便捷使用性和更持久存儲性的特點,當前大多云平臺均支持對象存儲[6];
(3)Redis數據:Redis既可作為緩存層加速應用訪問,又可作為持久化功能用于高并發、大流量場景,在當前信息系統建設中使用得較為廣泛[7];
(4)配置、程序:系統本身的配置文件、程序文件,在遷移過程中保障程序文件、配置文件的完整無損非常重要;
(5)日志數據:程序運行的日志數據作為系統日志審查和網絡安全的重要內容,在遷移過程中宜同步實施遷移。
當前云服務商都帶有自己的關系數據遷移工具,隨著遷移的需求逐年上升,關系數據遷移工具逐步向易操作、周期短、成本低、風險低演化[8],數據遷移工具操作的基本步驟為:
(1)創建遷移任務,輸入數據庫源和目標,需提供源庫和目標庫的連接地址、端口、用戶名和口令;
(2)確認遷移方式,確認是增量或全量遷移,確認遷移期間目標數據庫是否可以進行讀寫操作;
(3)開始遷移,數據庫遷移工具根據設置操作自動實施數據遷移;
(4)查看遷移日志,遷移完成后,查看遷移日志信息,確認是否在遷移實施中存在問題;
(5)遷移對比,對比源庫和目標庫的表數量、表內數據項的一致性。
對象存儲數據和關系數據的存儲方式和訪問方法都不同,關系數據的存儲是關系數據庫,訪問方法是通過用戶名、密碼連接指定URL的數據庫;對象存儲的存儲方式是桶(Bucket)和對象(Object),多通過AK、SK和RESTful API接口調用方式訪問使用[9]。因此對象存儲的一般遷移步驟為:
(1)遷移前準備,創建目標AK、SK和Bucket,解凍歸檔數據;
(2)創建遷移任務,輸入源、目的對象存儲地址、Bucket、AK、SK;
(3)配置遷移參數,選擇遷移方式(增量、全量)、文件覆蓋方式等;
(4)開始遷移,查看遷移狀態和遷移結果;
(5)遷移結果檢查,查看遷移完成清單和遷移失敗清單,檢查遷移報告。
配置文件、程序文件、系統日志等文件一般都存儲在服務器的云盤中,通常使用云主機遷移的遷移方法,通過主機遷移直接把源主機操作系統和硬盤打包鏡像到目的主機,當前主流的云主機遷移方法是在源主機上安裝遷移軟件,配置遷移軟件的目的是遷移服務器信息,實現源主機的操作系統和云盤全量或存量遷移,遷移步驟為:
(1)在源主機上安裝遷移軟件;
(2)遷移軟件配置目的主機的信息,包含IP地址,對應賬號的AK和SK或用戶名密碼;
(3)創建遷移任務并檢查遷移結果。
數據安全是指通過采取必要措施,確保數據處于有效保護和合法利用的狀態,以及具備保障持續安全狀態的能力,本節首先確定云遷移過程中數據安全的內容和范圍,其次研究范圍內風險和保障措施,最后研究不同數據類型遷移中的數據安全風險。
根據第2節云遷移方法研究,云遷移在時間階段上可以分為遷移準備階段,遷移中和遷移后三個階段,根據信息安全的五大特征和云遷移特點[10],數據安全主要包含數據完整性、保密性和可用性,因此本文研究云遷移數據安全內容為云遷移準備階段、遷移中和遷移后數據的完整性、保密性和可用性。
(1)數據完整性:保障遷移后的目的環境的數據同源環境在數據目錄、內容上完全一致;
(2)數據保密性:首先指遷移過程中不能擴大、增加數據的訪問范圍;其次指遷移過程中最好使用加密傳輸,避免傳輸過程中被監聽;
(3)數據可用性:在需要遷移時不停用系統,保障數據在遷移和系統交割中數據的可用。
根據云遷移步驟和數據安全要求,云遷移中數據安全風險和保障措施包括七方面:遷移準備階段的數據保密性、遷移中的數據完整性、遷移中的數據保密性、遷移中的數據可用性、遷移后的數據完整性、遷移后的數據保密性、遷移后的數據可用性。

表1 云遷移不同階段數據安全風險分類
(1)遷移準備階段的數據保密性風險:源數據的訪問范圍被擴大。保障措施:按照“最小訪問”原則,以白名單、安全組等方式限制數據的訪問范圍;
(2)遷移中的數據完整性風險:遷移未完全完成時系統在目的環境開啟服務。保障措施:遷移期間數據停用,直至確認所有類型數據全部遷移完畢;或遷移期間遷移交割前確保系統在源環境服務,交割時刻切換至目的環境服務;
(3)遷移中的數據保密性風險:使用http等明文協議在互聯網傳輸,源數據的訪問范圍被擴大。保障措施:禁止使用明文傳輸實施遷移;按照“最小訪問”原則,以白名單、安全組等方式限制數據的訪問范圍;
(4)遷移中的數據可用性風險:遷移軟件占用資源過高造成無法正式訪問數據;遷移未完全完成時系統在目的環境開啟服務。保障措施:保障遷移任務的遷移參數設置為非占用全部資源;遷移期間數據停用,直至確認所有類型數據全部遷移完畢;
(5)遷移后的數據完整性:出現遷移過程中數據遷移失敗而未實施檢查。保障措施:每遷移一項數據后進行遷移完整性檢查,確保所有數據都實施完整性遷移;
(6)遷移后的數據保密性:遷移后源環境數據未及時限制訪問范圍。保障措施:遷移后源環境數據范圍設置為“最小訪問”范圍;
(7)遷移后的數據可用性:系統遷移后應用系統未做數據庫地址等參數調整造成數據不可訪問。保障措施:遷移準備階段充分測試遷移后應用系統需要修改的數據訪問地址、口令等,確保數據正常訪問。
由于不同類型數據的遷移過程、操作步驟存在差異,因此針對關系數據、對象存儲和配置文件數據,分析不同數據類型下遷移中存在的安全風險和保障措施。
(1)關系數據遷移安全:互聯網遷移時需使用加密方式連接;遷移后及時關閉源數據庫的互聯網連接訪問;
(2)對象存儲遷移數據安全:遷移時需確認歸檔數據解凍,保障遷移數據完整性;若遷移不停服務,在遷移過程中可使用流量控制,在業務系統訪問量大時降低遷移帶寬,保障遷移過程中數據可用性;
(3)主機遷移數據安全:遷移前嚴格按照遷移軟件操作說明書配置端口、白名單和訪問網絡,確保網絡正常;確認目的云主機的系統盤、數據盤存儲大小大于等于源主機的存儲大小。
本文通過對云遷移中的數據進行分類,研究分類數據下不同數據的遷移方案,最后根據遷移準備、遷移中、遷移后三個階段分析了數據安全完整性、保密性和可用性要求下的風險和應對措施,并對不同類型數據下各自的風險進行梳理和總結,對云遷移數據安全保障具有實際意義。