特約通訊員羅麗
數據遷移項目是一個很復雜的項目,我們要認真考慮其成本和風險。為了成功完成一個數據遷移項目,相關組織機構必須制定一個全面的關于人員、流程和技術的計劃。執行數據遷移有許多方法,譬如邏輯卷數據鏡像方法、直接拷貝法、主機遷移方法、存儲虛擬化方法等等,每個方法都有不同級別的成本和風險,以及優缺點,重要的是選擇與使用環境相適應的最好方法。
異構虛擬存儲技術能夠使數據遷移風險和成本最小化。使用異構虛擬存儲方法時,數據源和目的地都要增加必要的虛擬存儲設備,通過SAN(存儲區域網絡)與新舊存儲系統相連,識別并正確地配置和測試新的存儲系統。數據被復制到新的環境,也被重新定向到新的存儲系統,期間不會有任何額外的運行中斷。一旦數據被安置在新的存儲系統,舊的系統就可以退役了。這種方法能夠最大限度地減少停機時間,允許較高的數據吞吐量,并且對于不同的中斷窗口都非常靈活,且能夠擴展到大容量數據。
對基于主機的數據遷移,新存儲系統的識別以及遷移完成后舊存儲系統的釋放可能會引起運行中斷,這些中斷取決于不同的操作系統和應用程序的類型,如Sun Solaris的舊版本Sun5.8在數據遷移完成后需要重啟服務器,從而導致了一個運行中斷,而新版本Sun5.10則是動態的釋放舊的存儲系統,不會引起中斷。

表1表明了虛擬化存儲技術對環境有著最小的影響,但需要大量的前期成本。而當一個客戶已經遷移到虛擬化存儲環境,這種方法就會有不少的優點。
在研究各類成本數據的基礎上,可以建立一個成本模型來表示數據遷移總成本,從而可以更直觀地分析基于各種技術的數據遷移成本。研究表明,使用光纖通道SAN存儲的行業平均遷移每萬億字節成本要超過5000到7000美元。目前許多研究把注意力集中在存儲平臺上,而忽略了在SAN交換機層上、主機操作系統層、主機總線適配器級別上客戶要求的互操作性。此外,執行數據遷移的技術和工具成本通常也會被忽略,因為在新的存儲平臺上使用腳本重建自動控制也會需要這些技術及工具。
圖1表示了在研究中得到的不同成本要素所占份額,我們可以看到在企業遷移的總成本中,數據遷移內部資源成本一般不超過$2000/TB,服務承包商的花費在$2000到4000/TB,在遷移工具上的花費大致在$6000~12000/TB浮動,另外還有基礎設施、腳本開銷、主機修復這三類成本,我們可以從圖中得到這三類成本的大致開銷。
企業存儲遷移的平均總成本總是輕易地超過每萬億字節15000美元,接下來我們將會詳細介紹每一種類的遷移成本。
首先需要闡明的一個成本要素是用來表示遷移成本的度量尺度“TB”,這個度量尺度不是基于存儲的容量,而是基于遷移數據的大小。這個數據的大小通常是使用之前已分配好的存儲容量。在本文的遷移成本模型中我們假設數據的大小與之前使用過的已分配的存儲容量一致。
為了與這個成本模型相適應,一般的組織機構可以把這個成本的單位轉換成每臺主機,一個企業存儲遷移成本是直接與相關的主機成正比的(此外一些其它的因素如多站點的實現、維護窗口的時間和日期也會直接影響遷移成本)。隨著每臺主機的平均容量到達1.25TB到1.5TB,相關的遷移成本會在每臺主機10000到12000美元間浮動。
本調查的注意力集中在內部資源和外部承包商執行遷移的開銷上。表2提供了調查中一些關鍵標準的結果:(我們可以計算得到內部資源成本是$2095/TB)。
遷移技術是整個項目成本和工期的主要的決定因素,研究表明對于內部資源來說,使用虛擬化技術所需要的花費是基于主機遷移的1/6—1/4。從表3可以看出。
企業組織一般不會把主機管理和維護的安全問題委派給外部承包商,因此主要的壓力就落在了內部IT人員身上。
在工期方面,我們也有同樣的發現,基于主機的遷移項目要比虛擬化存儲技術多用一倍的時間,如表4所示。
據研究表明,美國服務供應方面的平均開銷是$3552/TB。這個值是用服務供應開銷除以平均遷移容量得到的。聘請外部承包商和顧問是本行業為支持非營業時間的數據遷移的普遍做法。外部承包商利用其數據遷移的技術、工具、流程方面的經驗和知識也會有助于減少遷移成本。應用程序運行要求,遷移技術和工具,內部IT人員的專業知識,還有維護窗口和項目規模都會在很大程度上影響所需要的外部承包商和顧問的數目。研究表明,每個遷移項目在承包商和顧問人員的平均開銷是$251,000。
此外研究還表明,每個遷移項目在技術和工具上的開銷是$5099/TB。這個值是用遷移工具和技術上的總開銷除以遷移數據的大小得到的。這個值高度依賴于所使用的技術,供應商選擇的工具及軟件的授權結構。

表2 各項遷移指標數據

表3 虛擬遷移和主機遷移的內部成本比較
模型中的第四類成本“基礎設施的間接成本”為$263/TB,這個間接成本是在遷移過程中所需要的額外的基礎設施成本及其相關的費用。如執行遷移過程中,目標存儲系統的容量必須不少于源存儲系統的容量,目標存儲平臺的端口、電力、冷卻等方面的要求也必須滿足不低于源存儲系統。我們用行業標準磁盤的單位GB以及在超過規定時間的基礎設施預算費用來得到的值為$236/TB。使用后者可以更好地反應在遷移過程中源存儲幀保存較長時間時相關的金融負載關系。
模型中的第五類成本“腳本處理”的平均值為$1767/TB。這個值是與遷移相關的腳本處理成本除以平均遷移容量得到的。遷移中這個值的底線是內部資源開銷和服務開銷之和,另外這個成本很容易波動,主要是取決于受調查者所使用的不同平臺的數目。我們能從研究的結果中發現,平均31%的遷移成本都是用在目標存儲系統創建新的腳本上。
研究表明,為支持最近一次的存儲遷移,需要平均花費四天來修復,在主機修復中的平均成本為$4965/TB。這個值是由相同時間的等效成本乘以調查得到的成本除以平均遷移容量得到的,主要的決定因素如下:
--由應用程序中斷所引起的維護窗口大小;
--被訪人員主機已使用年限及主機上運行的操作系統的版本;
--存儲承包商的互操作性要求(不包括舊的操作系統,主機總線適配器,光纖通道SAN交換機),如果一個組織沒有時刻更新其IT環境,那么他們也不得不讓部分主機升級以支持目標存儲平臺。
在關于數據遷移經驗的研究中,我們發現了一些確保數據遷移成功的決定性因素,這些決定性的因子大多數都是基于經驗和一些成功范例來確保順利遷移。

表4 虛擬遷移和主機遷移的工期比較
研究表明,有10%的預算超支都是因為經驗缺乏。當執行遷移時,要利用一個有著不同類型遷移經驗和方法的團隊。研究表明,最佳范例的關鍵如下:
根據應用程序受存儲資源變化的不同影響及其對業務盈虧的影響,對應用進行分組,同類型的應用具有相同的索引字段和存儲特性,有助于改善存儲管理效率,便于數據遷移。
數據遷移服務一般分為五大關鍵階段,包括事先規劃、發現、設計、實施與測試、以及知識傳授階段。在事先規劃階段,評審項目的范圍、交付和工作方法,并就整個遷移目標向客戶提供建議;在發現階段,開展數據收集工作,并對當前環境進行研究和審計;在設計階段,開發出具體遷移解決方案,并準備規劃與設計報告;在實施與測試階段,開展模擬移植測試、驗證和認證工作,然后才進行實際的數據遷移工作,以確保所有新老存儲系統,以及應用程序均能夠正常運行;在最后的知識傳授階段,提供有關移植工具、設計與概念的全部信息,并提供項目完工后的整體評估。這一方法可確保制定出一個條理清晰的系統化計劃,保障數據遷移過程能夠無縫高效地完成,進而滿足客戶的期望。知識傳授階段還可以確保移植相關的概念和技能被傳授給客戶,以便支持未來的工作。
數據遷移的成功與否,最能說明問題的應該是模擬測試和整體測試。對測試過程中發現的問題要分析透徹,確定是否是數據遷移引起的錯誤。
模擬測試即根據設計的數據遷移測試方案測試數據模擬遷移,也就是檢查數據模擬遷移后數據和應用軟件是否正常,主要包括:數據一致性測試、應用軟件執行功能測試、性能測試、數據備份和恢復測試等;整體測試即按照數據遷移測試方案測試數據遷移效果,并對數據遷移后的數據庫參數和性能進行調整,使之滿足數據遷移后實際應用系統的需要。
除此以外,隨著時間的推移,將出現用于打造低風險數據遷移的新技術。前文已經提到過,異構虛擬存儲技術能夠使得數據遷移風險和成本最小化。它也是構建服務導向型存儲的關鍵要素之一。服務導向型存儲是一種具有優異經濟性的存儲架構,它將存儲與業務需求統一起來,為企業節約總體擁有成本(TCO)。企業在部署具有優異經濟性的存儲架構時有多種選擇,既可以隨著時間的推移逐步采用這種架構,也可以將其作為整個數據中心技術更新的一部分來部署。這些架構在購置方面可能并不是最便宜的,但它們的擁有成本更低。
數據遷移項目將會消耗一定的資源并存在一定的風險,有一些最佳范例和關鍵技術可以使得企業減少成本和風險。本文關于企業數據遷移成本的介紹為IT部門構造成本模型來評估不同的數據遷移操作提供了一定的信息。在此研究和行業數據的基礎上,IT部門應該評估新的存儲平臺和遷移方法來降低數據中心操作開銷。
準確的成本模型能夠為企業現在甚至將來的數據遷移降低成本。選擇具有優異經濟性的存儲架構,并與成功經驗及最佳范例相結合,能夠幫助企業實現更低成本更小風險的數據遷移。
數據遷移將能夠使企業降低運營成本,因為數據遷移能夠輕易避開過時技術,從而允許我們更靈活地改變和再次利用現有資產,或者促進了技術的更新。當您規劃下一次數據遷移時,不妨利用上述經驗和知識來引導您的數據遷移,獲得最低風險最小成本的一次遷移。
參考資料:
http://www.celona.com/index