本刊記者 | 黃海峰
遼寧移動探索“小機x86化”成星星之火點亮運營商數據庫轉型之路
本刊記者 | 黃海峰
通過在x86服務器上部署分布式軟件的方式,遼寧移動把所有服務器的本地硬盤組織成一個虛擬存儲資源池,提供塊存儲功能。
“又慢、又貴、利用率又低。”這是中國移動多省現網數據庫的真實寫照。
曾經強大的運營商數據庫,采用“小型機+老舊式傳統存儲”方式部署,但面對業務的快速發展、數據量指數式增長,開始存在業務風險高、投資費用高和資源利用率低等問題,已經無法滿足新類型業務發展的需求。
現在,運營商已到了不得不改變的時刻。在諸多改造方案中,小型機“x86化”探索如“星星之火”在全國各地燃起。而中國移動遼寧公司(以下簡稱遼寧移動)攜手華為進行的分布式x86數據庫改造十分成功,其實踐經驗被業內所推崇。
遼寧移動是中國移動在東北的重要省公司,其下轄14個市級分公司,56個縣級分公司。遼寧移動正不斷開拓進取,創新發展,致力于肩負起“創無限通信世界,做信息社會棟梁”的企業使命。
目前,遼寧移動采用“小型機+老舊式傳統存儲”的方式部署了60多套Oracle數據庫,數據庫小型機60多臺,承載計費、網管、管信、數據增值業務、位置業務等100多套系統,數據總量近700TB。
但是這些數據庫系統慢慢成為了業務發展的重要瓶頸,主要問題是“慢、貴、低”。
具體而言,一是在業務風險方面,隨著業務數據不斷增長,現有數據庫數據運行越來越慢,導致業務處理周期越來越長;現網老舊存儲故障恢復需要手動從硬盤恢復數據,故障恢復時間長,業務在故障恢復期間無法提供服務。
二是擴容投資、維保費用高:如某廠商的DMX 4存儲必須整柜擴容,每次擴容成本非常高昂;維保服務費高昂,甚至高于新購設備價格。
三是資源利用率低:不同功能小型機間負載差別較大;部分設備負載峰值較高但均值很低,長時間處在低負荷運轉狀態。
這種糟糕的現狀,讓遼寧移動IT系統運維人員苦不堪言。工程師們特別希望有新的方案帶來4方面的改變:降低業務風險、提高業務性能、降低維護成本和提高資源利用率。
比如在降低業務風險方面,新方案要能解決老舊傳統存儲故障導致業務數據庫無法繼續使用的問題,提高業務連續性,解耦軟硬件關聯;存儲需要快速部署,能夠按需分配;提高業務可用性、連續性和穩定性。
為解決上述數據庫面臨的問題,兩條發展路徑浮出水面。路徑一是開源數據庫解決方案,顛覆性地變更,傳統應用大量修改,部分復雜關系數據模型無法支持。路徑二是分布式x86數據庫解決方案,分布式存儲+x86實現I+E替換,數據庫無需修改。
到底哪種方案更適合遼寧移動呢?通過測試驗證發現:互聯網公司的數據類型以非結構化和半結構化為主,因此適合采用開源非關系型數據庫解決方案;而遼寧移動公司主要處理結構化數據,且業務系統改造難度極大,因此路徑二更適合遼寧移動現狀、更易實現并節省投資。
經過仔細地對比測試,遼寧移動最終選擇了華為FusionStorage解決方案:通過在x86服務器上部署分布式軟件的方式,把所有服務器的本地硬盤組織成一個虛擬存儲資源池,提供塊存儲功能。
據了解,傳統架構被改造為分布式x86架構,經過了應用層、平臺層以及數據層“三步走”。第一步在應用層,遼寧移動實現上層應用系統的分布式改造;第二步在平臺層,遼寧移動搭建分布式X86集群環境,安裝分布式存儲系統和數據庫管理系統;第三步在數據層,遼寧移動將業務系統數據從集中式數據庫導出,并導入至分布式x86數據庫中。
其主要工作包括以下5方面:一是計算節點:高性能x86服務器替代傳統小型機;二是存儲節點:FusionStorage+服務器本地存儲替代傳統老舊式存儲,存儲資源統一管理,I/O性能大幅提升;三是網絡:InfiniBand網絡替代傳統SAN網絡,存儲帶寬由10G擴展至128G;四是備份:存儲平面備份替代傳統帶庫式備份,無須通過物理帶庫和虛擬帶庫進行數據備份,直接將數據庫數據備份至分布式備份資源池;五是容災:分布式容災復制替代傳統集中式容災同步,分布式x86數據庫系統將源數據打散后分別同步給多個目標服務器,通過軟件實現了分布式容災數據的一致性復制。
以業務支撐的經營分析系統為例,隨著數據量的快速膨脹,日報、月報業務的處理時間需要10個小時以上。系統主要的性能瓶頸是高端存儲與小機之間的I/O吞吐。
系統采用大吞吐、低時延的InfiniBand交換機打破FC交換機的網絡帶寬瓶頸;采用分布式存儲技術,徹底打破高端存儲的機頭限制,實現性能的線性擴展;利用SSD存儲介質及分布式Cache技術,讓I/O性能大幅提升。通過對經營分析系統的現場測試,月報性能可提升到1小時15分鐘。


此次改造項目,遼寧移動的收益十分顯著,具體表現在系統提升、成本節省以及未來發展方面。
首先,改造后應用系統性能實現大幅度提升。針對100T經分數據進行分析處理,效果明顯,處理時長由10小時18分縮短至2小時9分,性能提升5~6倍;支持最大并發用戶數由400增加至1000。
其次,經濟效益表現出色。遼寧移動采用通用的x86服務器,代替原有的小機及高端存儲設備,降低IT建設的整體投資;同時有效地降低了主機服務器的維保費用,以替換1臺小型機為例,每年可節省維保費用59萬;以替換1T傳統老舊存儲為例,每年可節省維保費用1.8萬。
最后,社會效益十分突出。遼寧移動采用新的數據庫云平臺,可以實現日報、月報的及時性,進而提升服務質量和用戶滿意度;通過降低小型機和高端存儲的采購數量,實現節能減排、綠色環保的健康持續發展;有力地推進了遼寧移動業務支撐網建設卓越運營體系的進程。
華為方面表示,在該改造項目實施初期,遼寧移動各方面經濟效益即得到很大提高,相信隨著傳統數據中心向云計算業務中心轉型的不斷深入,一定會為企業創造更大的經濟收益。