徐亞平 中國鐵道科學研究院
為確保小型機虛擬化平臺數據安全穩定,避免業務運轉受到影響,于2017 年6 月到2018 年6月公司信息專業工程搬遷期間,在公司領導的大力支持下實施了異地在線遷移系統建設。公司借鑒各領域信息系統災備建設經驗,按照統一規劃、統一建設的原則,先異地、再同城,最終建立“兩地兩中心” 保障體系的思路積極推進,同時遵循國家標準、創新性、有效性等多種建設思想,大膽嘗試,力圖尋找一個對于小型機虛擬化平臺建設最具效率的先進遷移體系路線,實現高起點、高標準的建設目標,實現“信息互通、資源共享、協同配合、反應敏捷、科學施救”的在線遷移管理模式,最終建立既有機房—新建機房異地在線遷移體系。
目前,既有小型機虛擬化平臺由于多數業務系統均為在線生產業務,停機時間忍耐極限時間短,離線搬遷不可行,IBM LPM動態分區遷移(是IBM 最新的虛擬化技術之一,它允許將正在運行的AIX或Linux 分區,以及它們所承載的應用程序從一臺Power服務器遷移到另一臺Power服務器,而不會對基礎服務產生影響。
現有虛擬化平臺主機主要包括兩臺P780小型機及X86服務器虛擬化平臺集群,所有虛擬化集群主機通過存儲網關VPLEX存儲虛擬化連接底層存儲。
業務遷移切換后業務本身無變化,架構的變化主要在遷移的業務。虛擬化平臺中,小型機部分除原有P780外,加入了新購兩臺P780。存儲虛擬化除原有虛擬化存儲外,新加兩臺過渡存儲。所有存儲統一通過存儲網關VPLEX實施虛擬化。業務系統分布原P780虛擬化平臺業務遷移至新購P780上。
此次項目實施關鍵節點流程簡要描述如下:
(1)新采購P780虛擬化平臺設備到貨上架加電,完成基礎軟件安裝配置;
(2)新采購的Vplex升級安裝配置,完成存儲統一虛擬化實現;
(3)原有P780業務主機到新采購P780虛機LPM實施,完成所有業務系統的在線遷移;
(4)原有P780設備搬遷至新數據中心;
在小型機虛擬化平臺系統擴容的建設過程中,也遇到了很多技術難點,我們將難點轉化為亮點,實現系統建設的創新。
生產機房VPLEX Local 目前運行版本是5.2.1.02.00.03,為了實現“兩地兩中心”,需要將VPLEX Local升級為VPLEX Metro,但VPLEX Local升級為VPLEX Metro EMC 官網建議版本是5.4.1.03.00.04,故需要對現有運行的存儲網關進行在線升級操作,前期需要全面檢查設備狀態和主機運行多路徑狀態。
VPLEX LOCAL升級METRO的過程就是將單邊存儲設備升級為雙活存儲設備的過程。將LOCAL升級為METRO后就將可以生產機房中生產數據在線遷移至新機房。但是將VPLEX LOCAL升級為METRO需要兩邊機房同步進行調試工作,造成系統宕機的可能性比較高,現有生產機房建議在停機情況下升級為METRO和添加WAN口卡。針對無法忍受停機的業務我們建議通過使用VMAX或新HDS存儲直接分配新磁盤空間同原有磁盤做GPFS鏡像,或考慮VM虛擬機將部分業務暫時在線遷移到新分配的臨時空間上,減少停機所帶來的業務風險。
由于新機器780自帶的HMC控制臺版本為V8.6.0,考慮到VIOS版本,微碼版本和HMC版本接管問題,最終經過各方論證討論采取以下方案:
4臺小機都選擇使用一臺單獨的HMC去管理,可以選擇新機器的HMC控制臺接管4臺power小機實施LPM。(高版本的HMC操作系統能管理到VIOS2.2.2.2)
高版本的HMC操作系統由于向下兼容機器微碼,是能正常管理到4臺power780(包括新機器P780)考慮到LPM實施的穩定性和兼容性,在新機器780上搭載的VIOS版本也與之前的虛擬化平臺環境的VIOS版本一致,為VIOS2.2.2.2,后續LPM實施完成后,再酌情對現有的VIOS版本進行升級。
隨著公司業務的發展,公司開展的各種運營業務對信息化的需求日益增多,小型機虛擬化平臺的支撐作用也越來越明顯。通過此次公司信息專業搬遷的契機,將既有小型機虛擬化平臺進行了擴容和改造,進一步完善了虛擬化系統,為未來所承載業務的信息安全,容災備份,穩定運行等方面奠定了重要基礎。不斷完善的信息化架構體系建設,全面提升了企業信息化工作的安全生產能力。