高效松,楊金剛
(哈爾濱鐵路局 信息技術所, 哈爾濱 150006)
基于VMware集群技術的信息系統整合設計與實施
高效松,楊金剛
(哈爾濱鐵路局 信息技術所, 哈爾濱 150006)
大量鐵路信息系統的實施,在帶來工作便利的同時,也產生了舊服務器維護成本過高、新服務器資源使用率過低等現象。本文結合哈爾濱鐵路局信息系統應用現狀,通過采用VMware虛擬化集群技術,以現有服務器及信息系統的整合過程為例,從多個角度進行整合設計,對實施過程中的一些經驗和需要注意的事項進行了總結。
虛擬化;虛擬集群;系統整合;機房整合
近年來,大量鐵路信息系統的投產,在提升鐵路運輸生產效率及鐵路運輸質量的同時,也增加了信息系統維護部門的運營及維護成本。要想較好地解決這些問題,虛擬化技術是一個有效的手段。眾所周知,利用虛擬化技術,可以整合應用負載,充分利用服務器性能并極大地降低維護與運營成本。本文從哈爾濱鐵路局信息系統整合的背景、目標及整體架構、遷移方案等多個方面對整合的設計及實施進行總結與描述。
哈爾濱鐵路局信息系統存在著舊服務器多、新服務器利用率低等諸多問題。
(1)老舊服務器維護成本高,新服務器資源使用率偏低。
機房運行著大量老舊服務器,經常出現服務器的硬盤、電源模塊故障,由于配件的停產、缺失,系統的維護成本升高。而相對較新的服務器資源利用率偏低,普遍存在單服務器跑單應用的現象,并且服務器未能建立有效的應用集群環境。
(2)硬件系統維護對業務影響大,新服務器部署時間長。
硬件故障維護、升級或擴容時,需要停機操作,常造成應用系統中斷,影響正常業務;新應用服務器的上線,安裝操作系統、更新系統補丁、部署殺毒軟件等工作,常常造成應用部署時間久、周期長的情況發生。
(3)服務器維護量大,機房用電及空調壓力大。
中心機房存在生產服務器型號繁雜、數量多,產生了維護工作量大、機房耗電量大及空調壓力重等問題,急需對機房相應服務器進行整合。
系統整合的總體目標是利用虛擬化技術,搭建VMware虛擬集群,解決鐵路局現有數據中心中存在的一些問題。
(1)提高機房空間的利用率,降低服務器的維護量。
利用服務器虛擬化技術實現 X86 服務器硬件資源整合,服務器數量減少50%以上,整合后節約60%以上機房空間。在極大減少服務器維護量的同時,降低機房用電及空調壓力。
(2)通過建立VMware集群,提高應用服務器的可靠性。
利用服務器虛擬化技術建立VMware集群,為所有虛擬服務器提供高可用性(HA) 保護,在不增加成本的情況下解決缺少 HA 保護的難題。在硬件維護的過程中,通過集群應用級的高可用,將業務的中斷降至1 min以內。
(3)建立高效的運維管理,降低操作系統部署時間。
建立統一管理平臺,對基礎設施、IT設備等資源進行動態調度,簡化管理,提高運營效率,降低運營成本。將操作系統部署的平均時間由5 h降至30 min以內。
基于哈爾濱鐵路局數據中心的現狀和未來業務的發展目標,充分利用虛擬化技術,構建適合鐵路局業務發展的私有數據中心,實現鐵路局信息系統基礎架構“統一規劃”、“統一部署”和“統一管理”,最終實現 IT“服務”轉型。
3.1 服務器架構
為保證各應用的安全隔離,依據業務的不同重要程度,服務器架構包括:虛擬機管理集群、重要應用集群、備份機制。
(1)虛擬機管理集群
2 臺 4 路刀片服務器部署在數據中心,用于支撐數據中心虛擬集群的管理,包括:vCenter Server、 vSphere Data Protection、虛擬機遷移等服務器,近而實現管理與業務的分離。
(2)應用生產集群
8 臺 4 路刀片服務器和10 臺 2 路刀片服務器,分布部署在兩個集群中,用于支撐現有的老舊服務器以及未來新業務系統部署。邏輯上分為重要應用集群、一般應用集。重要應用集群采用 8 臺4路刀片服務器,支撐生產系統高性能需求業務;一般應用集群采用 10 臺2路服務器,支撐內網普通業務服務,集群依據業務負責情況自動均衡分配資源,初期按照整合比1:10進行實施,未來依據實際運行情況調整。
(3)備份機制
如條件準許,采用2臺2路機架式帶存儲的服務器,通過部署VMware Data Protection (VDP)建立備份集群;或各自應用系統采用系統定時等方式進行數據備份。由于條件限制,我們暫采用第2種方式進行備份。
3.2 存儲架構
為解決存儲數據分散保存和缺少高可靠性保護等問題,本方案設計通過1臺存儲劃分兩個LAN的方式承載X86業務負載。重要應用集群、一般應用集群服務器部署在此存儲中,存儲硬盤要求采用RAID5及以上的劃分模式。由于存儲容量的限制,我們采用了兼顧安全及經濟的RAID5方式存儲數據。
3.3 網絡架構
以太網絡由管理集群、生產集群連接匯聚交換機,通過兩路光纖網卡和VLAN 方式隔離不同業務流量,并通過 Qos 進行業務帶寬分配;虛擬化平臺網絡功能分為管理網絡、VMotion 網絡和VM 網絡等幾種類型,針對現有網絡,達到最佳應用效果。虛擬機VLAN網絡圖如圖1所示。
3.4 應用系統遷移
3.4.1 應用系統遷移方式
應用系統由物理機遷移為虛擬機(P2V)通常包含3種方式, 每種方式適應不同的應用遷移場景,需要根據具體的實際情況選擇適合的遷移方案。
(1)系統在線熱遷移
系統在線熱遷移也稱為系統實時遷移,是指通過宿主操作系統安裝遷移工具,對應用系統進行在線狀態的遷移。熱遷移主要適應的場景包括:一般由于業務原因,使得服務器無法關機或不可長時間關機的應用系統。此類應用可以選用免費的VMware Converter遷移工具,進行系統在線遷移。

圖1 虛擬機VLAN網絡圖
此種遷移方式的主要優點是對運行的業務影響最小,即最大程度地實現了系統的在線遷移,而且目前VMware官方對此提供的支持也較好,其缺點是系統遷移之后,原有系統的未優化之處也一并被遷移。
基于熱遷移所具有的這些優點及相應業務的需求,本次應用系統的整合,90%以上的服務器采用了熱遷移的方式進行系統整合。
(2)系統離線冷遷移
系統離線冷遷移是指通過光盤引導遷移工具軟件的方式,對應用系統進行系統離線狀態的遷移,此時應用宿主系統處于關機狀態。冷遷移主要適應的場景是對原應用系統一致性要求較高,并且應用可停機的情況。此類應用可以選用免費的VMware Converter光盤引導版遷移工具進行系統離線遷移。
此種遷移方式的主要優點是宿主機無需安裝軟件,并且實現了遷移前后的應用系統內容一致性最高。此種遷移方式的缺點也較突出,主要原因是此種方式需要加載網卡和Raid卡等驅動,經常造成系統的遷移成功率較低。此外,目前VMware官方網站在系統遷移工具欄也不提供此版本的軟件鏈接,同時隨著新的硬件不斷地更新,缺少新版驅動的情況也影響了此種方式遷移的成功率。
由于此種遷移方式存在的弊端,本次系統整合僅對站段細信息系統等特例服務器進行冷遷移測試,測試中出現多次遷移失敗的情況。所以在具體的生產整合過程中,我們未采用此種遷移方式。(3)系統重新部署,手工遷移手工遷移是指通過采用新建宿主操作系統,重新部署應用的方式實現遷移。此種遷移方式主要應用場景是需要對原有系統進行優化,解決原有系統應用及數據庫等要素進行調整、優化的使用場景。
此類遷移方式的優點是可以對原有系統進行優化,使新系統可以獲得更好的穩定性及可用性。缺點是人工參與較多,需要廠商或應用工程師配合,并且相對前兩種方式此種遷移也最耗時。
在本次應用系統的整合過程中,存在著對多個系統進行優化、調整的需求。基于此種需求,我們采用手動遷移的方式對處室網站平臺、信息流轉信息系統等進行遷移整合。
3.4.2 應用系統具體遷移步驟
(1)應用系統硬件調查,特殊軟件需求獲取
針對原有應用進行調查,包括:是否運行于老舊設備、單機單服務器之上;運行的操作系統及硬盤和內存應用調查;應用數據庫類型;是否需要特殊軟、硬件。整合應用系統遷的移計劃樣例如圖2所示。
(2)應用預遷移測試,制定遷移資源配置表
挑選代表性應用,進行遷移測試。包括:Windows2003、Windows2008以及冷、熱兩種遷移分別進行測試,根據測試及調查結果進行遷移資源配置。由于虛擬機資源可以后期動態調整,所以基于有效利用硬件資源的前提是遷移資源配置應按照中等資源需求進行配置。

圖2 系統遷移計劃樣例圖
(3)遷移后,進行資源配置與遷移驗證
依據具體業務需求及資源配置表,分配資源遷移系統,各應用部門配合進行遷移驗證。
3.5 虛擬化安全
可以采用專業的虛擬化安全軟件,為虛擬環境提供全面的保護;或者采用Mcfaee殺毒軟件進行安全防護。目前,我們主要采用Mcfaee進行病毒安全防護。
4.1 以安全為第一注意事項,實施指導計劃
由于整合的應用系統均為生產系統,所以方案的設計及實施均以安全為第一位。整合需要事前進行認真調研,制定實施方案與測試計劃。根據測試結果進行項目實施并在投產后注意集群監管。
4.2 根據系統整合特點,注重實施細節
項目涉及的應用環境復雜,需注重前期準備調研,并針對特殊問題采取相對應的解決對策。
(1)系統內運行的特殊服務在遷移過程中易產生數據不一致的問題,此時可將服務退出或停止,待遷移完成之后再將各服務改為原有模式。
(2)各底層管理服務器的ESXi操作系統,應盡量采用相同的版本,方便虛擬機的HA及容錯(FT)等技術的使用。如果ESXi需要升級,應執行先升級測試后投產的原則。
(3)Windows2008系統遷移后,需要聯網激活。針對此類問題,可采用電話激活、外網激活等方式。
(4)尤其注重官方文檔的使用并結合互聯網資源,有效地完成項目的實施工作。
(5)通過管理軟件,高效地對虛擬環境進行監控。虛擬機部署之后,也需要對虛擬集群、虛擬機、存儲、網絡等進行監控。通常此類監控可采用VMware vSphere自身的監控工具或專用的虛擬機管理監控工具vCenter Operations Manager(VCOPS)。VMware vSphere系統性能監控圖如圖3所示。

圖3 系統性能監控圖
通過采用虛擬機集群技術,整合舊系統、實施新系統,是搭建企業應用數據中心的一種重要手段。哈爾濱鐵路局信息系統整合于2015年底完成,企業內部私有應用數據中心的優勢顯現,降低了信息系統維護及運營成本,提高了工作效率,較好地達到了系統整合的預期目標。
[1] Matt Liebowitz,Christopher Kusek. VMware vSphere 性能設計:性能密集場景下CPU、內存、存儲及網絡的最佳設計實踐[M]. 姚海鵬,劉韻浩,譯.北京:機械工業出版社,2015,8.
[2] 戴夫?沙克爾福. 虛擬化安全解決方案[M]. 張小云,譯.北京:機械工業出版社,2015.
[3] Christopher Wahl, Steve Pantol. Vmware網絡技術原理與實踐[M]. 姚 軍,譯.北京:機械工業出版社,2014.
[4] 王春海. VMware vSphere企業運維實戰[M]. 北京:人民郵電出版社,2014.
責任編輯陳 蓉
Integration of Information System based on VMware cluster technology
GAO Xiaosong, YANG Jingang
( Institute of Information Technology, Harbin Railway Adminnistration, Harbin 150006, China )
The implementation of a large number of Railway Information Systems has brought convenience at work. However, it also created the problems of high maintaining cost of old servers and low utilization rate of new servers. This article combined with the present situation of Information System application in Harbin Railway Administration, took the integration process of the servers and Information System as an example, used the VMware virtual cluster technology to design the integration process from multiple perspectives, summarized some experiences and some matters needing attention in the implementation process. The author hoped that this article could provide some useful help for the colleagues.
virtualization; virtual cluster; system integration; server room integration
U29∶TP39
A
1005-8451(2016)12-0023-04
2016-05-25
高效松,高級工程師;楊金剛,高級工程師。