王琪 史先娟 秦國剛



摘要:本文通過高校中各類軟硬件系統利用率低、負載不均、容災備份低、能耗高、投入高產出低等問題進行了研究,詳細分析了高校網絡線路資源、計算資源、硬件設備、大數據量存儲資源的使用現狀,并提出了解決當前高校信息系統發展問題中整體方案。將資源整體融合成應用虛擬池,充分挖掘計算資源。在本文中對各類虛擬化技術應用方法與應用效果進行了詳細闡述,證明了本方案的優點與可行性。
關鍵詞:虛擬化;信息系統;利用率;計算資源
中圖分類號:TP393 文獻標識碼:A DOI:10.3969/j.issn.1003 6970.2016.05.016
本文著錄格式:王
琪,史先娟,秦國剛.高校信息資源虛擬化技術的應用與實踐.軟件,2016,37(5):63-67
0.引言
虛擬化技術現今發展迅猛,各類廠商不斷研究針對計算、存儲、網絡級別的應用技術并迅速推陳出新,虛擬化技術的本質其實就是不斷發掘IT軟硬件資源的可充分利用之處,帶給各行業用戶更大的利益與價值。作者在集成商與高校單位中工作多年,見證了虛擬化應用從無到有、逐步起步強大的發展歷程。
如今高校信息應用需求不斷增加,絕大部分教學資源已經網絡平臺化,師生的日常教學、科研、生活越來越依賴手機、網絡與軟件系統。同時用戶體驗越來越重要,要求資源平臺響應及時、界面簡潔、使用方便、內容豐富、所見所得,但高校的應用規模普遍在萬人以上,并發訪問時形成海量數據請求,如此大規模的訪問壓力下給網絡、應用、計算與存儲資源帶來了相當大的挑戰。尤其在迎新、選課、報名、離校、上課等使用高峰期,在傳統運行模式下谷時利用率低、峰時資源窮盡等情況層出不窮,給運維人員帶來了很大的挑戰,所以利用虛擬化技術對數據中心及校園網進行全面虛擬化改造,不但可以提高物理資源的利用率,實現系統資源的快速部署靈活調度,還可以進一步降低管理成本。
通過長期使用、研究逐步發現原有IT運行模式存在如下缺點:單體物理設備硬件資源利用率低,設備功耗大,系統部署效率偏低,冗余性低,資源調度不靈活。所以通過對校園各類網絡、計算、存儲虛擬化的研究,分析傳統模式的問題與發展瓶頸,必須要能找到符合當前高校信息系統特殊需求的應用方案,最終期望的結果是信息資源的使用類似現在的水、電、氣一樣就可以快速獲取直接使用,用戶使用體驗良好,不必關心計算設備、存儲或數據等相關資源位置和具體部署方式。
1.建設目標
當前信息系統一直朝著資源整合、精細化管理的趨勢發展,利用虛擬化整體解決方案的目標就是解決物理設備利用率低下、維護困難等問題,降低運行維護和建設成本,幫助管理人員更高效利用資源充分發掘投資價值。
具體而言,通過信息資源虛擬化能夠達到如下目標:
(1)在用戶無需知情或感覺中斷的情況下進行虛擬化部署及改造,無縫融入現有信息系統中。
(2)降低信息系統管理復雜度、解決服務器及網絡擴展性差的問題。確保部署虛擬化技術的信息系統無單點故障問題,實現故障預警和統一協調管理,消滅信息數據孤島。
(3)解決部分應用系統軟硬件資源分配不均問題,讓不同服務對象、不同應用功能、使用頻率大為不同的各業務系統在高峰時能滿載利用,低峰時釋放資源支援其他服務。
(4)緩解機房建設及運行維護成本過高的問題,尤其隨著設備增多,運轉能耗與空調能耗比例逐漸呈現1:1的情況、機房空間捉襟見肘的問題。
(5)解決系統快速備份和有序恢復的難題,降低管理工作量,減小系統安全性和穩定性上的不確定因素。
(6)實現極端災難情況下,重要業務系統數據不丟失、系統能夠短時間內遷移重新上線運行。
2.資源虛擬化方案設計
2.1帶寬線路虛擬化方案
高校一般使用教育科研網絡對外發布信息資源提供各類服務,edu域名解析為教育網公網IP地址。由于外部訪問者用戶一般使用的是電信、聯通、移動、廣電運營商線路,所以訪問時會存在運營商之間的互聯互通瓶頸,訪問響應慢、延遲高、高峰期線路滿載、容災備份能力不足。一旦教育網線路出現故障,一段時間內會造成所有資源無法訪問。
針對帶寬資源的虛擬化方案是將單位所有的不同運營商線路進行整合,將幾條不同的線路虛擬化為整體資源。尤其考慮到高校應用場景流量以下載方向為主,上傳方向較為空閑,可以充分利用其它運營商上傳空閑方向帶寬,結合unix平臺技術使用源IP地址進行智能DNs解析,將用戶按照來源劃分為校內用戶、校外四大運營商用戶、海外用戶等不同角色,使得用戶就近訪問獲得較好的使用體驗,一旦任意一條線路出現故障可以觸發解析切換,盡量減少中斷時間,如圖1所示。
2.2接入與核心網絡虛擬化方案
傳統網絡部署模式下,見圖2所示,高校網絡一般分為接入、匯聚、核心三層,接入設備連接終端用戶與無線AP,匯聚與雙核心之間采用路由模式傳輸數據,多個接入設備互連一般采用級聯模式,上聯為單線路至匯聚層設備。這種方式下單點故障源較多,單上聯線或者上級接入交換機一旦出現故障會波及所有或部分下游設備,造成大面積癱瘓,且內部線路帶寬僅為1Gbps。
目前主流設備廠商如思科、華為、華三、銳捷等都已經有自己的網絡虛擬化解決方案,功能上各有側重,如思科的VSS虛擬交換機技術,華三的IRF彈性智能技術,銳捷的VSU虛擬交換單元或者簡化版的STACK堆疊技術。所以改造方案可以采用雙核心采用雙機虛擬化,同一樓層中所有的接入采用N:I虛擬化。分別在第一臺與最后一臺接入設備上聯光口使用雙線路LACP聚合模式,確保任意一臺設備或線路故障,其余設備下的用戶不受中斷影響,見圖3所示。以一組四臺為例,正常互聯線路為A-B-C-D,通過虛擬化為單臺設備的互聯線路為A-B-C-D-A;正常上聯光纖線路為A-核心,通過聚合方式設置為A-核心1、D-核心2的2Gbps上聯。
接入設備虛擬化部署后,可以降低分支樓宇網絡任一互連線路損壞時50%故障概率(以雙上聯線路為標準),將原先單臺接入設備出現故障時的影響范圍降低75%(以四臺一組為標準),在雙核心設備虛擬部署后核心故障概率降低50%,單臺核心宕機情況下換對整網運行無影響,見圖4所示。
2.3計算資源虛擬化方案
目前國內外服務虛擬化技術發展已經較為成熟,主流的服務虛擬化如VMware公司的vSphere、微軟公司的Hyper-V R2和Citrix公司的XenServer/XenDesktop。通過上述技術可以實現物理機應用環境到虛擬機遷移(P2V模式)、虛擬機應用環境到虛擬機遷移(V2V模式),并能夠實現根據定義的事件如災難、停電、負載過重的情況下實現在線動態遷移功能。
以本單位使用的VMWARE公司vsphere產品為例,首先對應用服務器機運行情況評估如CPU核數、物理內存大小,其次分別在空閑服務器上部署vsphere虛擬化平臺與底層殺毒軟件。在控制臺中部署虛擬機同時分配資源限額,劃分的虛擬資源應該控制在物理資源的70%左右為佳。逐步將應用系統遷移至虛擬機上線,將應用遷移出去后的空余服務器上繼續部署底層軟件,見圖5所示。
在服務器資源虛擬化部署后,可以實現大部分數字化校園應用資源(除oracle數據庫)從物理機無縫遷移至虛擬機環境中,在虛擬機寄存的物理實體機宕機后,10秒內能自動遷移至其他實體機并恢復服務。在物理實體機CPU內存達到75%的情況下,觸發漂移機制,將負載過大的虛擬機器逐臺遷移出去控制資源利用率。通過類似的模式,可以將服務器與空調能耗比逐步降低為3:1,將每年采購服務器的需求逐步降低2/3。在一些特殊應用如選課、考試系統訪問量過大異常繁忙時,自動分配額外資源提供支持,滿足至少2000人并發訪問需求,保證業務不癱瘓,同時解決資源閑置無法合理利用的問題。在底層硬件中統一部署反病毒軟件,虛擬機無需加載安裝其他殺毒軟件或系統管理工具,節約單臺虛擬機約1/10的運行資源并能實現所有虛擬機的克隆備份與還原功能。通過將舊的設備虛擬化,持續降低采購、供應、維護方面的成本支出,實現快速部署應用、動態負載均衡,并且簡化災備流程。在基礎硬件的層面上構建操作系統,使得虛擬服務在不同硬件之間自由遷移,將操作系統和基礎硬件相分離,有效解決兼容性方面的問題。
2.4存儲資源虛擬化方案
通過存儲主備模式的改造,增設虛擬硬盤管理池,實現雙活存儲運行,提升數據讀寫效率和安全性。搭建彼此獨立且同時活躍運行的存儲系統,使得虛擬機的數據能夠在不同平臺的存儲系統中進行動態轉移,準確識別熱數據及冷數據并分類存放在不同響應速度的存儲硬盤中,實現高可用性和分布式資源調度功能,見圖6所示。
首先對存儲設備運行情況評估(一般至少有兩臺,傳統模式下為活躍一冷備工作狀態),部署相應邏輯資源池管理網關。對兩臺存儲設備上的所有硬盤進行虛擬化作業,將兩臺設備虛擬化為邏輯單臺(兩臺活躍一活躍)。在存儲設備上補充少量固態硬盤,針對熱門數據進行標識并將其分配到固態硬盤,確保用戶感興趣的熱門數據讀寫速度快。最后將虛擬機與存儲資源池關聯,使得用戶不必關心數據在哪一臺存儲或哪一塊硬盤中。
這種方案的主要目的就是將主用、冷備存儲均劃分到虛擬化資源池,預留高速硬盤用于熱數據讀寫操作,后期劃分硬盤空間時候,直接以虛擬資源池為目標分配資源代替原有的主用存儲,將冷備存儲的功能及利用率進一步提升,徹底形成雙活運行的存儲環境。
在存儲資源虛擬化部署后,減少存儲資源碎片空間,提升20%磁盤利用率;實現冷、熱數據分盤存放,熱數據存儲固態硬盤,每秒讀寫次數IOPS不低于3500次,冷數據存儲低速硬盤,每秒讀寫次數IOPS不低于180次;增強備份存儲設備利用率,將原先設計的一主一備存儲在部署虛擬化后實現雙活存儲模式,提升閑置設備利用率,降低重復投資。
2.5整體測試
整體虛擬化部署完成后,需要進行虛擬化的策略優化與測試工作,如接入網絡的邏輯線路聚合、防分裂檢測功能、核心網絡的單向追蹤定期監控、線路冗余及利用率情況、虛擬化設備在極端情況下的單機運行測試、制定閥值觸發虛擬機在線遷移、災難情況下的遷移功能、服務數據還原功能、雙活存儲中的數據備份情況確認。
3.結論
在整體虛擬化方案應用后,對園區型高校具有減小硬件投資、提高利用IT軟硬件資源率、節省機房空間、降低能源消耗、容災備份能力高、管理流程簡化等顯著作用。
以本單位2014-2015年信息系統平均維護統計數據為例,通過部署網絡系統虛擬化,四大校區47座樓宇(校園網覆蓋范圍內)中70個機房每年發生整體樓宇網絡故障中斷時間(停電情況除外)由6小時降低為3小時,服務人員出勤處理辦公室網絡故障由260次降低40%z~150余次,按照每個故障0.5小時處理時間計算可節約人力資源52小時每人次;核心機房網絡年度故障中斷時間(計劃的網絡割接與升級情況除外)由20分鐘降低為0。
通過部署物理服務器整體虛擬化,年度需要投入的服務器硬件資金由40萬元采購4-6臺機架式服務器降低為12萬元,轉為主要采購服務器內存和相關配件用于已有服務器硬件性能擴容。傳統安裝部署正版服務器操作系統、軟件驅動、插件、反病毒軟件需要1小時左右,通過虛擬化克隆技術,單臺服務器安裝只需5分鐘時間,按照年度部署40臺新服務器情況下,可以節約管理人員37小時時間;在服務器硬盤損壞、系統崩潰、應用系統故障情況下,重新部署業務系統、安裝數據庫時間約為3小時,通過虛擬化備份還原技術,只需15分鐘左右時間即可恢復運行。所有的虛擬化平臺的業務系統一般能支持至少2000人并發,選課等高峰時段服務仍能夠堅持使用,原有的服務器利用率提升至于70%。
目前核心機房UPS最大支持40KVA,主要供應網絡、服務器、存儲、照明、新風及精密空調系統電力,按照0.9的功率因子換算最大功率為36千瓦,目前已經接近滿載。2014年度機房電費支出60萬元,按照民用電0.5元每千瓦時來計算,耗電120萬度電。預計在部署虛擬化后,核心網絡設備由目前的6臺減少至2臺、低端PC服務器硬件停機冷備、減少一套低性能存儲設備運行等操作未來5年內不需要購買大功率UPS進行電力擴容,節約15萬UPS設備費用;由于新增設備減少,機房能耗降低1/8;目前機房面積約150平方米,當前占用率75%,在部署虛擬化后預計的5年內不需要增加網絡與服務器機柜,所以可以節約部分機房改造擴容及相應空調、風力系統升級使用經費。