王鐵毅
(山東鋼鐵集團(tuán)有限公司信息化中心,山東濟(jì)南 250014)
信息化建設(shè)
云計(jì)算平臺(tái)系統(tǒng)運(yùn)行模式設(shè)計(jì)研究
王鐵毅
(山東鋼鐵集團(tuán)有限公司信息化中心,山東濟(jì)南 250014)
圍繞著基于云架構(gòu)的企業(yè)OA、人力資源、固定資產(chǎn)、檔案管理、全面預(yù)算、外事管理等業(yè)務(wù)系統(tǒng)的整體云應(yīng)用,為獲得更加經(jīng)濟(jì)、適用的運(yùn)行效果,實(shí)現(xiàn)資源的按需調(diào)配與供給,運(yùn)用模板擴(kuò)展方式具體定義和創(chuàng)建可自動(dòng)執(zhí)行的系統(tǒng)運(yùn)行模式,以支持綠色節(jié)能、高效運(yùn)行和斷電保護(hù),規(guī)避潛在的手工操作風(fēng)險(xiǎn),經(jīng)試用取得初步成效,并進(jìn)一步探索了云應(yīng)用由自動(dòng)化向智能化提升的可行性。
云計(jì)算;云應(yīng)用;資源調(diào)配;自動(dòng)運(yùn)行模式
數(shù)據(jù)中心耗能巨大,IT設(shè)備特別是服務(wù)器約占其中的40%[1]。云計(jì)算技術(shù)的應(yīng)用不但為企業(yè)帶來(lái)了更加智能的運(yùn)算方式,作為一種IT資源服務(wù)的獲取和交付,在促進(jìn)企業(yè)科學(xué)決策、快速創(chuàng)新方面體現(xiàn)著巨大優(yōu)勢(shì),并能幫助數(shù)據(jù)中心大幅提高資源利用率,減少系統(tǒng)軟硬件采購(gòu),節(jié)省能源開(kāi)支,實(shí)現(xiàn)轉(zhuǎn)型升級(jí)和綠色發(fā)展[2]。
企業(yè)整體云架構(gòu)的建立,為日后充分發(fā)揮IT平臺(tái)的作用,提供了廣泛的發(fā)展和想象空間,特別在資源按需調(diào)配與供給方面,通過(guò)合理操作,提高云平臺(tái)運(yùn)行質(zhì)量和效益,利用有限的資源消費(fèi)可獲得更加經(jīng)濟(jì)、適用的運(yùn)行效果,既能響應(yīng)不同類型的業(yè)務(wù)需求[3],又能使系統(tǒng)資源占用更少、能耗開(kāi)銷更低,進(jìn)而降低IT系統(tǒng)的運(yùn)營(yíng)成本和再建投資。但由于資源調(diào)配、系統(tǒng)遷移的嚴(yán)謹(jǐn)性和復(fù)雜性,在企業(yè)具體實(shí)施過(guò)程中卻苦于沒(méi)有自動(dòng)化的運(yùn)行模式而望而卻步,因?yàn)榻柚诠ぞ哕浖娜斯るx散性操作,盡管事先針對(duì)既定目標(biāo)制定了嚴(yán)密的計(jì)劃,可稍有不慎也會(huì)產(chǎn)生意想不到的后果,甚至導(dǎo)致系統(tǒng)性風(fēng)險(xiǎn)。因此在云平臺(tái)的實(shí)際使用上只按固定的初始運(yùn)行模式工作,不論工作日、節(jié)假日,還是白天、黑夜,甚至不管任務(wù)輕重緩急,資源配置固定于初始狀態(tài),系統(tǒng)運(yùn)行不做動(dòng)態(tài)調(diào)整,致使云平臺(tái)應(yīng)有的作用大打折扣。這就提醒我們,在云平臺(tái)交付使用時(shí),為獲得預(yù)期的運(yùn)行效果并規(guī)避潛在的操作風(fēng)險(xiǎn),必須針對(duì)不同的需求確定相應(yīng)的系統(tǒng)追求目標(biāo)和資源調(diào)配策略,并依此定義和創(chuàng)建一系列可自動(dòng)執(zhí)行的運(yùn)行模式,以全流程完成各既定目標(biāo)、滿足不同需求,這應(yīng)該作為企業(yè)真正實(shí)現(xiàn)私有云落地的必然步驟,而不能只停留在固定的初始運(yùn)行模式階段,但它的確是一項(xiàng)十分復(fù)雜和耐心細(xì)致的工作。對(duì)此,基于微軟System Center 2012建立的企業(yè)云計(jì)算平臺(tái),實(shí)現(xiàn)了各類業(yè)務(wù)的整體云應(yīng)用,并在系統(tǒng)動(dòng)態(tài)資源調(diào)配和優(yōu)化運(yùn)行模式方面做了有益的探索,獲得初步成效。
Dell M910刀片服務(wù)器CPU利用率與機(jī)箱(M1000e+8*M910)總功耗的關(guān)系見(jiàn)表1,通過(guò)數(shù)據(jù)分析得知,當(dāng)服務(wù)器CPU利用率由10%提升到80%,系統(tǒng)整體能耗只增加10%;每多開(kāi)1臺(tái)服務(wù)器,系統(tǒng)整體能耗幾乎增加1倍。盡管這一結(jié)果或許隨服務(wù)器的不同而做調(diào)整[4],但總的趨勢(shì)足以說(shuō)明,由于資源調(diào)配策略和運(yùn)行模式不同,對(duì)完成同一項(xiàng)業(yè)務(wù)的能耗開(kāi)銷和運(yùn)行效率存在很大差異;服務(wù)器CPU利用率可做為平衡云計(jì)算平臺(tái)資源消費(fèi)和運(yùn)行效率、制定各類運(yùn)行模式的基本依據(jù)[5]。

表1 Dell M910刀片服務(wù)器CPU利用率與機(jī)箱總功耗的關(guān)系
利用有限的資源獲得更加經(jīng)濟(jì)、適用的運(yùn)行效果,須兼顧云平臺(tái)資源開(kāi)銷與運(yùn)行效率的平衡。資源配置最大化意味著資源投入最大化,換來(lái)的是系統(tǒng)運(yùn)行和服務(wù)響應(yīng)的高效率;資源節(jié)約配置,犧牲的是系統(tǒng)運(yùn)行的效率和服務(wù)響應(yīng)時(shí)間。業(yè)務(wù)需求性質(zhì)決定系統(tǒng)追求目標(biāo)的取舍,要圍繞不同的系統(tǒng)追求目標(biāo),綜合考慮各種相關(guān)因素,制定相應(yīng)的資源調(diào)配策略和具體操作步驟,關(guān)鍵在于運(yùn)用合適的方法,結(jié)合軟硬件實(shí)際環(huán)境,創(chuàng)建有針對(duì)性的可自動(dòng)運(yùn)行模式,使各項(xiàng)資源調(diào)配策略得以落地實(shí)施。為簡(jiǎn)化工作、提高效率、減少失誤,本案運(yùn)用模板擴(kuò)展方式,完成多種自動(dòng)運(yùn)行模式的定義和創(chuàng)建,以支持綠色節(jié)能、高效運(yùn)行和斷電保護(hù),其中貫穿著“由簡(jiǎn)到繁、由基本到復(fù)雜”以及“細(xì)化、優(yōu)化、固化并可逆化”全過(guò)程。其要點(diǎn)有:
1)按軟件工程觀點(diǎn),為提高復(fù)用率,先創(chuàng)建幾個(gè)功能相對(duì)單一、可供直接調(diào)用的基本運(yùn)行模板,通過(guò)調(diào)用執(zhí)行就能自動(dòng)完成系統(tǒng)基礎(chǔ)資源(如CPU、內(nèi)存、存儲(chǔ)等)的調(diào)配或遷移操作;2)以基本運(yùn)行模板為基礎(chǔ),做適當(dāng)調(diào)整、擴(kuò)充或組合,按實(shí)際需要制定功能較為完整、可達(dá)既定目標(biāo)的資源調(diào)配策略和操作流程,并形成固化的可自動(dòng)執(zhí)行的運(yùn)行模式;3)兼顧正、反雙向操作,既可正向操作完成既定目標(biāo),又兼顧反向操作恢復(fù)原有狀態(tài),進(jìn)一步降低和消除操作風(fēng)險(xiǎn)。
3.1 自助資源申請(qǐng)
通過(guò)平臺(tái)軟件提供的統(tǒng)一服務(wù)交付工具和自助服務(wù)門戶,由需求客戶發(fā)出計(jì)算資源申請(qǐng),經(jīng)系統(tǒng)管理員審批、生成和分配計(jì)算資源(見(jiàn)圖1),實(shí)現(xiàn)IT服務(wù)的按需申請(qǐng)和自助使用,以此支持業(yè)務(wù)的快速部署,提高系統(tǒng)管理效率。

圖1 資源自助申請(qǐng)流程
3.2 CPU資源動(dòng)態(tài)調(diào)配
隨著某應(yīng)用負(fù)載增加,虛擬服務(wù)器過(guò)載將影響正常工作時(shí),系統(tǒng)自動(dòng)提高過(guò)載虛擬服務(wù)器的配置,實(shí)現(xiàn)了系統(tǒng)的動(dòng)態(tài)資源調(diào)度,保證正常的業(yè)務(wù)處理。具體設(shè)定值是當(dāng)某個(gè)在線應(yīng)用系統(tǒng)的CPU利用率超過(guò)60%時(shí),自定義工作流自動(dòng)觸發(fā)該虛擬服務(wù)器的關(guān)機(jī)操作,并將CPU配置自動(dòng)提升為4個(gè)CPU并增加適當(dāng)內(nèi)存后,重新啟動(dòng)虛擬服務(wù)器。自動(dòng)提高虛擬服務(wù)器配置滿足過(guò)載需求的相關(guān)流程參見(jiàn)圖2。

圖2 虛擬CPU資源動(dòng)態(tài)調(diào)配流程
3.3 虛擬機(jī)調(diào)配
隨著工作負(fù)載不斷加大,當(dāng)1臺(tái)虛擬服務(wù)器無(wú)法滿足正常業(yè)務(wù)時(shí),系統(tǒng)將動(dòng)態(tài)增加虛擬機(jī)數(shù)量,分擔(dān)當(dāng)前虛擬機(jī)的負(fù)載,支撐業(yè)務(wù)正常工作,滿足大流量系統(tǒng)要求。
具體可利用網(wǎng)絡(luò)負(fù)載均衡集群技術(shù)(微軟NLB)構(gòu)建3臺(tái)Web服務(wù)器虛機(jī),先啟動(dòng)其中1臺(tái),當(dāng)這臺(tái)應(yīng)用的CPU負(fù)載達(dá)到設(shè)定值60%時(shí),自定義工作流觸發(fā)啟動(dòng)第2臺(tái)虛機(jī)操作以分擔(dān)負(fù)載,進(jìn)一步可類推觸發(fā)啟動(dòng)第3臺(tái)虛機(jī)操作,進(jìn)而動(dòng)態(tài)增加虛擬機(jī)數(shù)量,滿足大流量系統(tǒng)正常工作。動(dòng)態(tài)增加虛擬機(jī)數(shù)量支持大流量系統(tǒng)的相關(guān)流程參見(jiàn)圖3。

圖3 虛擬機(jī)資源動(dòng)態(tài)調(diào)配流程
3.4 虛擬機(jī)與物理機(jī)漂移
當(dāng)虛擬服務(wù)器的性能無(wú)法滿足當(dāng)前應(yīng)用的快速擴(kuò)張時(shí),可有計(jì)劃地將虛擬服務(wù)器漂移到計(jì)算能力更強(qiáng)的物理服務(wù)器上去執(zhí)行,以保證業(yè)務(wù)的正常進(jìn)行。利用Dell的AIM管理軟件,按AIM執(zhí)行計(jì)劃能夠?qū)崿F(xiàn)虛擬服務(wù)器對(duì)物理服務(wù)器之間的互相漂移,相關(guān)流程參見(jiàn)圖4。

圖4 虛擬機(jī)與物理機(jī)之間的動(dòng)態(tài)漂移流程
4.1 一般性模式
總結(jié)實(shí)際工作需要,在分析各類業(yè)務(wù)應(yīng)用系統(tǒng)的性質(zhì)和資源配置需求的基礎(chǔ)上,就不同的系統(tǒng)追求目標(biāo),結(jié)合已創(chuàng)建的基本運(yùn)行模板,具體定義和設(shè)計(jì)以下幾個(gè)更為實(shí)用的一般性運(yùn)行模式。
1)最小化模式。以業(yè)務(wù)應(yīng)用系統(tǒng)集中部署為目標(biāo),多開(kāi)虛機(jī)服務(wù)器,盡可能減少服務(wù)器使用數(shù)量,此時(shí)投用的物理機(jī)最少,能耗最低,資源利用率最高,保守設(shè)置不低于80%(內(nèi)存足夠大的情況下)。
2)高效模式。為業(yè)務(wù)應(yīng)用系統(tǒng)配置足夠的資源量,以利其快速、高效地完成任務(wù)。為保證業(yè)務(wù)應(yīng)用順暢、毫無(wú)障礙的執(zhí)行,資源量一般按完成任務(wù)所需的最大峰值配置,以減少虛擬機(jī)資源調(diào)配和遷移,該模式下平均資源利用率不超過(guò)40%(在內(nèi)存足夠大的情況下)。
3)節(jié)能模式[6]。在服務(wù)響應(yīng)可以接受的前提下,以節(jié)約能耗為目的,二者兼顧,不斷加大任務(wù)負(fù)載、提高資源利用率并降低服務(wù)響應(yīng)直到用戶基本還可以承受,以此作為該模式的資源配置目標(biāo)。通常情況下,節(jié)能模式可能為最小化模式。
4)斷電保護(hù)模式。確定停電后關(guān)掉大部分應(yīng)用,以保護(hù)不宜關(guān)停的核心業(yè)務(wù)能夠堅(jiān)持更長(zhǎng)時(shí)間的運(yùn)行。
4.2 智能化模式
基于一般性模式可推演智能化模式。按時(shí)間坐標(biāo)記錄各業(yè)務(wù)應(yīng)用的資源時(shí)序占用值,包括每個(gè)應(yīng)用的CPU利用率、內(nèi)存消耗、存儲(chǔ)大小等,以此按制定優(yōu)化的資源時(shí)序調(diào)配計(jì)劃,并能夠自修正、自學(xué)習(xí)、自適應(yīng),使各應(yīng)用系統(tǒng)始終處于所希望的資源環(huán)境下運(yùn)行。
智能化運(yùn)行模式雖然只是多一維時(shí)間因素,但與一般性模式有很大不同。結(jié)合時(shí)間坐標(biāo)將最小化、高效和節(jié)能模式組合起來(lái),通過(guò)運(yùn)行環(huán)境預(yù)設(shè)、錯(cuò)峰運(yùn)行,合理運(yùn)用有限的資源在合適的時(shí)間安排合適的事,進(jìn)一步提高系統(tǒng)的運(yùn)行質(zhì)量和效果,即所謂最佳運(yùn)行模式,實(shí)現(xiàn)系統(tǒng)運(yùn)行的精準(zhǔn)控制。
1)最小化模式運(yùn)行:安排在系統(tǒng)大修期、設(shè)備更換期,或在夜間、節(jié)假、公休日。2)高效模式運(yùn)行:安排在業(yè)務(wù)處理高峰時(shí)段,如剛上班時(shí),或在月末結(jié)算時(shí),等。3)節(jié)能模式運(yùn)行:多安排在業(yè)務(wù)處理量平穩(wěn)時(shí)段。4)最佳模式運(yùn)行:將上述模式合理組合起來(lái),將生成一系列適合正常工作日、節(jié)假公休日、月末結(jié)算日的系統(tǒng)運(yùn)行模式,以閉環(huán)、自適應(yīng)的方式控制云平臺(tái)系統(tǒng)運(yùn)行,在保證完成規(guī)定任務(wù)的同時(shí),用較低資源消費(fèi)獲得最佳效果,進(jìn)而減少IT系統(tǒng)的運(yùn)營(yíng)成本和再建投資。
本項(xiàng)目一期云計(jì)算系統(tǒng)由12臺(tái)Dell刀片服務(wù)器、一臺(tái)高性能存儲(chǔ)和若干網(wǎng)絡(luò)設(shè)備等硬件組成,部署微軟System Center 2012和Dell的AIM等軟件,構(gòu)建了整體云應(yīng)用的云計(jì)算平臺(tái)和云數(shù)據(jù)庫(kù)資源,已遷入并正常運(yùn)行的有OA、人力資源、固定資產(chǎn)、檔案管理、全面預(yù)算、全面風(fēng)險(xiǎn)、外事管理以及內(nèi)網(wǎng)網(wǎng)站等十幾套業(yè)務(wù)系統(tǒng),業(yè)已通過(guò)有省關(guān)部門組織的技術(shù)鑒定?;谠搼?yīng)用實(shí)例,利用微軟3個(gè)公共組件SCOM+ORCH+SCVMM,創(chuàng)建了基本運(yùn)行模板和一般性運(yùn)行模式,通過(guò)驗(yàn)證性運(yùn)行,結(jié)果分析表明,系統(tǒng)運(yùn)行的技術(shù)經(jīng)濟(jì)指標(biāo)明顯改善,需要投入的計(jì)算資源大幅減少,能耗大約是傳統(tǒng)單機(jī)方式的1/7,與云平臺(tái)初始模式相比可節(jié)能19%~23.7%,后者主要來(lái)自夜間或非工作日的最小化模式運(yùn)行,擴(kuò)大內(nèi)存優(yōu)化配置后運(yùn)行效果會(huì)更為明顯。
[1]谷立靜,周伏秋,孟輝.我國(guó)數(shù)據(jù)中心能耗技能效水平研究[J].中國(guó)能源,2010(11):42-45.
[2]過(guò)敏意.綠色計(jì)算內(nèi)涵及趨勢(shì)[J].計(jì)算機(jī)工程,2010,36(10):1-7.
[3]陳廷偉,周山杰,秦明達(dá).面向云計(jì)算的任務(wù)分類方法[J].計(jì)算機(jī)應(yīng)用,2012,32(10):2 719-2 723.
[4]張桂林.主流刀片PK能耗[EB/OL].(2010-09-19)[2014-05-26].http://server.zol.com.cn/196/1967447.html.
[5]雷成軍,羅亮,吳文峻.基于云計(jì)算的集群能耗監(jiān)控與節(jié)能方法[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(11):242-244.
[6]徐驍勇,潘郁,凌晨.云計(jì)算環(huán)境下資源的節(jié)能調(diào)度[J].計(jì)算機(jī)應(yīng)用,2012,32(7):1 913-1 915.
Design and Research of Operating SystemModel Based on Cloud Computing
WANG Tieyi
(The Information Technology Center of Shandong Iron and Steel Group Co.,Ltd.,Jinan 250101,China)
Based on overall cloud computing framework,around comprehensive cloud application of enterprise OA system,human resource,fixed assets,file management,overall budgeting,foreign affairs management system etc.,and in order to get more economic and efficient operating result,define and build an automatic operating model for allocation of resources to support green energy, effective operating,and avoid artificial risk,the operation model of cloud computing system was researched and designed and the possibility of raising automatic cloud to intelligent cloud was explored further.
cloud computing;cloud application;allocation of resources;automatic operating model
TP393.09
B
1004-4620(2014)03-0054-03
2014-02-11
王鐵毅,男,1961年生,1984年畢業(yè)于鞍山鋼鐵學(xué)院計(jì)算機(jī)科學(xué)專業(yè)?,F(xiàn)為山東鋼鐵集團(tuán)信息化中心副總經(jīng)理,高級(jí)工程師,從事大型企業(yè)集團(tuán)數(shù)據(jù)中心及IT基礎(chǔ)架構(gòu)的研究應(yīng)用工作。