呂海紅
摘要
信息技術(shù)的高度發(fā)展,推動著數(shù)據(jù)中心架構(gòu)的不斷轉(zhuǎn)型升級,在這個過程中數(shù)據(jù)中心面臨著多個不同架構(gòu)、不同技術(shù)平臺共存的局面,甚至多個相同架構(gòu)相同技術(shù)的平臺共存,針對該問題本文提出了云管理平臺建設(shè)構(gòu)想,可實現(xiàn)對數(shù)據(jù)中心所有平臺的集中管理,可簡化運維管理、提高資源利用率、降低成本等。
【關(guān)鍵詞】數(shù)據(jù)中心 云管理平臺 統(tǒng)一管理
隨著信息技術(shù)的高速發(fā)展,數(shù)據(jù)中心經(jīng)歷著架構(gòu)的不斷轉(zhuǎn)型。為實現(xiàn)數(shù)據(jù)和資源的統(tǒng)一管理和對數(shù)據(jù)的綜合利用,人民銀行基本實現(xiàn)了兩級數(shù)據(jù)中心的建設(shè)部署。為緊跟技術(shù)發(fā)展趨勢,人民銀行也在探索研究云計算、分布式、超融合等新型技術(shù),并不斷探索和推動數(shù)據(jù)中心架構(gòu)轉(zhuǎn)型升級。隨著新技術(shù)的使用,省級數(shù)據(jù)中心建設(shè)部署有多套平臺,各平臺之間獨立運行,并逐漸暴露出一些問題,給運維管理帶來極大不便,本文針對這些問題提出云管理平臺建設(shè)構(gòu)想。
1 相關(guān)技術(shù)
云平臺。云平臺是一種新型的云計算模式,采用軟件技術(shù)將計算、網(wǎng)絡(luò)、存儲等解耦形成統(tǒng)一的易于管理的集成式資源共享池,實現(xiàn)IT基礎(chǔ)架構(gòu)的融合,為云計算數(shù)據(jù)中心的實施與部署提供技術(shù)支持。云平臺是對計算、網(wǎng)絡(luò)、存儲等資源的重新規(guī)劃再使用,并以低成本、易擴(kuò)展、易管理等為優(yōu)點,可實現(xiàn)多種應(yīng)用場景。
2 現(xiàn)狀分析
省級數(shù)據(jù)中心將轄內(nèi)的系統(tǒng)和數(shù)據(jù)進(jìn)行集中管理,目前我單位省級數(shù)據(jù)中心根據(jù)需要部署有多套虛擬平臺、Hadoop分布式大數(shù)據(jù)平臺,以及云桌面和部分有特殊用途的PC服務(wù)器等。目前正在探索使用超融合架構(gòu)、分布式、容器等,隨著技術(shù)發(fā)展趨勢以及需求的增加,不同技術(shù)、不同架構(gòu)的平臺將不斷增多,考慮到各平臺性能各異、成本、實施難度等問題,在最近幾年會存在集中式、分布式多種平臺共存的局面,多個平臺同步運行逐步顯現(xiàn)出一些問題和不足。
2.1 運維復(fù)雜
目前在內(nèi)網(wǎng)和DMZ區(qū)分別運行有多套VMware虛擬化平臺,同時內(nèi)網(wǎng)還部署有大數(shù)據(jù)應(yīng)用平臺、云桌面以及部分PC服務(wù)器等,以及即將新建的分布式平臺等,各平臺建設(shè)時間、應(yīng)用、技術(shù)等各不相同,需要多個具有不同專業(yè)知識的運維人員分別對其進(jìn)行維護(hù),運維復(fù)雜,工作量大,運維效率低,靈活性差。
2.2 基礎(chǔ)設(shè)施資源不能共享
由于各平臺之間資源不能進(jìn)行統(tǒng)一分配管理,從而造成基礎(chǔ)平臺之間的煙囪式孤島,各平臺建設(shè)之初因考慮未來應(yīng)用需要一般都會購買大于實際需要的硬件資源。而各平臺由于架構(gòu)不同、技術(shù)不同資源不能共享,即使相同架構(gòu)相同技術(shù)的平臺也無法共享,從而造成基礎(chǔ)設(shè)施資源的浪費。原來由于過多PC服務(wù)器造成的資源浪費而搭建虛擬化平臺,為實現(xiàn)大數(shù)據(jù)應(yīng)用而建設(shè)部署Hadoop分布式平臺,而隨著平臺的增多又不得不重新考慮多個平臺的資源浪費問題,閑置資源不僅會增加購買成本,也會相應(yīng)的增加運維、維護(hù)等成本。
2.3 成本高
數(shù)據(jù)中心每套平臺都是根據(jù)當(dāng)時的需要單獨采購并建設(shè)部署,在整個過程中會浪費較多的人力物力財力,無形中增加建設(shè)成本;由于需要增加較多的人力進(jìn)行運維,設(shè)備故障率也會增加,從而增加運維成本。由于平臺建設(shè)之初未進(jìn)行統(tǒng)一規(guī)劃,隨著不同技術(shù)新平臺的建設(shè),會進(jìn)一步加劇運維成本、運維復(fù)雜度以及資源的浪費。
2.4 性能不適用新的應(yīng)用
不同的平臺都是在適合當(dāng)時需求并綜合考慮的情況下建設(shè)部署的,隨著技術(shù)的不斷進(jìn)步和發(fā)展,現(xiàn)有技術(shù)平臺不足以支撐新的應(yīng)用需求,使用不同技術(shù)的平臺不斷建設(shè)和增多。如,虛擬化平臺無法支撐高I/O類型應(yīng)用,需要建設(shè)超融合平臺;為實現(xiàn)虛擬平臺的輕量化管理和應(yīng)用,需要使用容器技術(shù),從而需要建設(shè)多種技術(shù)不同、架構(gòu)不同的平臺。
2.5 新需求
新需求不僅包括降低成本、簡化運維、資源共享、滿足需求、提高效率等,還包括不同用戶不斷提出的新需求。數(shù)據(jù)中心管理人員需要數(shù)據(jù)中心具有高度的靈活性和適應(yīng)性,能夠根據(jù)需求變化做出快速響應(yīng)。業(yè)務(wù)系統(tǒng)用戶需要能夠根據(jù)需要申請資源和按需擴(kuò)容,提高業(yè)務(wù)的連續(xù)性。運維服務(wù)人員需要降價成本,進(jìn)行統(tǒng)一管理,簡化運維工作量并提高效率。
3 云管理平臺建設(shè)構(gòu)想
3.1 建設(shè)思路
為改善目前數(shù)據(jù)中心運維現(xiàn)狀,本文提出云管理平臺建設(shè)構(gòu)想。云管理平臺是對存在的多個平臺、PC機(jī)等進(jìn)行統(tǒng)一管理,實現(xiàn)統(tǒng)一運維,提高資源利用率。
(1)云管理平臺將所有基礎(chǔ)資源通過解禍重新組合后再按類劃分的方式,將基礎(chǔ)資源劃分為集中、分布式、PC服務(wù)器三部分,可實現(xiàn)將不同基礎(chǔ)資源在同種架構(gòu)的平臺之間進(jìn)行自由調(diào)配,提高資源利用率,實現(xiàn)資源的優(yōu)化利用。
(2)集中部分是將原來的多個集中存儲的虛擬平臺的存儲進(jìn)行重新組合,形成互為備份的兩套存儲,可實現(xiàn)雙活備份,以支持原來的多個虛擬平臺的使用。在不需要另外購買存儲的情況下解決了原來存在的只有單個存儲的虛擬平臺的備份問題,提高業(yè)務(wù)連續(xù)性。
(3)分布式部分將多個分布式平臺進(jìn)行整合,根據(jù)需要進(jìn)行靈活分配,實現(xiàn)不同的分布式應(yīng)用。
(4)將所有PC服務(wù)器進(jìn)行統(tǒng)一管理,PC服務(wù)器可在分布式平臺和單機(jī)之間根據(jù)需要進(jìn)行調(diào)配。
3.2 功能結(jié)構(gòu)
云管理平臺從下到上可分為基礎(chǔ)設(shè)施資源層、分布式云操作系統(tǒng)層、云服務(wù)層、應(yīng)用分類層、具體應(yīng)用層。
(1)基礎(chǔ)設(shè)施資源層包括數(shù)據(jù)中心計算、存儲、網(wǎng)絡(luò)設(shè)備等資源,將原來分散的虛擬平臺、大數(shù)據(jù)平臺、分布式平臺、PC服務(wù)器、網(wǎng)絡(luò)設(shè)備等進(jìn)行解耦整合再分配。
(2)分布式云操作系統(tǒng)包括云服務(wù)管理、任務(wù)調(diào)度、資源管理、虛擬化、存儲等功能,為云管理平臺提供基礎(chǔ)功能。
(3)云服務(wù)層提供負(fù)載均衡、虛擬主機(jī)、分布式和關(guān)系型數(shù)據(jù)庫、對象存儲、大數(shù)據(jù)計算等服務(wù),以滿足不同應(yīng)用需求。
(4)云管理平臺可分為集中式平臺、分布式平臺、PC服務(wù)器三種類型,按類型實現(xiàn)不同平臺應(yīng)用。
(5)具體應(yīng)用層可根據(jù)用戶需要實現(xiàn)VMware、云桌面等虛擬化平臺,以及大數(shù)據(jù)應(yīng)用平臺、分布式平臺、PC服務(wù)器等應(yīng)用。
同時云管理平臺對整個體系的軟硬件、應(yīng)用等提供安全防護(hù)、安全管理和運維管理功能,為數(shù)據(jù)中心各應(yīng)用系統(tǒng)的安全穩(wěn)定運行提供保障,提高健壯性。
(1)提供入侵檢測、漏洞掃描、補(bǔ)丁分發(fā)、病毒查殺、堡壘機(jī)等安全防護(hù),提高安全防護(hù)能力。
(2)具有網(wǎng)絡(luò)安全、主機(jī)安全、數(shù)據(jù)安全、應(yīng)用安全、日志安全審計等安全管理功能,提高安全保障水平。
(3)平臺運維管理功能包括統(tǒng)一運維、自動化運維、軟硬件監(jiān)控、自助服務(wù)門戶等功能。
3.3 特點
統(tǒng)一運維管理。對各平臺的運維管理統(tǒng)一集中到云管理平臺。對各平臺的管理實現(xiàn)單點登錄,通過堡壘機(jī)對操作進(jìn)行審計,減少需要維護(hù)多個賬號的風(fēng)險;實現(xiàn)自動化運維,簡化運維管理,實現(xiàn)底層的透明化,運維人員不需要掌握比較深的服務(wù)器、SAN、存儲、網(wǎng)絡(luò)、虛擬化等多種技術(shù),即可完成比較復(fù)雜的運維管理工作;減少運維人員數(shù)量,提高運維效率和運維水平。
運用容器的思想劃分不同的應(yīng)用區(qū)。云管理平臺可以將基礎(chǔ)資源進(jìn)行統(tǒng)一管理,根據(jù)容器的思想劃分不同的功能區(qū)以適應(yīng)不同技術(shù)平臺的應(yīng)用,各平臺之間互相獨立,互不影響。如果需要建設(shè)新的技術(shù)平臺,不需要單獨購買硬件設(shè)備,充分利用已有閑置資源可降低成本,并且可縮短項目建設(shè)周期。
提高基礎(chǔ)資源的利用率。利用碎片管理的思想實現(xiàn)基礎(chǔ)資源的有效管理和利用。云管理平臺可實現(xiàn)對虛擬平臺、云桌面、分布式數(shù)據(jù)平臺、容器、超融合、 PC服務(wù)器等的硬件資源的統(tǒng)一管理,基礎(chǔ)設(shè)施資源可以在不同的資源池中進(jìn)行在線自由調(diào)配,實現(xiàn)基礎(chǔ)資源的集中再分配。云管理平臺通過負(fù)載均衡按照實際需要為不同的平臺分配合適的資源,各平臺不需要在滿足當(dāng)前需求的基礎(chǔ)上增加多余資源;將原來存在的各平臺的閑置資源進(jìn)行碎片化管理,閑置資源可根據(jù)需要分配給其他應(yīng)用,實現(xiàn)資源的有效利用,提高基礎(chǔ)資源利用效率。
減少故障發(fā)生次數(shù)。由于基礎(chǔ)資源的有效利用,可在滿足現(xiàn)有應(yīng)用的情況下使用較少的硬件設(shè)備,設(shè)備減少帶來的直接影響就是故障次數(shù)的直接減少,從而間接減少運維工作量和成本。
降低成本。對現(xiàn)有各平臺閑置資源進(jìn)行統(tǒng)計發(fā)現(xiàn)各平臺閑置資源甚至有二分之一,閑置資源完全可滿足超融合平臺的使用(可滿足我單位需要)。云管理平臺將閑置資源進(jìn)行集中再分配,可減少設(shè)置購買費用,大大降低硬件購買成本,同時由于設(shè)備的減少可相應(yīng)的減少運維工作量,維護(hù)成本等,可有效降低整體運維成本。
統(tǒng)一監(jiān)控。云管理平臺實現(xiàn)對各平臺的統(tǒng)一監(jiān)控,包括硬件、操作系統(tǒng)、應(yīng)用、網(wǎng)絡(luò),在平臺性能不足時通過負(fù)載均衡實現(xiàn)自由配,提高運維監(jiān)控的效率,避免對多個平臺以及軟硬件分別進(jìn)行監(jiān)控造成不能及時發(fā)現(xiàn)問題的情況。
適應(yīng)新需求。云管理平臺可對集中式、分布式、PC服務(wù)器等進(jìn)行統(tǒng)一管理,實現(xiàn)數(shù)據(jù)中心、運維、應(yīng)用等的統(tǒng)一管理,有效簡化數(shù)據(jù)管理人員、運維人員、應(yīng)用人員的工作,提高工作效率。如果有新的應(yīng)用,可在現(xiàn)有平臺上將閑置資源進(jìn)行劃分,或根據(jù)應(yīng)用需要按需擴(kuò)展對應(yīng)類型平臺性能,以滿足集中、分布式多種應(yīng)用平臺和需求。
4 結(jié)束語
本文針對目前省級數(shù)據(jù)中心存在的問題,結(jié)合實際提出了云管理平臺建設(shè)構(gòu)想,可有效提高運維管理水平、提高資源利用率,降低成本,可實現(xiàn)集中式和分布式共存的雙核結(jié)構(gòu),隨著技術(shù)的發(fā)展可逐步淘汰不適用平臺,并逐步擴(kuò)大主流架構(gòu)占比。
參考文獻(xiàn)
[1]希賽教育軟考學(xué)院.系統(tǒng)架構(gòu)設(shè)計師教程[M].北京:電子工業(yè)出版社,2013.