虛擬化顯然是當(dāng)前服務(wù)器,企業(yè)存儲等領(lǐng)域最熱門的話題,特別是隨著IA服務(wù)器系統(tǒng)性能的日益強(qiáng)健,各種企業(yè)、數(shù)據(jù)中心都爭相開始在這方面進(jìn)行嘗試。這里,來自NetAppKilo-Client實(shí)驗(yàn)室的一些實(shí)踐經(jīng)驗(yàn),或許對大家有所幫助。
Kilo-Client測試實(shí)驗(yàn)室的設(shè)計(jì)初衷就是為了能夠針對大型網(wǎng)格或服務(wù)器群產(chǎn)品進(jìn)行測試,并快速重現(xiàn)企業(yè)用戶在這種環(huán)境中可能遇到的問題。它最初包括了通過iSCSI啟動的1120個(gè)服務(wù)器刀片。后來該實(shí)驗(yàn)室又添加了98個(gè)帶iSCSIHBA的刀片和280個(gè)能夠通過光纖通道啟動的刀片,最終形成了1500個(gè)節(jié)點(diǎn)的服務(wù)器群。
這里有幾個(gè)Kilo-Client測試實(shí)驗(yàn)室設(shè)計(jì)當(dāng)中,客戶和合作伙伴最感興趣的熱點(diǎn)問題,非常值得我們關(guān)注。
1 快速配置服務(wù)器
快速配置意味著必須能夠通過任意操作系統(tǒng)/應(yīng)用程序環(huán)境快速啟動服務(wù)器。我們這里使用NetApp FlexClone技術(shù)快速創(chuàng)建系統(tǒng)映像,而無需對這些映像進(jìn)行完全的物理拷貝。
我們?yōu)榉?wù)器群中所需的每個(gè)操作系統(tǒng)和應(yīng)用程序堆棧創(chuàng)建一套“黃金”啟動映像(如iSCSI、光纖通道SANLUN)。使用SnapMirror和FlexClone,并快速復(fù)制出數(shù)百個(gè)克隆(每臺配置用于測試的服務(wù)器一個(gè)FlexClone克隆)。然后將特定于主機(jī)的“個(gè)性化”添加到每個(gè)受配置服務(wù)器的核心映像,從而使我們在數(shù)分鐘內(nèi)即可配置并啟動全部或部分刀片。
2 虛擬環(huán)境
接下來,我們還需要進(jìn)一步快速配置完整的虛擬環(huán)境,其中包括計(jì)算網(wǎng)格、互連Fabric及存儲網(wǎng)格。
我們可以自動配置幾乎可運(yùn)行所有操作系統(tǒng)(包括VMware)的計(jì)算網(wǎng)格,并通過vLAN(IP)、vSAN(光纖通道),NFS,甚至通過CIFs(我們無法通過CIFS啟動,但可以測試CIFS功能)將其連接至五個(gè)可能的存儲網(wǎng)格中的任意一個(gè)。典型的虛擬環(huán)境(可能包括100個(gè)服務(wù)器、多個(gè)操作系統(tǒng)及5-6個(gè)存儲控制器)通常在一個(gè)小時(shí)或更短時(shí)間內(nèi)就可啟動運(yùn)行。我們創(chuàng)建過的最復(fù)雜的環(huán)境花了近10個(gè)小時(shí)才啟動運(yùn)行,它包括500個(gè)服務(wù)器、30個(gè)NetApp FAS 6070、72個(gè)300GB FC驅(qū)動器托架(約500TB)及DataONTAPGX操作系統(tǒng)。
無論何時(shí),該實(shí)驗(yàn)室都在運(yùn)行著12~15個(gè)虛擬環(huán)境,用于從產(chǎn)品和互操作性測試、故障診斷到概念驗(yàn)證測試的一切任務(wù)。管理員可以通過中斷服務(wù)器并高效地創(chuàng)建該系統(tǒng)的空間派生克隆(使用FlexClone)來預(yù)先進(jìn)行測試。甚至在其它系統(tǒng)上(雖然具有同樣的體系結(jié)構(gòu))。也可以保存或與其他用戶共享任何環(huán)境的測試配置,并在數(shù)月或數(shù)年后重新運(yùn)行。而且一旦構(gòu)建環(huán)境之后,也不再需要重新構(gòu)建,非常省事兒。比如說。我們構(gòu)建了RedHat Linux環(huán)境并且依據(jù)要求在該環(huán)境下加Oracle 10g。測試完畢后,用戶可以創(chuàng)建克隆。并且將來必要時(shí)可重新使用該預(yù)配置環(huán)境。
還有一點(diǎn)值得0強(qiáng)調(diào)的是,用戶可以在世界各地訪問和管理這些虛擬環(huán)境。在NetApp全球六個(gè)公司就職的工程師或全球任何位置的NetApp系統(tǒng)工程師都可以遠(yuǎn)程規(guī)劃資源并運(yùn)行相關(guān)測試。
最初的Kilo-Cllent設(shè)計(jì)允許我們使用硬件啟動端(iSCSI HBA)通過iSCSI來啟動服務(wù)器刀片。現(xiàn)在我們可使用以下四種方法中的任意一種來啟動服務(wù)器:
★使用硬件啟動端(1,218個(gè)刀片)通過iSCSI來啟動
★使用軟件啟動端(整個(gè)環(huán)境)通過iSCSI來啟動
★使用FCHBA(280個(gè)刀片)通過光纖通道來啟動
★通過NFS(整個(gè)環(huán)境)來啟動
這樣我們就可以測試并比較各種環(huán)境和啟動方{去。如果我們并非專門測試啟動方法,則可根據(jù)測試要求來定制方法。比如,如果有人想通過故障注入來執(zhí)行光纖通道測試。我們一般會通過iSCSI或NFS來啟動正用于進(jìn)行其它測試的服務(wù)器,從而閑置光纖通道以便進(jìn)行測試。
3 通過10GBE實(shí)現(xiàn)iSCSI
不久以前。Kilo-Client又通過IBMBlade Center制作了一個(gè)測試套件,連接NetApp集群的NetXen控制器也配備了10千兆位以太網(wǎng)卡。并采用端到端10千兆位以太網(wǎng)的配置,可使用iSCSI進(jìn)行無盤啟動。到目前為止,大部分功能測試已完成,該體系結(jié)構(gòu)讓我們能夠?qū)?0千兆位以太網(wǎng)與光纖通道以及希望測試的其它產(chǎn)品進(jìn)行大范圍的性能比較。
4 自動化配置管理
創(chuàng)建Kilo-Client時(shí),有一些腳本可用來幫助處理配置及相關(guān)事項(xiàng)。由于可以隨意使用,這也是薄弱的環(huán)節(jié)。而新的工作程序則要求遵循可預(yù)測模式,這包括規(guī)劃,配置、監(jiān)控、根據(jù)負(fù)載調(diào)節(jié)資源、撤消配置、重新規(guī)劃等等。
這里有一個(gè)自動化框架,可以處理所有這些任務(wù)的大約70%,這是一個(gè)很大的進(jìn)步。受困于可擴(kuò)展性問題的客戶對這種管理方法很感興趣,因?yàn)樗w現(xiàn)了數(shù)量極為有限的員工可以如何有效地管理動態(tài)、高容量,高要求的環(huán)境。
5 簡化配置
在Gartner的一名分析人員指出Kilo-Client是現(xiàn)實(shí)中的一個(gè)規(guī)模最大、最好的簡化配置實(shí)例之前,我實(shí)際上從未將“簡化配置”這個(gè)術(shù)語與Kilo-Client關(guān)聯(lián)起來。他說得對,我們的實(shí)驗(yàn)室極具空間效益,可提供1500倍以上的容量效率,因?yàn)榭寺∮诚?LUN)僅占用啟動映像更改所需的額外磁盤空間。
比如,我們想使用Red Hat Linux啟動所有1498個(gè)服務(wù)器。我們的測試實(shí)驗(yàn)室需要的存儲總量是7.63TB(假定七個(gè)啟動存儲系統(tǒng)每個(gè)需要20GB,每個(gè)刀片需要5GB)。在傳統(tǒng)的服務(wù)器群(甚至采用傳統(tǒng)的無盤啟動)中,每個(gè)服務(wù)器足足需要20GB,這樣我們的存儲總量就需要30TB。天啊!正如我前面所說,配置和管理集群所花的時(shí)間比運(yùn)行測試的時(shí)間還要多。
6 針對緊密配置的冷卻設(shè)計(jì)
人們經(jīng)常問一個(gè)問題,“究竟有什么辦法來冷卻這個(gè)龐然大物?”。而在這里,簡化配置實(shí)際上己令它需要冷卻的熱量遠(yuǎn)不及傳統(tǒng)環(huán)境中的熱量。
固然,將1500個(gè)刀片、7102個(gè)Fabric端口和87個(gè)存儲控制器集中到一個(gè)區(qū)域,設(shè)備確實(shí)是非常密集。在傳統(tǒng)的數(shù)據(jù)中心,大都采用熱通道/冷通道方法。在設(shè)備的前面(吸入空氣的地方)添加了額外的冷卻設(shè)備,從而制作了一個(gè)冷通道。這使得由前至后形成了30度角。
新的實(shí)驗(yàn)室采取了一種不同的方法——建立了一個(gè)制冷室。采用全新的地板到天花板式機(jī)柜,并確保由前至后的所有縫隙都已完全密封,從而形成一個(gè)空調(diào)系統(tǒng)。設(shè)備前面的冷氣只能在設(shè)備內(nèi)流動,并且也決不會與設(shè)備后面散出的熱氣混合在一起。冷空氣一側(cè)的氣壓也要稍高一些,以確保氣流僅往一個(gè)方向流動。使用此方法,在實(shí)驗(yàn)室中實(shí)現(xiàn)了約8kW的冷卻效果,而先前的設(shè)計(jì)只能達(dá)到4kW。
以上這些在服務(wù)器虛擬化方面應(yīng)用的具體經(jīng)驗(yàn),可能是很多企業(yè)在改造自己的數(shù)據(jù)中心或企業(yè)服務(wù)器平臺時(shí)都會遇到的問題。大家一起分享這些實(shí)際經(jīng)驗(yàn),相信會對今后服務(wù)器虛擬化改造的進(jìn)程帶來幫助。