資源整合打造高效數據中心
“2011戴爾高效數據中心論壇”在北郵舉行
1月7日,“2011戴爾高效數據中心論壇”在北京郵電大學舉行。這次論壇由戴爾公司主辦,中國教育網絡雜志承辦。來自北京各大高校信息化部門的領導、技術骨干以及戴爾公司的代表齊聚一堂,以報告演講和圓桌自由討論的方式共同分享了建設高效數據中心以及云架構的工作經驗,同時對數據中心的服務器、虛擬化技術、存儲技術以及未來數據中心所要面臨的挑戰進行充分討論。
對于如何打造高效靈活的數據中心,清華大學計算機與信息管理中心運營服務室主任戚麗提出整合思路——應用整合、軟件環境整合、數據庫整合和運行環境整合。
在應用整合方面,以權限、用戶、數據整合作為基礎,在此基礎上,對開發技術進行統一,應用程序要對負載均衡模式進行支持。
在軟件環境整合方面,Web服務器及應用服務器軟件的版本要統一到幾個版本,而且對應用的命名以及每個應用具體到用戶的ID號進行統一,這樣能夠為后續自由、快速地調配資源,以及應用管理配置打下基礎。
在數據庫整合方面,對外應該提供多種數據庫環境,比如Oracle數據庫、MySQL、SQLServer,以滿足來自校級、院系等用戶的服務需求,另外,還統一進行數據備份。這些措施的最大好處是節省管理成本。
在運行環境整合方面,采用虛擬機技術、虛擬主機技術、負載均衡技術和集中存儲。目前,大部分X86服務器的利用率都在20%以下,有的甚至不到5%。引入虛擬化技術以后,高校可以將多個網站、多個信息系統配置在一臺或者一組服務器上對外提供服務,從而降低服務器的數量。虛擬化的管理也是非常方便的。
戚麗介紹到,清華大學于2010年逐漸將一些應用切換到虛擬化平臺上。整個系統的遷移和部署,大概半個小時就可以完成,效果不錯。
在資源整合的所有途徑中,虛擬化技術熠熠生輝,早已成為數據中心的“寵兒”,在高校得到廣泛的應用。
建立數據中心3大建議

1.采用80/20原則,即在機房所有服務器里選擇20%的服務器安裝虛擬化軟件,因為不是所有的軟件都適合在虛擬機上運行。
2.服務器根據性能分成3~4級,并采用動態基礎架構管理,實現負載和資源之間的動態分配,提高數據中心的效率。
3.建立SAN的存儲,既可以存儲軟件系統的數據,又有利于建立容災備份。
在虛擬化技術大顯身手之時,一朵“云”正迅速飄入人們的視線,這就是云計算。戴爾公共事業部中國教育行業總監陳偉表示,云計算實際上是基于虛擬化的技術,通過創建虛擬機,根據用戶的需求將這些虛擬機分配給對應的用戶。
相關專家也表示,云計算最直接的意義就是降低數據中心的建設、運行和管理成本,提高數據中心的容災能力,在虛擬化的支持下實現節能;從長遠來說,在云計算非常成熟的時候,可以改變數據中心的建設、運行模式,從建設變成租用。
具體來說,云計算技術可以動態地將用戶的服務器資源、存儲資源等連接起來,由用戶提交需求,云計算平臺自動地分配資源,并在用戶使用完畢后自動收回資源,從而可以繼續提供給其他用戶使用。
云計算的技術優勢非常適合解決學校對服務器資源等的需求。當用戶要運行一種應用軟件時,有可能需要購買新服務器,這樣就很容易導致設備的浪費。如果有了云平臺,用戶就可以在基礎云架構里獲取具有計算力的虛擬服務器資源,而無需投入資金購買新服務器,而且虛擬機的創建和分配相對于物理服務器來說更為簡單。戴爾認為,這是一種創新的IT基礎架構管理方法和創新的校園信息化模式,系統可以動態地分配資源,無縫地支持資源擴展和納入,系統的自動化和高效性滿足了用戶對IT基礎資源的需求。

我們通過云計算可以與數據中心無縫連接,為用戶提供一整套完整的管理和資源調配體系,按需分配資源。——戴爾公共事業部中國教育行業總監陳偉

云計算的規劃關鍵還是需要引入新的業務類型,與學校現有設施充分融合,實現業務的調度、業務遷移、資源的負載均分等。——北京郵電大學教授馬嚴
為了幫助高校建立一個高效的數據中心,同時將虛擬化環境升級成為云計算環境。戴爾提出了一個新的技術框架——虛擬集成系統架構(VIS),它支持在一個通用資源池內使用通用工具來管理服務器、存儲和網絡資產,為用戶提供一個標準工作負載配置目錄,該目錄基于預定義的用戶簡檔,支持按需選擇資源。架構分為三個部分:第一部分負責高效管理底層資源,包括服務器、存儲和網絡;第二部分是提供網頁式的門戶給所有的用戶,讓用戶通過這個接口提交資源申請,后臺會根據已經獲準的申請而創建虛擬機,并提供給用戶使用。第三部分是監控整個虛擬化環境以及云計算平臺的資源的使用情況。
最近,有學校正在與戴爾公司合作準備搭建校園的“云計算平臺”,在學校現有的基礎設施基礎上,進行校園信息化業務的部署和測試。戴爾針對學校中存在的網管員頭疼的問題、重復性建設、交叉職能管理,以及單點登錄等問題,利用云計算平臺,建立虛擬存儲、校園信息化服務公共平臺,實現部門之間的信息互通、業務統籌規劃部署。北京郵電大學教授馬嚴說:“云計算的規劃關鍵還是需要引入新的業務類型,與學校現有設施充分融合,實現業務的調度、業務遷移、資源的負載均分等。”
未來,數據中心該如何更好地發展?馬嚴表示,在建設數據中心時,人們既要考慮到先進性,又要考慮成熟穩定性。成熟穩定性是指服務。人們在提供服務時是要承擔責任的。因此,要對內部服務和公共服務分級,分清楚哪些是關鍵性業務,哪些是一般業務。考慮是否采用新技術時,首要考慮的是它是否可以保證關鍵性業務不出差錯。因此,學校不需要著急跟隨輿論去引進新技術,而要根據自己的人力、技術、管理的實際情況,以及學校的信息化發展步驟,有序進行。
毫無疑問,未來的數據中心應該具備綠色、柔性、分布式的特點,以滿足學校的需求,以建設穩定的運行環境作為重點,在異地建立數據容災中心,從而讓數據中心可以更靈活、更從容、更高效地為全校師生提供更好的服務。
數據中心面對3大挑戰
作為高校信息化戰略發展的基礎設施,在“十二五”期間,承載各種校園重要業務的數據中心將要如何發展,是高校信息化部門非常關注的問題。
隨著海量數據的激增,多元化業務的拓展,數據中心已經進入快速發展時期,許多挑戰接踵而至。
1來自基礎環境的挑戰
為了滿足變化多端并不斷增加的業務需求,數據中心不得不購買更多的服務器、存儲等設備來應對。設備的增加,必然導致能耗的急劇上升,散發出來的熱量需要機房有足夠的能力來制冷。機房的供電能力,又是設備正常運轉的前提條件之一,而很多老機房的配電系統已經跟不上新需求。另外,為了存放更多的設備,機房空間需要擴展,而很多高校的機房正在醞釀或者已經進行機房的擴建。
2來自建設速度的挑戰
隨著信息化建設速度的加快,各種應用系統的建設速度也隨之加快,這給數據中心帶來較大的運維壓力。而設備的運行利用率一直存在貧富不均的現象,主要表現在兩個方面:1.不同設備之間的不均衡,有的設備非常繁忙,有的設備則經常空閑;2.同一設備在不同階段的利用率也不均衡,比如,選課系統在選課期間必然是運行最繁忙的時期。
3來自管理的挑戰
業務系統的不斷更新或增加,使得人員配備總是滯后。而要對校園網絡進行穩定、高效、安全的管理,就必須提高運維服務質量。人員緊張與校園網對高質量的運維服務的需求形成矛盾。
北京郵電大學教授馬嚴認為,數據中心運行效率的高低,包括設備利用率的提高,能耗的節約,運維保障的可靠、穩定等,對于校園網的管理運作的提升和各種資源的整合共享,有著重大的意義。作為IP技術與IT技術兩大領域的結合體,數據中心不僅需要從網絡的角度出發來保障用戶和業務,也要從用戶和業務的角度出發來優化網絡。這意味著對數據中心的管理需要采用全新的管理模型和靈活的功能架構,同時要充分考慮基礎設施、技術趨勢、業務運行、運維服務等各種管理要素,在此基礎上建立一個靈活、高效、可擴展性強的數據中心平臺。

中央民族大學自從2006年完成數字校園建設之后,就開始朝著如何擴大應用的方向展開工作。由于學校比較注重學科建設,作為公共服務體系,我們盡量圍繞學科建設,尤其是“985”課題,提供技術支持,進行網絡平臺建設、資源共享、構建學校大型數據庫等工作。
具體工作如下:
1.學校建立了一個網絡電視臺(ITTV)。
ITTV可以實現電視直播。師生通過計算機可以直接收看電視節目。ITTV的節目主要有中央電視臺、港臺節目以及比較有特色的少數民族語言節目,這些節目受到師生的普遍歡迎。ITTV還提供學術活動、校內新聞、網絡課程等,支持師生的學習和科研活動。另外,我們還購買了8種外語電視臺比如BBC、CNN的播放權。
2.無線網絡覆蓋整個校區。
現在,無論是在室內,還是在室外,師生都可無線上網。
3.在無線網絡的基礎上,我們開始進行“移動數字校園”的建設工作。
“移動數字校園”是基于Wi-Fi的方式,采用手機上網,實現移動教務管理、移動圖書館、移動OA、移動信息門戶以及信息推送、手機支付、IPTV等。我們計劃在IPTV開通之后,推出一個IPv6版本,使得用戶用手機就可以直接觀看電視。“移動數字校園”與傳統數字校園的主要區別之一就是向用戶主動推送信息。
4.正在積極推進IPv6的升級項目。
今后,我們還會圍繞資源共享進行更多的工作。學校已經積累了很多資源,這些資源主要來自數字圖書館、教學資源庫、院系自己建立的數據庫以及以前購買的很多重要的數據庫。當用戶需要查找這些資源時,只需要知道資源在哪個服務器上,并下載即可——這是一個較為理想的共享方式,也是易于為用戶所接受的。它是我們接下來解決資源共享問題的一個基本思路。而網格將是解決資源共享的技術手段。
在“十二五”期間中,網絡平臺的建設是我校信息化發展的重點,同時,我們將對云計算進行一些嘗試,包括服務器的分配和共享等。

從2008年開始,首都經貿大學對信息化的建設工作非常重視,專門成立了一個機構——教育技術中心。此機構全面負責學校的信息化建設,包括服務工作。
當時,學校的網絡基礎平臺建設像棚戶區一樣,沒有進行系統的規劃和管理。針對這些問題,我們對數據中心進行了以下工作:
1.加強基礎設施的建設,尤其是建立一個技術標準比較高的機房。機房可以容納100臺標準機位,引進較為先進的監控系統、制冷能力較強的空調等設備,這些設備確實給網絡運行環境帶來良好的支撐平臺。
2.利用有利時機集中力量建好管控資源,這是因為校內的管控資源有限,但是很多部門都在使用,所以,這兩年我們將所有的光纜都預鋪給這種資源。
3.整合學校信息化資源,主要包括:(1)建設信息化的標準;(2)建設統一身份認證、校園門戶、辦公系統、數據交換、即利用交換式系統形成一個中心數據庫。原先,各個部門之間存在信息誤導、相互不連通,數據標準不統一的現象,自從建完這幾個項目以后,一盤散沙的狀況得到初步的緩解。
4.抓好機房管理。機房建好之后,就要有意識地做好機房管理工作,這樣才能保持機房穩定、高效地運轉。當初,我們在搬遷機房時,電纜由于沒有進行任何標識,最后變成一團亂麻,阻礙當時工作的進展。在新的數據中心建立起來之后,我們對一切設備都進行規范管理。另外,我們還有一套技術規范,包括機器如何上架、機房怎樣更合理地布局等。
5.為了保障機房的物理安全和數據安全,學校在兩個校區建立了異地建立容災系統。
現在機房主要為全校各個部門提供兩類服務:
1.服務器托管。各個部門自己購買了服務器,甚至有些部門還有自己的機房,為了幫助他們管理服務器,數據中心提供服務器托管服務。
2.我們采用虛擬主機的技術,并建立了一套流程化的管理體系。
文/本刊評論部
過去,我們關注服務器管理和服務器虛擬化,今天,我們更多的是談論云。云,是一種運營模式,而不是具體指某一種實現技術。很多方案都包含云的理念,和云沾邊,是云概念的具體實現。
云強調的是資源能以更方便和快捷的方式提供給最終使用者。在提供資源的過程中會涉及資源的申請、審批、資源的分配和回收等。盡管我們都覺得云是未來的發展方向,但要建立符合自己需要的云不是一蹴而就的事情。為此,業界一些廠商,例如戴爾,提出另一個概念:動態基礎架構。不管我們是否建立數據中心的云平臺,動態基礎架構都可以用來進行數據中心的優化工作。
動態基礎架構能將數據中心的硬件資源和軟件系統進行分離,分別進行管理。硬件資源不再是一次性固定分配給某個軟件系統,而是根據軟件系統的負載情況,進行動態分配。

靜態架構無法適應業務猛增
對于傳統的數據中心來說,硬件資源(例如服務器)和軟件系統(例如操作系統和應用軟件)是在被采購回來以后,初次部署時形成匹配關系的。一旦部署完成,在未來的3~5年內,這種匹配關系就固定下來。只有在硬件資源出現故障或者需要進行淘汰升級時,才會把軟件系統遷移到新的硬件資源上運行。這種長期穩定的匹配關系所構成的基礎架構被認為是一種靜態架構。
靜態架構是過去二十年里數據中心的一種主流模式。它的優點是簡單,符合我們的常規管理習慣。硬件資源和軟件系統的靜態固定式匹配,使得管理員在后期的運維中可以節省大量的管理工作。它的缺點是硬件資源的使用效率低下,并常常伴隨著軟件系統的性能問題:在軟件系統負載小的時候,硬件資源無法充分利用,造成資源浪費;在軟件系統負載大的時候,已分配的硬件資源無法支撐壓力,造成性能瓶頸;當軟件負載的變化為漸進式時,可以選擇一個時間點,進行系統遷移。采用具有更高計算能力的硬件資源來替代原有資源,從而實現軟件系統負載增加的業務需要。用具有更低計算能力的硬件資源來替代原有資源,從而在軟件系統負載減小時節約硬件資源,提高效率。
如果軟件系統的負載變化是周期性的或者比較頻繁,靜態基礎架構就顯得力不從心。如果管理員通過手動將軟件系統在不同硬件資源上進行頻繁遷移,那么就非常耗費時間。因為這種遷移包含操作系統重新部署,應用軟件重新配置,以及數據的復制或移動。靜態基礎架構無法適應業務的動態變化,這就是動態基礎架構出現的原因。如果和網絡領域里面的技術做一個類比,數據中心的靜態基礎架構就像網絡里面的靜態路由,而動態基礎架構就像動態路由。靜態路由簡單、易于理解卻不靈活,動態路由設計更復雜、更能自動根據網絡的變化收斂。靜態架構適合小規模數據中心,而動態基礎架構適合較大規模的數據中心。
動態架構重定向硬件資源分配
動態基礎架構通常需要一個集中存儲架構(SAN)做基礎。所有服務器上需要運行的軟件系統全部保存在SAN存儲中。這里的軟件系統,不僅僅包含應用軟件,還包含操作系統。我們通常把包含操作系統和應用軟件的整個數據叫映像系統。
所有的服務器都從網絡啟動,而不再從本地硬盤啟動。當服務器從網絡啟動時,需要使用動態基礎架構里的管理軟件來管理這些服務器的啟動過程,最終讓這些服務器從后端集中存儲上選擇對應的映像系統來運行。這就實現了硬件資源和軟件系統之間的動態映射,即動態分配關系。
服務器可以被管理軟件統一管理起來,作為一個或者多個資源池。每一個軟件系統對應一個資源池或者多個資源池。當它對應于一個資源池時,軟件系統可以在該資源池內部的任意一臺空閑服務器上運行。任何一臺服務器出現故障,軟件系統都可以自動切換到同一個資源池內部的另外一臺空閑服務器上進行運行。當軟件系統對應于多個資源池時,軟件系統可以在不同的資源池的服務器之間進行重定向運行。
在動態基礎架構下,所有的軟件系統(也可以說是映像系統)都存儲在后端SAN存儲之上,它們在不同服務器上的切換行為,并不是數據遷移,而只是系統的重定向運行,所以速度很快。
動態基礎架構的概念在具體實現時,業界一些廠商增加了更多的高級功能,比如戴爾讓軟件系統在物理服務器和虛擬服務器之間實現切換,以及生成圖形拓撲結構圖和進行圖形化系統配置等。
圓桌討論

既然云計算將各種資源整合在一起,那么在整合的過程中必然會出現一些問題;而且,云架構體系中的某個部分產生單一故障時,復雜的技術對運維服務的質量要求也比較高,這些都涉及相應的運維人員的配備和技術支持的問題,因此我們對引進云計算是有顧慮的,請問在座的老師和戴爾公司的代表對此有什么看法?是否還有其他比較好的技術?戚麗:云計算目前離我們還有點遠。清華大學目前主要采用的還是虛擬主機、虛擬機技術。用戶將應用放在虛擬機平臺上,由我們負責提供資源。我們還對應用系統的級別進行劃分,這主要是為了安全起見。一旦入侵,可能會影響一組服務器里的應用系統,因此,我們將相同級別的系統放在一起。
當然,新技術是可以嘗試的,但是我們不一定要做第一個“吃螃蟹”的人。
徐海:前幾年,虛擬化技術對于當時的人來說太“虛”了,但是,后來人們都接受它了。很多高校都在虛擬化平臺運行關鍵性業務。從虛擬化技術的例子可以看出,技術是會逐漸成熟和被人們所接受的。云計算同樣如此。隨著“十二五”規劃制定出來之后,相信會有很多高校愿意去嘗試建立云,總有人會“吃螃蟹”的。而云計算會在未來幾年內成熟起來。前期,將所有計算數據和計算業務遷移到云平臺上,這對于廠商和用戶來說,都是極大地挑戰。但是,一旦成功,后期的維護和管理將非常簡單。
我們建議數據中心將服務器分成3~4個性能檔次。以高、中、低三個檔次為例。戴爾的動態基礎架構一開始將軟件系統遷移到低檔服務器上,如果服務器的壓力增加,則將軟件系統遷移到中檔服務器上運行,如果發現壓力回落,則將軟件系統重新遷移到低檔服務器上,否則,就遷移到高檔服務器上,以此類推,這就是動態基礎架構管理與服務器分級相結合的原理。高校可以以此來提高數據中心的運行效率。

請問戴爾的系統的部署需要多長時間?
徐海:在一些實踐案例中,我們發現單純部署一個新系統是比較簡單的,但是如果用戶已經有一個可以繼續使用的舊系統,這就需要新系統來整合,其復雜性遠遠高于前者。實際上,搭建戴爾的新系統并不會耗費很長時間,但是前期咨詢、前期分析等行為需要一段時間來操作。而在系統搭建好后,無論是虛擬機,還是物理機,都能迅速就位,提供相應的服務。
戴爾在美國教育行業有不少成功案例,例如幫助Clemson大學部署了動態基礎架構和云計算解決方案,整合全校的計算資源。