俞松葉
(浙江閏土股份有限公司,浙江紹興,312300)
隨著近十幾年來中國計算機和互聯網技術的飛速發展,電子信息的大規模建設引起了人們對計算機機房和計算機機房的能耗的光柱越來越多。2009年,中國首次頒布了“電子信息系統計算機房環境監測標準”,對未來中國計算機房的建設和改造具有現實意義。結合“十二五”規劃綱要和近期實際情況明確提出的“綠色發展,建設資源節約型,環境友好型社會”,特別是全國大部分地區的霾天氣??倳浱岢隽艘环輬蟾骊P于節能減排,是全國人民切身的問題,要落到實處。這些都說明節能降耗已引起黨和國家領導人的關注,也促使有關從業人員更加重視能源消費。作為一名科技人員,如果能夠在機房這樣一個小面積內實現節能降耗的實際效果,在相關行業中推廣它將是一件非常重要的事情。因此,未來機房服務器的發展方向更傾向于節能減排的方向,這方面的研究是一件非常有意義的事情。因此,將來的機房服務器的發展方向更多傾向于節能化方向進行。
能源分析數據中心在機房內每時每刻都有大量的數據處理任務。 所有類型的IT設備和空調冷卻系統都需要24小時的不間斷電源。 因此,與其他建筑物相比,數據中心消耗大量的電力。數字中心越大自然消耗的電量也越巨大,然而數據中心的能源消耗主要來自設備,包括照明系統,空調系統,供電和配電系統。它主要由兩部分組成,一部分是計算機設備和網絡設備使用電力,約占機房總電力消耗的43%。 這部分設備的功耗是必要的;另一部分是機房的環境動力,約占機房總動力消耗的57%。 下圖顯示了一個具有中等處理中心的每個系統房間的功耗。

圖1 機房設備耗能分布表
上圖中能耗分布的主要原因是計算機房采用全封閉管理,計算設備連續運行8760小時。 機房的熱量問題必須通過機房空調的制冷來解決。 機房內設備的功率越來越高,機柜內發電設備的發熱量也在增加,機房的制冷能耗也大大增加。機房有空調機組的應用設計,通常采用傳統的預冷環境和再冷卻設備。
為了應對企業和機構數據中心快速增長的需求,計算中心配備了數據中心服務器重點主要集中在以下幾個方面。由于基礎設施具有快速擴張能力,互聯網業務模式的發展將突飛猛進。當業務需求急劇增長時,基礎架構可以快速擴展以提供相應的服務。于是將部署在遠程數據中心的大量中央服務器設備具有出色的遠程操作和維護功能,可以適當簡化當地不必要的本地管理成本。在經濟效益方面,可以減少相應的服務器和數據管理以及運維。從成本方面來考慮,也可以使相關部門單位減少費用,占據有利的競爭優勢。其中一些服務器具有非常強大的計算性能和大量內核。但是,利用率總是低于傳統服務器利用率低。究其根本的原因是由于一些服務器沒有太多的工作量,這涉及有效的投資和對服務性能的相應理解。您可以改變計算中心的一個單元和一個相應的服務器的方式,以虛擬主機的形式解決。其中某些服務器工作負載過高,導致主機設備I / O堵塞和利用率較低??梢钥闯?,理解應用程序本身的類型和正確配置服務器是解決系統瓶頸和提高服務器利用率的重要因素。傳統上,通過負載均衡,使用服務器的實時監控來平衡工作負載與手動或負載平衡算法。這是因為實現相對簡單,但需要時間和精力,并且始終進行調整。應用機房虛擬化的服務器完美的解決這方面的問題。
用戶服務器,節點代理,資源管理和作業調度,這四個部分通常構成基本的HPC集群作業管理系統。其中,用戶服務器具體處理并接收相關用戶提交的作業,計算每個用戶提交的作業的節點資源需求,并將這些信息提供給作業調度管理系統,最終返回用戶的操作;節點代理負責接收,并且根據節點本身的情況,執行,掛起或喚醒提交作業的用戶在更改節點上,并將節點的工作狀態和狀態報告給集群管理系統。高性能計算集群的作業是用戶操作在計算集群上正常高效運行的最重要載體和媒介。對于作業管理調度,它不僅是滿足用戶作業執行的各種性能要求的重要任務,也是高性能計算集群的核心之一。當普通電腦上的某些事情幾乎不成問題時,當用戶將作業提交給幾乎未知的大規模分布式并行計算集群時,由于計算環境的復雜性,可能會遇到不可預知的問題。例如,計算節點專供用戶使用,有多少內存可用來更改作業數量的分布,以及這些簡單的獨立電腦環境幾乎真正的問題。但是當用戶提交作業到高性能計算機集群,我們需要管理作業調度平臺發揮自己的優勢,并分配計算資源以匹配每個節點中相應的作業動態地改變復雜的環境。同時,作業調度管理平臺需要保持運行的作業不因相互資源競爭和導致機器人而干擾系統性能,從而影響整個計算集群的效率并維持計算集群的負載平衡以便獲得更好的系統吞吐性能。最大限度地提高計算集群的資源利用率和吞吐量是工作管理系統的重要措施。在確保資源利用率和吞吐量的同時,還需要將群集中作業的平均等待時間縮短到允許的范圍內。高性能計算集群的性能可以從以下兩個指標來判斷:從用戶的角度來看,由于用戶通常關心他或她的作業是否及時執行,所以用戶通常關注作業的響應時間和作業的等待時間。作業的響應時間是作業結束的時間點,減去作業提交的時間。平均工作響應時間是所有工作響應時間除以工作總數。
隨著機房服務器逐年耗電量的倍增,機房服務器大多位于我國西北部。究其原因降低機房服務器能耗從廣義的環境因素上來分析,這里包括自然環境和科技環境。一方面自然環境,機房服務器的冷卻分為水冷和空冷,由于水冷對水質要求高,并且一旦發生事故將是巨大的損失,因此,現在大多數公司都采用空冷的方式,這就對自然環境溫度提出了一定的要求,如果溫度過高,將不能起到冷卻的作用,因為許多大公司都把服務器建立在中西部地區,因為這里夏季溫度不高,并且晝夜溫差大,可利用自然環境降低能耗。另一方面是外部科技環境對機房服務器的影響,由于技術因素而引起的對生產力從而對服務器所帶來的影響,是趨于大型化,一體化的發展,處理的數據呈幾何級數增長,年年擴容。由于技術革命帶來的新的材料,新的冷卻方式不同,使服務器生命周期縮短,迫使加快技術投入,縮短生命周期。
總之,未來高溫服務器一定會有大展拳腳的空間,隨著能耗問題的不斷提出,將會有越來越多的用戶選用高溫服務器。對于高溫服務器來說應該建立科學和健全的評價體系,短期收益與長期效益相結合,關注運營成本。云計算、大數據、移動互聯網等新應用的深入發展,有效地推動了數據中心的規?;蜆藴驶?,同時也對服務器提出了更高的要求。從政策環境看,支持自主創新以及公共安全、網絡安全應用領域的需求增長也進一步推動國產服務器市場份額的增加。對于國產服務器廠商來說,掌握核心技術、在高端領域占據優勢的企業將會有更好的發展前景。
降低服務器使用的功耗確實是一個重要問題。搜索引擎谷歌,雅虎等公司使用大型服務器機房并消耗大量能源。美國環境保護署在2007年向美國國會提交的一份報告中估計,到2011年,將需要新建10座發電廠,以滿足這些數據中心的新能源需求。處理器未使用的部分將被關閉,同時減少偏置和動態電流消耗。該技術在2006年和2007年首次實施,并且在該公司最近推出的至強5500系列處理器中達到了新的高度。自動執行的低功耗狀態將處理器和內存置于滿足當前工作負載的最低功耗狀態。電源門允許單個內核獨立于其他工作內核和空閑,功耗接近于零,而內存和I/O控制器則增加了新的電源管理功能。互聯網編號為C狀態,從C0開始,這是一個正常的全速CPU操作模式。在C1狀態下,處理器的時鐘關閉。C-是外部I/O控制器中樞阻止處理器中斷的第二個空閑狀態。這個數字也有C3,C4等,每個核心都有自己的C狀態。另外,還有降溫增效作用。低功耗可以節省大量成本,互聯網在全球擁有95個數據中心20%的服務器用于低利用率的辦公應用,并且可以充分利用處理器核心的低功耗模式和新服務器中的網絡連接。彼得斯說,升級到新的服務器后,能耗可以減少十五分之一。另一個明顯改善的方面是冷卻,通過清除氣流通道并將電纜移動到其他位置,使空氣暢通無阻,可以在相同溫度下為2kW機架實現4kW的性能。同樣,他們也有效地使用了預冷器,使水在冷卻器到達冷卻器之前流過冷卻塔。這可以在一些計算中心將冷卻效率提高85%。
本文從國內外相關產業發展現狀出發,從設備和設施的角度出發,從虛擬化角度考慮節能潛力和空間,保證集群設備各節點的正常運行,并充分分析高性能服務器的問題和挑戰。解決高性能服務器虛擬化問題,分析評估節能減排效果;在軟件(程序控制)方面,參考其他類似領域的管理方法和經驗。在作業執行過程中,批處理文件準備好執行工作任務的峰到峰調度,并且在軟件中有效執行節能規避。
參考文獻
[1]高俊峰.高性能Linux服務器構建實戰[M].機械工業出版社,2012.
[2]余洪春.構建高可用Lin二服務器[M].機械工業出版社,2012.
[3]方錦明.云計算中基于NSGA II的虛擬資源調度算法[J].計算機工程與設,2012(04):33-35.
[4]朱錦雷,劉俊鵬.面向云計算的虛擬進程調度算法[J].計算機工程,2012(07):38 -40.