遲媛,張兵,朱國棟,王納
(北京特種工程設計研究院,北京 100028)
隨著云計算、大數據、虛擬計算等新概念、新技術的廣泛應用,數據機房作為支撐其高效穩定運行的核心基礎設施,建設規模急劇增長。截至2017年,我國正在使用的機柜總計166萬架,隨著機架和刀片服務器功率的增加,能耗(發熱)密度也不斷增長。建設規模的擴張和耗能密度的增大,使得數據機房的運行能耗增長迅速,這給機房的運維管理帶來了巨大的挑戰。據相關調查統計,2017年我國數據機房總耗電量約為1250億kW·h,超過了葛洲壩和三峽發電站當年的發電量之和。
作為設計和評估數據中心評價能源效率的一項關鍵技術指標,PUE(數據總的能耗與IT設備總能耗之比)被設計院和用戶廣泛應用。通常認為,PUE值越接近1,該數據機房節能化水平越高。目前,如Facebook、雅虎、谷歌等知名企業建設的數據機房,其PUE值普遍低于1.5,有的甚至達到了1.1,而我國大部分數據機房的PUE值在2~3,以上海為例,數據機房全年PUE平均值為2.21。
我國一些大型互聯網企業已經開展了一系列節能實踐,在數據機房的建設和改造中采用了多項節能措施,高能耗問題依舊普遍存在,改進和提升節能性能的空間仍然很大。

圖1 國內數據中心機房能效現狀

圖2 典型數據中心機房能耗構成
數據機房能耗主要包括以下幾個部分:(1)數據機房IT設備用電;(2)制冷系統用電;(3)供電系統用電;(4)照明、通風、加濕等其他系統設備用電等。
分析目前我國數據機房能耗偏高的原因,主要包括以下幾個方面:(1)IT設備能耗偏高;(2)選用的空調冷源形式、氣流組織形式不合理,造成數據機房空調系統能耗高;(3)供電系統不夠優化,變壓器、UPS等供電設備電能損耗高;(4)運行管理能力不足,效率低下。
服務器、存儲設備、網絡、控制軟件構成了數據機房的核心。在保證穩定運行的條件下,提高數據機房IT設備使用效率,可有效降低對電力的消耗,從而降低運營成本。
對于服務器而言,節能技術主要包括以下幾種:
(1)服務器機箱通風技術。該技術在延續了服務器前進風后出風的設計理念的同時,將機箱分為多個散熱區域,使得機箱氣流分割更加精細,可以更準確地控制氣流流向,大大提高了機箱的散熱效率。
(2)使用高效率電源。采用80plus白金電源,該電源在50%的負載下轉換效率高達94%,可動態調節并均衡分配電源模塊負載,以保證電源轉換效率。
(3)處理器休眠技術。當處理器較長時間處于空閑狀態時,該技術可以讓CPU進入不同的休眠狀態,通過降低電壓或切斷內部時鐘實現節能。
(4)動態能耗管理技術DEMT。根據CPU負載、環境溫度等多種輸入參數,按資源的實時使用率,調整服務器的整體運行狀態,動態實時智能調節各部件的功耗,以最小化服務器電耗。
對于存儲設備,可以采取以下技術手段實現節能目的:
(1)配置精簡自動化技術。根據用戶的容量及使用需求,對存儲容量資源進行實時、動態的自動分配,充分利用磁盤陣列的有效存儲空間,提升存儲空間利用率,在節省電力消耗的同時降低制冷成本。
(2)重復數據刪除技術。通過將數據進行分塊,篩選并刪除相同的數據塊,達到節約存儲空間的目的,進而達到減少能耗的效果。
對數據機房而言,空調系統能耗約占總能耗的47%左右,因此,提高能源利用效率最直接的方法就是降低數據機房空調系統能耗。
(1)選擇合理的空調冷源形式。目前最常見的空調冷源有:風冷直接蒸發式系統、風冷冷水系統、水冷直接蒸發式系統、水冷冷水系統、蒸發冷卻系統。數據機房空調系統需要根據地理環境、機房等級、制冷量需求、占地面積、經濟性、可擴展性等因素,選用上述一種或多種形式的組合。
(2)合理應用自然冷源技術。自然冷源,即直接或間接引入室外冷空氣或低溫水(如地下水、江水、河水、湖水、海水、自來水),與空調系統聯合使用,對數據機房進行降溫冷卻。
(3)提高空調送風溫度。將機房環境溫度控制在23~27℃,在保證機房設備正常運行的同時,可以降低用于除濕、降溫、加濕熱所需的能耗。并且溫度設定的越高,其節能效果越明顯。
(4)采用CFD技術。對數據機房空調送風溫度、送風速度、機柜排列方式、空調送回風方式等進行數值模擬計算,深入了解機房內氣流速度場和溫度場的分布,并優化氣流組織、冷量分配方案,在滿足機柜設備的散熱需要的同時,達到降低機房空調能耗的目的。
(5)采用封閉冷熱通道技術。對于高熱密度機柜而言,采用封閉冷通道技術,機柜的正面空間被延展為送風靜壓箱,可使空調送出的冷風全部用于設備散熱,提空調系統冷量利用率。
(6)選用帶變風量風機的送風地板進行精確送風。對于采用地板送風的數據機房,可在機柜上部裝設控制單元,并經由溫度傳感器來檢測、收集機柜排風溫度信息,根據機柜排風溫度,由前端控制器實時調節各智能送風口的送風量,避免由于機房局部過熱,導致降低送風溫度,增加空調能耗的情況發生。
供電系統的節能降耗,主要是降低非負載設備的用電損耗。
(1)采用節能效果好的變壓器,并合理使用“2N”變壓器結構,降低電能損耗。
(2)高壓直流供電。采用整流模塊+蓄電池組的并聯冗余結構,在提高供電系統可靠性的同時,可以根據負載的實際情況靈活調整投入運行的整流模塊數量,確保在線的整流模塊始終處于高負載率模式下運行。
(3)設置電量計量、監控及綜合管理系統,對每個環節的用電數據進行實時采集、分析,并根據綜合調節。
對運行數據實時采集、計算、診斷、優化、評估,以按需供能為指導,制定機柜微環境調整、配電參數調整、水系統參數調整、精密空調參數調整等策略,降低數據機房能耗,提高能源利用效率。
數據機房制冷的核心目的是降低芯片的溫度,使其保持正常運行和長期可靠。目前數據機房大多采用風冷的形式對CPU芯片進行冷卻,無論是服務器內部還是機房空調系統硬件的設計,其技術都比較成熟。這種方式除了風扇產生噪音外,風扇所產生的能耗約占冷卻能耗的30%以上,同時風冷散熱器也存在散熱極限。實驗研究發現,如果芯片熱流密度超過50W/cm2時,即使增大風速其冷卻效果也已經不明顯。如果進一步降低進風溫度,除了降低空調送風溫度、增加制冷機組的能耗外,安裝芯片的基板溫度有可能降到露點溫度,這將帶來新的問題。
液體冷卻方式分為導熱型和浸沒型。其區別在于冷卻液是否與電子元件或其封裝體發生直接性的物理接觸。浸沒式冷卻是將各類基板包括存儲,通信和供電在內的各種元件及裝置完全浸沒在裝滿非導電絕緣工作液體的冷卻槽內,冷卻液在電子元件表面強制對流直接吸熱進行冷卻。隨著芯片技術的跨越式發展,冷卻方式逐步從機房級、列間級、機柜級發展至服務器級,液體冷卻技術也將替代空氣冷卻技術成為主流。
綜上所述,數據機房運行能耗很高,節能潛力巨大,在對其進行建設或節能改造時,應結合其自身特點,積極應用節能減排新技術,同時實行節能管理,最大程度降低機房運行能耗,提高能源利用效率。在能源緊缺的今天,唯有在各個環節做好節能減排工作,實現整體節能減排效能,才能促進數據機房建設綠色可持續發展,進而為創建環境友好型、資源節約型新社會貢獻出更大的力量。