巫晨云
(江蘇省郵電規劃設計院有限責任公司,南京 210006)
數據中心能效影響因素及評估模型淺析
巫晨云
(江蘇省郵電規劃設計院有限責任公司,南京 210006)
介紹了數據中心能耗結構、能耗影響因素及降低能耗的措施,在能耗指標PUE的基礎上分析了能效評價的不同標準,提出了綜合能效評估模型。
數據中心;能耗管理;能效;影響因素;評估模型
數據中心是能夠容納多個計算機或服務器及與之配套的通信和存儲設備的多功能建筑物,它包含一整套的復雜設施,如電源保障系統、環境控制設備、安全裝置等。相比于傳統的機房,數據中心具有高密度、規模化、高可靠性和運營方式靈活的特點。隨著云計算的快速發展,數據中心越來越成為信息存儲、處理的重要載體。與一般的建筑設施不同,為了保證計算機系統的安全可靠運行,數據中心能耗一般達到同樣面積的辦公樓的100~200倍,如此大的耗電量使能耗管理成為數據中心設計者和運營商需要考慮的重要問題。能耗管理的主要目的是提高能源使用的效率和降低所有與能耗相關的經濟及環境代價,具體來說,數據中心的業主關心能耗帶來的投資及運營成本,而社會及政府則需要關注高能耗對環境的影響。
1.1 數據中心能耗結構
如圖1所示,一個典型的數據中心主要由冷水機組、室內空調、供配電系統、IT設備及照明等幾個部分消耗電能,其中,核心的IT設備,包括計算、存儲、網絡等,約占整個數據中心30%的耗能,而配套及保障設施需要消耗其他約70%的電能。這些配套設施中,為保證IT設備運行所需的溫濕度環境而使用的制冷設備、室內空調等耗能最多,約占整個數據中心耗能的30%~50%,而用于滿足IT設備電壓電流要求及保證供電安全可靠性的UPS及配電單元等電源設備需要消耗約20%~25%的電能。

圖1 典型數據中心的能耗組成(ASHRAE 2008)
1.2 能耗影響因素
影響數據中心能耗的因素很多,包括數據中心的環境影響、設備運行過程中的能源損耗、為保障IT設備安全可靠運行的冗余設備的能源消耗、以及能源管理的效率等[1]。
1.2.1 設備能源損耗
數據中心的設備能源損耗主要來源于兩個部分,第一部分是UPS的轉換損耗,通常UPS在負載較高時轉換效率為88%~94%,最新的飛輪UPS和高效UPS在正常工作時旁路了UPS,可以使得總體的轉換效率提高到97%。另外,過長的電力線纜在傳輸時也會產生不可忽略的損耗,如電纜長度大于100 m時,損耗可能高達1%~3%。
空調同樣帶來效率的降低,一種情況是如果機架距離空調較遠時,空調風扇需要增大功率,同時如果冷通道過長,冷熱空調混合的機會也會增大,這樣會嚴重降低空調的效率。另一種情況是大型機房采用的冷水主機,通常冷凍水的溫度接近10℃,如此低的溫度很容易引起空調主機的結露現象,從而降低空調效率。
1.2.2 低效的能源使用
冷卻機組和室內空調是數據中心能耗的重要部分,溫度設置過低、氣流組織設計不合理都會導致能耗的浪費。
數據中心設計時需要合理配置冷氣流輸送和熱氣流排放口的位置、氣流組織模式、以及冷熱氣流的溫度。冷卻機組輸送的冷氣與IT設備產生的熱氣流需要相互隔離,互不干擾。如果冷熱氣流交匯,那么冷氣機組就需要消耗額外的電能用于熱氣流的降溫。
目前絕大多數機房的設置溫度為20℃,以確保IT設備不因過熱而宕機。2011年美國采暖、制冷與空調工程師學會(ASHRAE)發布了第3版最新設備的溫濕度環境建議標準[2](見表1)。ASHRAE建議數據中心的操作溫度在18℃~27℃范圍之內。據估計數據中心的設置溫度每降低1℃,將會多消耗2%~4%的電能,假設IT設備在室溫27℃環境下與在20℃環境下運行狀況相同,那么將環境溫度設為20℃就會浪費約20%的能耗。
1.3 降低能耗的主要措施
美國Google公司根據其數據中心建設的十幾年經驗,總結了降低數據中心能耗的四項措施:
(1)氣流組織:盡量減少熱氣流與尚未經過設備的冷氣流混合,室內機到工作點的路徑盡可能短,從而減少傳輸損耗。
(2)提高冷通道溫度:可將冷通道的溫度由18℃~20℃提升到27℃,更高的冷通道溫度可提高冷凍水的溫度,從而減少主機的工作時間。
(3)利用自然冷卻技術:例如,冷卻塔采用自然蒸發散熱的模式,可以極大的降低冷水機組的耗能。Google在比利時的機房甚至100%利用自然冷卻技術。
(4)高性能UPS:配電設備是數據中心高耗能設施之一,降低配電設備的能耗一是要盡量提高電源轉化的效率,減少電壓電流轉換帶來的損耗,例如,利用新型飛輪UPS可以將電源轉換效率從普通的90%提高到97%;二是盡量縮短高壓電源到設備的傳輸距離以減少線路損耗,例如,采用給每個服務器配置12V直流UPS可以將能耗效率提高到99.99%。
數據中心的節能依賴于有效的能耗管理,而能耗管理的前提是對數據中心能耗及其使用效率的準確度量。

表1 數據中心溫度濕度環境建議標準(ASHRAE 2011)
2.1 能效的定義
《中華人民共和國節約能源法》指出,所謂節能是指加強用能管理,采取技術上可行、經濟上合理以及環境和社會可以承受的措施,減少從能源生產到消費各個環節中的損失和浪費,更加有效、合理地利用能源。因此,現代意義的節約能源并不是簡單的減少使用能源,降低生活品質,而應該是提高能效,降低能源消耗,也就是“該用則用、能省則省”。
能效,即能源效率,一般指在能源利用中,發揮作用的與實際消耗的能源量之比。從數據中心運營及使用角度看,數據中心的能效可以廣義地定義為數據中心服務器所執行的運算任務與任務執行過程中所耗費的總能量之比。
2.2 數據中心能效評價標準
2.2.1 基礎設施能效
國際上目前比較通行的衡量數據中心能效的指標是PUE和DCiE,其計算公式是:
PUE=數據中心總耗電/IT設備耗電;DCiE=1/PUE=IT設備耗電/數據中心總耗電在這兩個指標中,IT設備耗電被認為是“有意義”的電能,PUE值越高表示該數據中心的能效越低。
2.2.2 IT設備能效
盡管PUE定義了數據中心基礎設施的能效,但是IT設備自身的能效并未考慮在內。例如,服務器的核心功能是運算和存儲,而數據中心輸入到每個服務器電能并不是100%應用到運算及存儲模塊上,通常電源、穩壓模塊和內部風扇占據了服務器20%以上的耗能(如圖2所示)。
服務器的能效(SPUE)可以用類似PUE的方法來衡量,即服務器輸入電量與有效耗電量之比。其中有效耗電量指與運算直接相關的服務器部件,包括主板、CPU、磁盤、內存、輸入輸出等,但不包含服務器內電源、穩壓模塊及內部風扇等的能耗。據綠色網格組織統計,SPUE一般在1.6~1.8之間,因為服務器電源效率約為80%,而絕大多數主板使用的穩壓模塊有超過30%的能源損耗。

圖2 服務器能耗組成[3]
2.2.3 負載能效
數據中心運營的最終目的是提供計算及應用服務,然而,通常服務器不運行應用程序或處于待機狀態時依然要消耗電能,換而言之,服務器有用部件所消耗的電能也并非全部“有意義”。由于服務器能耗會隨計算負荷的變化而改變,對于終端應用層次服務器能效(LPUE)的測算需要考慮不同計算負荷下能耗的變化。目前國內國際對不同負載下服務器能效的評估方法有很多研究[3,4],但沒有統一的標準,因此采用國際權威IT測試組織SPEC發布的統計性能評價基準測試結果是目前可行的一種方法。如圖3所示,SPECpowe_ssj2008基準測量利用不同服務器平臺運行一個標準的應用程序,并對其系統負荷進行對比,從而排除軟件效能對于能耗的影響,關注服務器硬件本身負荷和能耗之間的關系。
2.3 綜合能效評估模型
綜上所述,數據中心的能效評價包含3個層次:基礎設施、IT設備、服務器負載,嚴格意義上的能效應該能夠體現數據中心所有應用服務所消耗的負載耗能與數據中心的總耗能的關系。由此,可將數據中心能效定義為:
能效(E)=負載耗電/總耗電
受能效控制要求、設施條件等的限制,不同的數據中心可以根據各自的情況決定能效評價的粒度,采用不同的評估指標,如下公式所示:
能效(E) =負載耗電/總耗電=1/PUE (負載耗電=IT設備耗電)

圖3 SPECpower_ssj2008的基準測試結果示例
能效(E) =負載耗電/總耗電= (1/PUE)×(1/SPUE)(負載耗電=服務器有效部件耗電)
能效(E)=負載耗電/總耗電=(1/PUE)×(1/SPUE)× (計算耗電/服務器有效部件耗電) (負載耗電=計算耗電)
在最新的Facebook和Google公布的數據中心設計資料中,在強調低PUE值以外,更著重介紹了如何定制服務器,減少不必要的組件,從而提高IT設備能效;隨著云計算產業的不斷發展,服務器負載均衡、基于負載的能效評價等也都逐漸成為國內外研究的熱點,這些都表明數據中心的能耗管理已經從僅僅關注PUE向綜合能效評估轉變。
從國外先進數據中心的設計經驗來看,模塊化和集裝箱式機房由于采取冷通道封閉、科學設計氣流組織、使用列間空調縮短冷空氣傳輸距離及列間UPS縮短電源傳輸距離,相比于傳統機房能效大大提高;同時由于其模塊化的特點,還可在小范圍內采用提高冷通道溫度等措施,從而直接降低PUE值;另外模塊化的設計有利于在能耗管理中根據服務器負載情況局部調整服務器環境,避免不必要的能耗。
[1] Greenberg S, Mills E, Tschudi B. Best practices for datacenters: lessons learned from benchmarking 22 datacenters[R]. ACEEE Summer Study on Energy Efficiency in Buildings,2006.
[2] American Society of Heating, Refrigerating and Air-Conditioning Engineers (ASHRAE). Thermal Guidelines for Data Processing Environments, 3rd Edition[G]. 2011.
[3] Meisner D, Gold B, Wenisch T. PowerNap: Eliminating server idle power: proceedings of the 14th International Conference on Architectural Support for Programming Languages and Operating Systems, ACM, 2009[C]. New York, USA, 2009.
[4] 宋杰,李甜甜等. 一種云計算環境下的能效模型和度量方法[J].軟件學報,2012,23(2):200-214.
A brief analysis of the factors and evaluation models of data center energy efficiency
WU Chen-yun
(Jiangsu Posts & Telecommunications Planning and Designing Institute Co., Ltd., Nanjing 210006, China)
This paper introduces the composition of data center power consumption, enumerates the factors affecting energy consumption, and briefly describes the methods for reducing energy usage. The paper applies the Power Usage Effectiveness (PUE) metric as a basis to the analysis of different energy efficiency evaluation standards, and proposes an integrated energy effciency assessment model.
data center; energy management; energy effciency; infuencing factors; evaluation model
TN915
A
1008-5599(2014)01-0046-04
2013-09-06
巫晨云,高級工程師,中通服印尼有限公司總經理,主要從事IDC機房設計、EPC總承包等業務研究及在印度尼西亞的拓展等工作。