婁潔良
(中國電信上海公司信息網絡部,上海200085)
綠色節能是數據中心的發展趨勢,為了衡量數據中心的能源有效利用率,2007年2月非贏利的第三方機構綠色網格組織(GREEN GRID)提出了PUE(Power Usage Effectiveness)值的概念,并在業界予以推廣。
PUE值被定義為:PUE=數據中心總功率/IT總功率。這是一個大于1的數值,因為數據中心總功率一方面包含了IT設備正常運行消耗的功率,另一方面還包含了為支持IT設備的正常運行,機房所配置的基礎設施消耗的功率。PUE越低,意味著數據中心的節能效果越好。
從這個定義看,PUE的提出基于下列思路:IT設備的節能問題由設備廠商來解決。作為數據中心的建設和運營方,主要考慮機房基礎設施層面的節能問題,即在不改變IT設備情況下,提高電能使用效率。
盡管從PUE的定義看,功率是某一時間點的概念,即PUE值只是某一特定工況下的能效指標,但業界普遍采用一段時間內的總電量和IT設備的耗電量之比來計算PUE值,可以近似等同于動態PUE值的算術平均,不失為一種務實可操作的方法。
上海地區某大型高等級數據中心(IDC)投產于2009年,建成后客戶托管的服務器數量不斷增加,但通過檢測,其每月的平均PUE值一直徘徊在2.0以上,在同等規模的數據中心中相對偏高。為查明原因,在3月份筆者每天對數據中心各用電設備進行用電量測量,通過縮小用電量測量顆粒度,劃小核算單元方法對大樓的耗電量構成進行分析,從而得出了若干結論和啟示。
(1)數據中心主樓共四層,地下一層為變電所、油機房及消防鋼瓶間,一層為UPS室,二層三層共四個數據機房,其中南北兩側各兩個,每個機房面積均在1100 m2左右。兩個北側機房為常規機架布局,機架按“面對面,背靠備”方式排列;兩個南側機房均為VIP包房布局,機架按大客戶要求安裝在各自包房內,包房間相互隔離。
(2)對北側機房供電的為12臺400 kVA UPS,組成6個系統;對南側機房供電的為16臺300 kVA UPS,組成8個系統。
(3)四個機房內用于制冷的均為分體式風冷空調,每個北側機房設置16臺,每個南側機房設置22臺,每個機房均采用架空地板下送風方式。
通過一個月的測試,統計匯總得到用電數據如表1所示。
通過對表1數據的分析,可以計算出數據中心3月份的平均PUE值為2.031,而大樓內電能損耗的構成及各耗能主體對大樓PUE值的貢獻,如表2所示。

表1 3月份大樓各用電設備耗電量統計表

表2 3月份大樓電能損耗構成及耗能主體對PUE值貢獻統計表
通過對表1和表2數據的分析,可以得出如下結論:
(1)除去IT設備用電,空調用電和UPS損耗在數據中心的電能構成中占比居前,兩者之和占總能耗的44.88%,對PUE值的貢獻已達0.912,難怪該數據中心的PUE值一直高于2.0。
(2)忽略機房前級的變配電系統損耗,以南側及北側機房為單元分別計算機房級的PUE值,可以得到:北側機房的PUE值為1.726,其中空調對PUE值的貢獻為0.594;南側機房的PUE值為2.476,其中空調對PUE值的貢獻為1.2。所以,正是由于南側機房空調的高耗能,推高了南側機房的PUE值,也因為南側機房的高PUE值,推高了整個數據中心的PUE值。
(3)3月份為北側機房供電的UPS設備平均工作效率為88.3%,為南側機房供電的UPS設備平均工作效率為78.3%,都低于甚至遠低于眾多UPS設備廠家宣傳的90%以上的數值。
(4)3月份變壓器的平均工作效率為98.5%,應在正常的波動范圍之內。數據中心內供電線路損耗、機房照明用電及公用區域用電也都在正常的波動范圍之內。
為了進一步查明推高數據中心PUE值的關鍵因素,筆者通過機房的實地調查,證實了南側機房空調能耗大及UPS效率低的原因。
(1)南側機房規劃時因VIP客戶有個性化的平面布局要求,采用包房方式,同時為了能回風通暢,包房間以通透的隔柵分隔。但由于不同包房間機架排列疏密各異,從機房整體看,機架排列未能形成冷熱通道,往往一包房機架排出的熱量為相鄰包房機架吸入。從機架的種類看,既有數據中心運營者提供的機架,也有客戶自帶的機架,不同的機架進風方式各異,前進風下進風并存。正是上述兩個原因造成了機房內氣流組織紊亂,空調須將整個機房環境溫度降下來才能冷卻IT設備,從而大大增加了空調的能耗。另一方面,查驗南側機房的幾十臺空調,也未實行組網群控的運行功能。由于機房面積大,氣流組織復雜,必然會在空調間產生競爭運行,增加冗余機組不必要的運行時間。
(2)從UPS負載率來看,為北側機房供電的UPS設備負載率基本維持在單機容量的30%左右,而為南側機房供電的UPS設備負載率極低,8套UPS的負載率及對應的工作效率如表3所示。

表3 為南側機房供電的UPS負載率及效率統計表
從測得的數據看,UPS工作效率與其負載率有很大的關聯度,特別是在輕載即負載低于10%時,工作效率明顯降低。
從此次對數據中心PUE值剖析的案例中,得到以下啟示:
(1)上海地區大型的數據中心,當采用集中設置的水冷冷水機組空調系統時,正常情況下春季的PUE值一般都在1.70以下。而案例中的數據中心,由于采用了風冷專用空調機組制冷,盡管北側機房采用了地板下送風方式,機架間也形成了冷熱通道,氣流組織較為通暢,但PUE值仍達到了1.726,此值計算時還未將變配電的損耗及公用區域用電等計算在內。由此也印證了在機房面積達到數千平方米以上規模時,采用集中冷源的冷水空調系統要比分體式風冷空調節能。
(2)南北機房的PUE值相差懸殊,與機房內空調的送回風氣流組織是否合理有很大關系。對比兩機房的機架排列方式,可以看出,采用機架“面對面,背靠背”排列,有利于將冷熱氣流隔離,將冷量準確地送至IT設備,從而提高制冷的有效性和空調的能效比。
(3)出于對安全供電的考慮,在高等級數據中心內,UPS冗余度都比較大,另外數據中心IDC業務發展也總會經歷負載逐步上升的過程,所以,UPS設備經常會處于輕載運行狀態。從現有的行業規范看,YD/T1095-2008《通信用不間斷電源要求》規定UPS設備滿載時效率要達到90%以上,半載時效率要達到88%以上,但未對輕載時的效率作出規定。考慮到數據中心的運營現狀,數據中心的建設者在UPS設備采購時更要關注其輕載時的效率。在本案例中,僅UPS設備自身的損耗在一個月內就達到了17萬度,同時為了對其降溫,還將花費相近數量的電費用于空調制冷。所以,提高UPS的效率對降低數據中心的運營費用有很大的影響。
(4)該數據中心IDC機架的銷售部門在銷售包房資源時主要以包房面積及包房內最大用電量進行定價,但由于各種原因,未能準確預測客戶進駐時包房內服務器用電達到最大值的時間,而建設部門在建設時為南側機房供電的UPS系統按機房的終期容量配置,結果造成在較長時間內按滿容量配置的UPS處于輕載狀態。在此種情況下,有必要在規劃初期對UPS供電系統進行模塊化設置,當負載逐漸增大時,適時增加UPS供電系統模塊,即可滿足需求。另外,隨著模塊化UPS技術的成熟,在配置UPS設備時,可選用模塊化UPS,其中的功率模塊可隨負載的增減進行配置或啟停。通過上述兩種方式,既可降低一次性的建設投資,又可提高UPS的工作效率,從而減少運營費用。
(5)在對機房進行實地調查的同時,維護人員也在三月上旬開始對機房采取了一系列整改措施,主要是:根據負載的變化調整南側機房空調開啟的臺數及位置;關閉空置的下進風機柜下部的擋風板;在前進風機柜未安裝設備的空余處安裝擋風板。從表4的測試數據看,上述措施有一定的效果。雖然由于南側機房總體條件未發生變化,PUE值下降不明顯,但足以證明,注重細節是推進節能減排工作的要素之一。

表4 不同時期大樓PUE值統計表
(6)有必要為數據中心建設其配套的能耗監測系統,以便隨時掌握數據中心內的能耗分布。電量的采集顆粒度大小應能滿足對數據中心能耗構成的準確分析,以指導數據中心節能措施的實施重點,并可評估節能技術的有效性和實用性。考慮到供電系統在數據中心投產后就無法停電,也就無法在其帶電線路上或帶電設備上安裝計量電表及相應的互感器,所以能耗監測系統應與數據中心同步建設同步投產,以盡早發揮其效能。
PUE值作為衡量數據中心能源有效利用率的指標,有其現實的指導意義。數據中心的建設者和運營者,有必要對其進行深入的跟蹤和分析,研究其下降的原因或過高的因素,來指導采取數據中心基礎設施層面的節能措施,從而有效地提高能源利用率,降低運營成本。