孫海峰 黃 赟 陸翰濤 楊 波
1.中國移動通信集團上海有限公司
2.南京群頂科技有限公司
近年來,中國移動面對氣候變化、機房體量的增加,能耗和環境問題越發嚴峻。自2007年推出“綠色行動計劃”以來,中國移動每年編制《中國移動“綠色行動計劃”年度重點工作要求》,旨在運用新技術、新理念實現智能化的綠色節能目標。
隨著5G的上線,公司的能耗問題愈發嚴重。據統計,2019年中國移動的總耗電量超過250億kWh,2011-2019年中國移動總耗電量年均增長率約為8.9%,新的設備、基站導致巨大的耗電量仍在快速上升。而其中數據中心的耗電量占比很大,我國的數據中心為7.4萬個,占全球的23%。其中能耗類型分為IT和空調用電,而在空調能耗的處理上,傳統、物理的節能方式已經接近瓶頸,成效越來越微弱。
對于此節能現狀,需要根據大數據和新技術給出新的節能方式,在探索新型節能模式的過程中,開始進行各站點的AI節能試點工作,現已經初具成效。
上海移動某機房樓,共8層,其中機房數量為12個,2~7樓每層分東、西方向兩個機房,東、西機房內部互通。全樓末端空調數量為95臺,制冷系統為全風冷式,采用風道上送風的方式。機房布局見圖1-1。

圖1-1 機房布局
新的動環系統正在建設并逐步替換舊的動環系統,同時部分空調設備也在換新,機樓的能耗平臺數據采集暫時中斷,在節能改造完成后恢復數據采集。
傳統的空調系統,受到機房環境、氣流傳導系統等多方面因素的影響,以往的節能手段已經到達瓶頸,再投入大量資金進行收效甚微的改造與節能理念相背馳,而此時進行AI節能技術試點,旨在利用該技術的優勢將整個機房制冷系統、環境都納入考量,智能感知環境因素,自動調節系統的運行狀況,對機房進行精準的制冷控制,按需分配資源,最終形成系統智能化的閉環學習和優化迭代,從而達到節能的最終目的[1]。
空調原本策略是根據回風/送風溫度來控制運行情況,依據設定好的溫度和溫度閾值來決定是否需要開啟壓縮機,一旦空調的回風溫度達到了開啟壓縮機的條件時會開啟壓縮機降低出風溫度。機房CFD仿真圖見圖2-1。

圖2-1 機房CFD仿真圖
在對機房進行CFD軟件模擬后顯示[2],機房內的溫度有部分區域出現過低(藍色較深)或者過高的情況,這種情況說明在以往的運行模式下空調根據環境來調整自身運行情況的控制方法尚有缺陷,無法根據機房自身情況來按需分配資源,無法實現兼顧各項因素的智能化調控。因此,需要對機房進行改造,建立更高效節能的運作模式。改造之后通過算法動態調節空調的運行參數,使空調運行在良好的或最優的工況下,避免不必要的能耗。
1)采集機房歷史數據,將機房內部環境納入計算,建立全新的溫度場模型,根據得到的數據進行冷熱區域的劃分,作為后續空調運行的依據。
2)根據IT、空調用電量和損耗的對比,結合機房內溫度場數據建立機房熱平衡模型并進行智能預測,獲得空調的優化控制參數。
3)對接動環和能耗系統的應用程序編程接口,實現對空調、溫感和電量數據的自動采集,并且通過動環下發空調控制指令。
4)通過加設節能一體機實現機房環境監測和末端空調的自動控制閉環,以及預測模型的智能學習和優化迭代,并且實現策略的制訂和下發。系統部署見圖2-2。

圖2-2 系統部署
在機房的指定位置將節能一體機上架(圖3-1)、加電、網絡接入、程序調試和采控端口聯調等工作,對于部分通過網關直接采集和控制的情況,根據現場安裝協議轉換網關設備。

圖3-1 節能一體機安裝
節能一體機安裝需要申請機架位、電源和網絡接入端子、IP地址及相關端口白名單,并且根據現場內控要求進行設備安全加固。
現場根據機房構造布局架設溫感探測器(圖3-2),溫感數據直接采集至節能一體機。

圖3-2 溫感探測器
1)網絡接入要求:節能一體機需要與動環系統和能耗平臺分別打通網絡和相關端口,動環系統和能耗平臺需要開放應用程序編程接口;
2)現場電表數據采集滿足機房節能實施要求;
3)溫感要求:能耗分析所需的溫感探頭由節能廠商統一安裝,數據直接采集至節能一體機,溫感探測器數量和位置滿足機房節能實施要求;
4)空調采集和控制點位要求見表3-1。

表3-1

空調工況采集采樣頻率控制指令制冷輸出風機輸出壓縮機進風溫度回風溫度設定溫度1分鐘一次制冷輸出風機輸出壓縮機設定溫度
本項目中,部署了一臺負責數據采集、下發指令的一體機,但要做到智能化的節能效果還需要符合機房環境的節能策略,同時節能一體機將自動執行智能預測的指令,根據采集的數據實時制訂符合運行模式的指令。
4.1.1 策略流程邏輯
1)策略生成模塊根據當前機房狀態與溫濕度數據,生成新的調控策略(制冷設備開啟/休眠/參數調節);
2)將近期溫度數據、新的調控策略輸入溫度預測模型,預測在新的策略下機房各個溫感設備的溫度變化;策略流程邏輯見圖4-1。

圖4-1 策略流程邏輯
3)基于預測的溫度判斷新的策略是否會發生溫度異常告警,如果會觸發告警則對策略進行微調(不休眠空調、調節其它未休眠空調的參數);如果不會觸發告警,則策略下發執行;
4)實時獲取新的溫濕度數據,觀察機房溫度;
5)定時觸發生成新的調控策略,生成的新調控策略按照前三步的步驟重新執行優化機房能耗。
4.1.2 溫度預測
溫度預測模型能夠預測機房內溫感在不同的空調配置參數下短期內的溫度變化趨勢,提前調整運行狀態保持節能狀態。
其價值主要在于以下兩點:
1)預測溫感溫度在未來10 min內在當前空調配置參數下溫度的變化趨勢;基于該預測結果,判斷該溫感溫度相對于原溫度是過高還是過低,有一定差值則需要對空調進行相關的策略調整。
2)新策略溫度影響預測,基于新生成的策略參數以及近期溫感歷史溫度預測在新的空調配置參數下未來10 min的溫度變化趨勢,從而評估溫感溫度在新的策略下是否會觸發溫度告警等,最終達到評估新策略的效益目的。
為保證策略調整不會給機房環境溫度帶來告警風險,方案采取了以下限制措施:
1)最優目標溫度設置為25.5℃(低于告警溫度27℃,并可按需修改);
2)制訂策略時設置每次休眠制冷設備不超過1臺;
3)策略每次需要喚醒制冷設備不設置上限;
4)策略生成后,采取溫度效益預測,將溫度保持在可控狀態;
5)實時觀測溫度變化情況及時調整策略;
6)支持配置僅生成策略,不執行策略,在環境情況較復雜時,可以隨時人工對策略的風險進行評估分析后再決定策略執行與否。
4.1.3 時序預測
節能一體機采集歷史空調參數、溫感溫度數據,而溫感之間由于空調空間布局的原因具有一定程度的相關性,所以使用RNN類網絡算法對歷史數據進行訓練構建多指標預測模型,并使用預測模型對每個溫感未來一段時間的溫度變化進行智能預測。
1)算法輸入:當前空調參數配置、溫感編號、過去60 min的溫度值;
2)算法輸出:在當前空調配置參數下,各個溫感未來10 min的溫度值。
算法選型:DeepAR(RNN+Embedding)(基于循環神經網絡深度學習的時序預測算法)
算法基本邏輯如下:對訓練數據進行隨機采樣,以隨機抽取時間點t為原始輸入數據,t~t+L為輸出,以t時刻產生的訓練樣本為例,輸入為:當前時間點的相關特征,以及上一個時間點各個特征相應的長短期記憶網絡、輸出;模型輸出為:t時刻的真實值。反復循環學習t+1~t+L時刻的樣本;如此反復隨機采樣數據進行模型訓練[3]。
4.1.4 學習迭代
在本項目中,AI的學習迭代是實現智能控制的關鍵點,而AI技術要實現閉環學習,要經過一套完整流程:
1)建立數據庫作為基礎,以往的空調監控數據可作為合適的材料,方便AI依此進行初步的判斷;
2)進行大量訓練,采集實時數據進行策略制訂,并按照其準確性來修正未來的策略制訂邏輯;
3)建立測試數據庫,同樣可以使用以往的空調監控數據(不與基礎數據庫數據相重復)來作為測試材料;
4)根據測試材料進行策略的制訂,與原數據進行對比,有一定重合或低于原數值可視為測試成功[4]。
同時節能一體機設計了策略保護機制,即設備會自動保存空調被控制前的設置參數,當空調運行狀況出現異常時,可以選擇退回到之前時間點的設置參數,恢復空調原本的運行狀態,避免了AI由于空調異常而下發錯誤指令。
通常以節電量和節電率來衡量數據中心節能的質量和效果。節電量和節電率的計算根據節能實施前后的電量(實施前為基準值T0,實施后為對比值T1)進行對比計算。
T0:測量周期(節能實施前)的用電數據。T0中IT設備的用電量為PIT-0 kWh,精密空調的用電量為Pcooling-0 kWh,機房能耗合計為PT0。
T1:測量周期(節能實施后)的用電數據。T1中IT設備的用電量為PIT-1 kWh,精密空調的用電量為Pcooling-1 kWh,機房能耗合計為PT1。
部分電能數據見表4-1。

表4-1 部分電能數據
根據監控系統提取的用電數據進行計算,4月下旬15天的電量為3 009.38 kWh,而安裝后5月下旬15天的電量為3 001.55kWh,該數據顯示,進行改造后,機房空調在氣溫不斷上升的情況下,能耗依然減少。其中4月下旬的平均氣溫為19.0℃,5月下旬平均氣溫為25.6℃,而天氣氣溫對空調能耗的影響基本可視作線性關系[5],比率在24%/15℃左右,等效比率即為10.5%,即同溫度下半個月節省能耗可達315.16 kWh,用電量為:
3 009.38-315.16=2 694.22 kWh。
表4-1和表4-2顯示,相比未安裝之前的能耗情況,安裝后的AI節能運行模式下的運行情況迅速進入了穩定狀態,并且能耗更小,藍色部分為節能部分。由此說明AI技術根據機房內冷熱量的具體需求,實時對空調系統的運行狀態進行調整,使整個系統的工況保持在最優狀態,實現了智能化的按需運行模式,達到了節能減排的改造目的。

表4-2 電量對比
節能一體機采用旁掛方式接入動環網絡,設備的南北向物理或邏輯結構均無串聯的其他生產設備,在出現緊急情況時可直接關停,及時終止采控程序對空調設備的影響。關停節點的措施主要包括:
1)停止采控服務進程(遠程)
2)關閉一體機操作系統(遠程)
3)斷開一體機網絡連接線(現場)、關閉網絡交換機接入端口(遠程)
4)關閉一體機電源(現場)
除此之外,當FSU本身發生故障時,平臺會第一時間發送告警工單,維護人員會接收到FSU的設備故障消息,此時需人工介入對FSU故障恢復;而當一體機本身發生故障時,與之相連的FSU會發出通信中斷告警,同樣人工介入進行修復。在此兩種情況下,一體機都會停止對空調的所有指令控制,直到故障修復[6]。自設置該功能后,經過安裝后一段時間的運行,尚未啟用過安全機制,初步證實一體機的穩定性,有待繼續觀察其運行工況。
本項目針對機房空調能耗高、制冷不均勻的情況進行了勘查和分析,采用AI節能技術校驗并指導節能技改工作。具體完成工作如下:
1)對機房進行了現場分析,為了更有效地降低能耗,采用了AI節能技術對機房進行改造。
2)安裝一臺能夠實時采集空調溫感數據、制定下發指令的節能一體機。
3)正常情況下由一體機自動采集分析數據對未來一段時間的策略制訂,并且將一體機設置為在遇特殊情況時可結合現場情況人工干預策略。
4)在動環監控系統中得到一段時間的數據后,分析得出用電量明顯下降,且氣溫較高的5月份用電量尚小于氣溫較低的4月份,通過氣溫與制冷效率的斜率計算證明了AI技術節省能耗的成效。
5)針對機房中各種緊急情況進行了相應的設置,確保在特殊狀況下不會影響空調本身的正常運行。