丁偉翔 倪岳通 張鶯
浙江正泰能效科技有限公司
隨著建筑全生命期中的用能占社會總能耗的比率不斷增加[1],對建筑能耗進行分析,預測為建筑低能耗的實現提供理論指導和評估依據,對提高建筑能源利用率具有重要意義。作為建筑能耗中占比最大的HVAC 能耗,其受到諸多因素的影響:氣象、環境、圍護結構、居住者行為、設備性能、控制策略等,是一種多因素、非線性交互耦合影響的結果[2],如式(1)所示,其復雜性使得難以準確預測。

選用合適的模型分析能源情況是值得研究的課題,一個有效且高效的模型一直是工程界尋求的目標。基于人工智能的模型在解決包括大量獨立參數和非線性關系的復雜環境應用問題時具有很大的潛力,可以為建筑能耗預測帶來創新性的技術[3-5]。與預測相關的使用最廣泛的人工智能方法與高能力人工智能模型是支持向量機(SVM,Support Vector Machine)。SVM 模型是從歷史統計數據中提取模型的一組方法,它們通常用于為輸入與輸出之間的復雜關系進行建模或發現數據中的模式。通過對模型進行訓練和測試,挖掘數據中的有效信息,使模型具有高預測精度,是解決分類,回歸問題最好的監督學習算法[6]。顯然,對于建筑空調能耗而言,是一組隨時間連續變化的值,預測能耗涉及到回歸的問題。
支持向量回歸SVR(Support Vector Regression)是支持向量在函數回歸領域的應用。本文探究人工智能模型與建筑空調能耗預測,能源工程領域相結合的可行性。通過對歷史能耗數據的挖掘與學習,訓練并測試出相應的SVR 模型,用以預測該建筑未來的能耗,為人工智能在建筑節能領域中的應用提供參考。
圖1 展示了SVR 模型的學習過程:將所采集的歷史統計數據分為訓練集和測試集,統稱為數據樣本。兩種樣本均由目標值(逐時能耗值)與特征值(影響能耗值的變量因素)組成,即用以訓練/測試模型的數據樣本應有目標值和特征值的完整描述。在能耗預測模型中,所篩選的特征數應與能耗有較大的相關程度。具體步驟如下[7]:
1)首先,運用訓練集,設置相關參數,完成對數據的學習,生成SVR 模型。
2)其次,將測試集中的特征值輸入所生成的SVR模型中,輸出通過該模型所得到的預測目標值。
3)再次,將預測目標值與測試集目標值(真實值)進行對比,評價該模型的性能。
4)最后,若所獲得的模型通過評價達到合格,則可將該模型應用于實際。否則,調整優化模型參數設置,重新訓練模型。

圖1 SVR 模型開發及應用流程圖
顯然,擁有充足的樣本數有助于訓練模型精度的提升,充分和準確的能耗數據對模型的評價十分重要。因此,在訓練模型之前,如何收集足夠多的數據樣本是模型開發的首要問題。通常的收集方法是通過安裝于現場實地的傳感器監測采集歷史數據。然而,由于影響能耗值的因素較多,實際測量難以獲取每個變量的逐時時間序列,造成數據顆粒度不足,且測量耗時長,可能出現測量誤差。本文的主要目的是探究人工智能模型在能耗預測中的可行性,通過合理地設置與校準仿真軟件,采用模擬的方法可以產生與實際很接近的數據[8]。此處采用DeST 能耗模擬軟件,建立了一個虛擬的三維建筑模型,設置相關的邊界條件,輸出建筑內空調系統的逐時能耗及各個影響因素的瞬時值作為歷史數據樣本,即認為此時能耗模擬的數據就是真實數據。
現建立一個簡易模型,為一棟位于杭州地區的三層辦公樓(圖2、3 為該建筑標準層平面圖及三維建筑模型),圍護結構熱工性能均滿足國家標準GB50189-2015《公共建筑節能設計標準》[9]。夏季室內制冷的空調系統采用風機盤管+新風的半集中形式,冷源為冷水機組,機組恒溫出水(7 ℃),一次泵定流量運行。室內設計溫度為26 ℃,空調開啟時間為每日8:00-17:00。以8 月份整個月份的逐時能耗(此處的能耗為整個空調系統,包括了冷水機組+水泵+風機盤管+新風機組)作為研究對象——其中,1 日至25 日的能耗數據作為訓練集(10×25=250 個樣本)進行模型的學習,26 日至31 日的能耗數據作為測試集(10×6=60 個樣本)以判斷預測模型的精確度。

圖2 標準層平面圖

圖3 三維建筑模型
DeST 能耗模擬軟件對整個建筑及系統有完整的描述,如表1 所示。

表1 杭州某辦公樓熱環境外擾/內擾條件
仿真的過程如圖4 所示。

圖4 建筑能耗模擬過程
特征數作為變量是影響能耗的重要因素。特征數的選取極大地影響模型的性能,對于模型的開發而言是重要的。一般而言,所選取的特征數與目標值相關程度越高,預測就越準確。然而,并非特征數的數量越多越好,盲目追求提高預測精度會引發“維數災難”(隨著特征數的增加,計算量呈指數倍增長的一種現象)。合理地篩選最契合目標值的特征數,可以對模型進行簡化,起到減少訓練時間的作用[10]。此處給定了六個影響能耗的特征數,認為它們與能耗大小的相關程度較高,包括:室外溫度、太陽輻射量、新風負荷、室內人員數、冷水機組回水溫度、冷水機組COP,即這六個特征數構成了預測模型的支持向量(SV,Support Vector)。因此,建立SVR 模型過程的拓撲圖如圖5 所示。

圖5 支持向量拓撲圖
表2、3 為通過能耗模擬所得出的用作訓練與測試的數據樣本。數據集的每個樣本都是以單位小時為時間序列的數值。基于訓練集來表示目標對特征的依賴關系,產生高預測精度的高性能模型,而通過測試集來評價模型的預測性能。

表2 訓練集樣本

表3 測試集樣本
進一步地設置相應的參數建立SVR 模型:支持向量機的類型選取ε-SVR。核函數的類型選取RBF 徑向基函數,其易于使用且很好地解決了非線性問題。最好的模型參數應該具有很好的預測未知數據的能力而不會引起過擬合問題,由“循環遍歷算法”計算所得的懲罰因子(表征對離群點的重視程度)C=10000,參數gamma=0.025。
將測試集中的目標值(真實值,圖中的藍線)與訓練出的SVR 模型所得出的預測值(圖中的紅線)繪制于同一曲線圖中進行對比,數據樣本是8 月26 日8 時至 8 月 31 日 17 時的總計 60 個樣本(No.251~No.310)。采用式(2)“均方誤差(MSE,Mean Square Error)(圖中的綠線)”作為評價指標[11],判斷經訓練后的模型的準確性。

式中:ytrue為真實值,yprediction為預測值。
從圖6 中可以看出,基于歷史數據擬合出來的SVR 模型的預測性能非常好,測試集中的目標值與預測值十分接近。兩者總體的均方誤差MSE=0.015。此時,可認為所建立的SVR 模型合理,精確度達標。分析擬合程度如此高的原因:一方面,能耗值(目標值)與影響因素(特征值)之間的規律性極強,能耗對所選擇的6 個特征數展示出很好的依賴性。另一方面,SVR 模型在數據挖掘方面的性能良好,泛化能力強,適用于能耗數據的回歸擬合。

圖6 真實值與SVR 模型預測值的對比結果
既然依據上述步驟,通過歷史數據的訓練集訓練出了SVR 模型,又通過測試集驗證了模型的精確性及可靠性。那么,此模型便可用以分析未來的某一特定條件下的能耗值。任意給定上述特征數的具體數值,便可以計算出在此種邊界條件的描述下建筑空調的能耗。例如,現任意給定一組特征數——室外溫度35 ℃,太陽輻射量200 W/m2,新風負荷100 kW,室內人員數100 人,冷水機組回水溫度10 ℃,冷水機組COP 值5,則通過該模型預測的空調系統能耗為35.0876 kW·h。
本文闡述了人工智能模型與建筑能耗預測兩者相結合的可行性。針對模擬搭建的一棟位于杭州的辦公建筑,通過模型的介紹,能耗的仿真,參數的設置,特征數的選取以及預測性能的評價等步驟,建立了關于該棟建筑空調系統能耗預測的SVR 模型,得出的結論如下:基于歷史數據集訓練得出的SVR 模型,挖掘了數據中的潛在信息。經測試后,其預測值與真實值的總體方均誤差僅為0.015,模型的精確性合格,能夠用于預測未知未來的能耗。可見,支持向量回歸模型SVR 可以用來解決非線性、多影響因素的回歸問題,即使少量的數據樣本,只要模型選擇和參數設置合理,可以提供非常準確的預測,為建筑能耗的預測與分析提供了一種方法與參考。