劉濤,徐成良,陳煥新
(華中科技大學(xué)能源與動力工程學(xué)院,湖北武漢 430074)
隨著經(jīng)濟的發(fā)展,我國建筑呈現(xiàn)出高能耗低能效的趨勢,改革開放以來,我國建筑能耗在全國總能耗中的占比穩(wěn)步增長[1]。預(yù)計到2020年,我國建筑能耗占比將達到35%[2-3]。作為能耗占比最大的領(lǐng)域,建筑能耗擁有很大的節(jié)能潛力。因此,建筑能耗預(yù)測分析及節(jié)能設(shè)計已成為一項重要的研究課題[4-7]。
目前,建筑能耗預(yù)測方法主要有工程方法和數(shù)據(jù)驅(qū)動方法[8]。其中,工程方法是根據(jù)建筑的熱力學(xué)原理進行能耗預(yù)測,如利用EnergyPlus、eQuest等軟件對建筑進行模擬仿真,這種方法需要依賴大量的建筑參數(shù),有時會因為實際問題的高復(fù)雜性而難以進行。數(shù)據(jù)驅(qū)動方法基于建筑能耗歷史數(shù)據(jù)即可建立高精度的能耗預(yù)測模型,包括人工神經(jīng)網(wǎng)絡(luò)(Artificial Neuron Network,ANN)、支持向量機(Support Vector Machine,SVM)等,在建筑領(lǐng)域已經(jīng)得到了廣泛的應(yīng)用[9-10]。王尉同等[11]針對建筑能耗短期預(yù)測問題,提出了一種基于梯度漸進回歸樹(Gradient Boosting Regression Trees,GBRT)的建筑能耗預(yù)測方法,并驗證了基于GBRT的建筑能耗預(yù)測算法的實用性。EKICI等[12]利用BP神經(jīng)網(wǎng)絡(luò)預(yù)測了3座不同建筑的供熱能量需求。LI等[13]分別采用了BP神經(jīng)網(wǎng)絡(luò)(Back Propagation Neuron Network,BPNN)、徑向基神經(jīng)網(wǎng)絡(luò)(Radial Basis Function Neuron Network,RBFNN)、廣義回歸神經(jīng)網(wǎng)絡(luò)(General Regression Neural Network,GRNN)及SVM對同一住宅建筑的年總能耗量進行預(yù)測,結(jié)果表明SVM預(yù)測精度最高。
盡管神經(jīng)網(wǎng)絡(luò)等算法有極強的非線性映射能力,但有時仍較為依賴算法中關(guān)鍵參數(shù)的選取。針對此類問題,國內(nèi)外學(xué)者提出了多種參數(shù)尋優(yōu)方法對神經(jīng)網(wǎng)絡(luò)進行改進,以提高模型的泛化能力。姚麗麗等[14]利用遺傳算法對BP神經(jīng)網(wǎng)絡(luò)的輸入因素和網(wǎng)絡(luò)結(jié)構(gòu)進行自動尋優(yōu)確定,有效提高了能耗預(yù)測精度。ZHANG等[15]提出了一種將粒子群尋優(yōu)算法(Particle Swarm Optimization,PSO)與RBFNN相結(jié)合的建筑能耗預(yù)測方法,并證明了該方法的有效性。LEE等[16]研究了基于非線性時變演化粒子群優(yōu)化算法的徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測小時用電負荷,結(jié)果表明這種算法具有良好的精度。
本文以某地區(qū)建筑地源熱泵系統(tǒng)為研究對象,提出了一種基于改進天牛須搜索(Beetle Antennae Search,BAS)算法優(yōu)化極限學(xué)習(xí)機的建筑能耗預(yù)測方法,實現(xiàn)對地源熱泵系統(tǒng)能耗的準確預(yù)測,這對評價和改善建筑的運行策略具有重要意義。
極限學(xué)習(xí)機(Extreme Learning Machine,ELM)是HUANG等[17]依據(jù)摩爾-彭羅斯理論提出的一種單隱層前饋神經(jīng)網(wǎng)絡(luò)(Single-hidden Layer Feedforward Neural Network,SLFN)。極限學(xué)習(xí)機隨機初始化輸入神經(jīng)元的權(quán)值和隱層神經(jīng)元的閾值,且與經(jīng)典的BP算法不同,輸入權(quán)值和閾值經(jīng)初始化后就不再改變,并由簡單的矩陣求逆得到網(wǎng)絡(luò)輸出權(quán)值。與傳統(tǒng)訓(xùn)練方法相比,ELM具有學(xué)習(xí)速度快和泛化能力強等優(yōu)點[18]。
圖1為ELM的網(wǎng)絡(luò)結(jié)構(gòu)。對N個任意輸入輸出樣本(Xi, ti),其中Xi=[xi1, xi2,… , xin]∈Rn,ti=[ti1,ti2,…,tim]T∈Rm,則存在L個隱層節(jié)點的ELM網(wǎng)絡(luò)模型為:

其中,Wi為輸入權(quán)重矩陣,bi為隱層第i個節(jié)點的閾值,g(x)為激活函數(shù),βi為輸出權(quán)重。將上式表示為矩陣形式:

初始化輸入權(quán)值和閾值后,輸出矩陣H即可確定,則輸出權(quán)值矩陣可計算為:

H+稱為H矩陣的摩爾-彭羅斯廣義逆。如此,整個ELM網(wǎng)絡(luò)結(jié)構(gòu)即被確定。

圖1 ELM網(wǎng)絡(luò)結(jié)構(gòu)
BAS算法是JIANG等[19]于2017年提出的一種生物啟發(fā)式優(yōu)化算法。其基本仿生學(xué)原理為:天牛在覓食時,會依據(jù)兩根觸角嗅到的食物氣味大小,來指導(dǎo)自己下一時刻的前進方向。仿照天牛的行為,可抽象出BAS算法實現(xiàn)對目標函數(shù)的高效尋優(yōu)。BAS算法流程如下。
a)對于D維優(yōu)化問題,定義目標函數(shù),并初始化天牛參數(shù),包括天牛坐標x0、天牛質(zhì)心到兩須的距離d0等;
b)計算t時刻左、右須的坐標:

其中,xt為t時刻的天牛坐標,dt為t時刻天牛質(zhì)心到兩須的距離,b為隨機生成的標準化方向向量;
c)比較左右須的目標函數(shù)值,并依此對天牛的位置進行更新:

其中,δt表示t時刻天牛的步長,sign為符號函數(shù),f為待優(yōu)化目標函數(shù);
d)更新天牛的步長和搜索距離:

其中,ηδ和ηd分別是步長和搜索距離的更新衰減系數(shù)。
BAS不需要知道目標函數(shù)的具體形式就可以實現(xiàn)高效尋優(yōu),但BAS在尋優(yōu)策略上仍存在一些不足,如不管每次迭代的結(jié)果是否變得更優(yōu),天牛的步長和搜索距離都會衰減,且BAS只有一只天牛在隨機方向上尋優(yōu),容易迷失。
改進天牛須(Beetle Swarm Antennae Search,BSAS)算法是基于BAS算法的一種改進尋優(yōu)算法[20]。BSAS改進了BAS的步長更新策略,只有某次迭代沒有找到更優(yōu)結(jié)果時,才會更新天牛步長。BSAS在每次迭代過程中可派出多只天牛進行尋優(yōu),因此相較于BAS,BSAS能更好地找到全局最優(yōu)。
極限學(xué)習(xí)機的輸入權(quán)值和隱層閾值是隨機產(chǎn)生的,導(dǎo)致ELM存在網(wǎng)絡(luò)不穩(wěn)定的問題,模型預(yù)測精度也無法得到保證。針對ELM網(wǎng)絡(luò)的此類問題,采用BSAS算法對ELM輸入權(quán)值和隱層閾值進行優(yōu)化(BSAS-ELM),從而克服ELM的不穩(wěn)定性,改善網(wǎng)絡(luò)性能,提高模型預(yù)測精度。BSAS-ELM算法流程如圖2所示。

圖2 BSAS-ELM算法流程
本文以河南省某商務(wù)中心的地源熱泵機組為研究對象。該商務(wù)中心地下1層,地上9層,局部5層,建筑高42.9 m,總面積約25,000 m2。建筑采用地源熱泵機組為建筑物提供冬季采暖和夏季制冷,空調(diào)末端設(shè)計冷負荷為2,438 kW,熱負荷為1,696 kW。其地源熱泵系統(tǒng)如圖3所示。
該地源熱泵系統(tǒng)共有2臺HE1200B渦旋機組,為建筑冬季供暖、夏季制冷,冬季供暖期只運行其中一臺,夏季制冷高峰期兩臺機組同時運行;空調(diào)循環(huán)泵共3臺,其中兩臺對應(yīng)并聯(lián)動各臺機組,一臺備用;補水定壓采用隔膜氣壓罐加補水泵方式,補充軟化水,補水泵共2臺,一用一備;熱源井設(shè)計十眼井,兩抽七回,一口抽水并備用;熱源井中潛水泵共3臺,兩用一備。
以5 min/次的頻率對該系統(tǒng)進行數(shù)據(jù)采集,采集的數(shù)據(jù)包含當?shù)氐氖彝鉁囟葦?shù)據(jù)和傳感器記錄的地源熱泵系統(tǒng)運行各項數(shù)據(jù),本文選擇其中的地源熱泵機組功率序列數(shù)據(jù)進行能耗時間序列預(yù)測。
數(shù)據(jù)預(yù)處理是能耗預(yù)測過程中的重要步驟,直接決定了數(shù)據(jù)質(zhì)量的好壞,實際上,最終建立的能耗預(yù)測模型的預(yù)測精度在很大程度上取決于數(shù)據(jù)預(yù)處理后的數(shù)據(jù)質(zhì)量的高低[21]。在本次數(shù)據(jù)采集實驗中,由于采集間隔時間較短,采集變量較多,因此采集的數(shù)據(jù)會存在大量的死值、異常值等。這些數(shù)據(jù)不僅會降低能耗預(yù)測的精度,甚至可能導(dǎo)致算法效率低下,產(chǎn)生大量計算資源的浪費。
數(shù)據(jù)預(yù)處理步驟如下:剔除數(shù)據(jù)中的死值、異常值;選擇數(shù)據(jù)中的地源熱泵機組能耗序列數(shù)據(jù),利用線性插值法對數(shù)據(jù)進行補全;對能耗序列數(shù)據(jù)進行標準化處理,數(shù)學(xué)公式為X*=[X-min(X)]/ [max(X)-min(X)],其中X表示原始能耗序列數(shù)據(jù),max(X)和min(X)分別表示原能耗序列數(shù)據(jù)的最大值和最小值。預(yù)處理后的地源熱泵能耗序列數(shù)據(jù)有10,944組,共計43天。

圖3 地源熱泵機組系統(tǒng)
得到預(yù)處理后的能耗序列數(shù)據(jù)后,即可進行基于BSAS-ELM的訓(xùn)練建模,過程如下:依據(jù)ELM網(wǎng)絡(luò)結(jié)構(gòu)和能耗序列數(shù)據(jù)構(gòu)建輸入輸出矩陣;數(shù)據(jù)集劃分,選取前70%數(shù)據(jù)作為建模的訓(xùn)練集,剩下30%數(shù)據(jù)作為測試集;將訓(xùn)練集數(shù)據(jù)輸入BSAS- ELM模型進行訓(xùn)練,獲得地源熱泵能源預(yù)測模型。
對訓(xùn)練集數(shù)據(jù)進行訓(xùn)練得到地源熱泵能耗預(yù)測模型后,將測試集數(shù)據(jù)輸入訓(xùn)練好的模型,并以此對建立的模型的預(yù)測效果進行評價。本文選取決定系數(shù)(R2)、平均絕對誤差(MAE)和均方根誤差(RMSE)作為模型預(yù)測效果的評價指標。
圖4所示為基于BSAS-ELM的地源熱泵能耗預(yù)測流程,包括數(shù)據(jù)預(yù)處理和能耗預(yù)測兩部分。
基于建立的BSAS-ELM模型,分別對本文仿真對象的地源熱泵機組的能耗進行提前5 min的單步預(yù)測和提前3 h的多步預(yù)測。同時,為驗證模型的有效性,建立了單獨的ELM模型及常見的支持向量機(SVM)模型,進行對比分析。

圖4 基于BSAS-ELM的地源熱泵能耗預(yù)測流程
本文利用地源熱泵機組的能耗歷史序列數(shù)據(jù)進行能耗預(yù)測,能耗數(shù)據(jù)時間序列歷時43天,共10,944個樣本點,其變化趨勢如圖5所示?;贐SAS-ELM算法,分別對地源熱泵能耗進行提前5 min(提前一步)的單步預(yù)測和提前3 h(36步)的多步預(yù)測。對于單步預(yù)測,采用12輸入,1輸出,因此,單步預(yù)測的ELM網(wǎng)絡(luò)的輸入和輸出節(jié)點分別為12和1,隱層節(jié)點數(shù)經(jīng)試錯法確定為25,即單步預(yù)測的ELM網(wǎng)絡(luò)為12-25-1結(jié)構(gòu);對于多步預(yù)測,采用36輸入,1輸出,因此多步預(yù)測的ELM網(wǎng)絡(luò)的輸入輸出節(jié)點分別為36和1,隱層節(jié)點數(shù)經(jīng)試錯法確定為73,即多步預(yù)測的ELM網(wǎng)絡(luò)為36-73-1結(jié)構(gòu)。
表1展示了SVM、ELM、BSAS-ELM這3種算法對地源熱泵機組進行單步能耗預(yù)測的預(yù)測效果??梢钥闯?,較為常見的機器學(xué)習(xí)算法SVM在單步預(yù)測時表現(xiàn)良好,決定系數(shù)可達0.902;單獨的極限學(xué)習(xí)機預(yù)測的決定系數(shù)為0.960,預(yù)測平均絕對誤差相比SVM降低了47%,均方根誤差與SVM相當;BSAS-ELM算法預(yù)測的決定系數(shù)達到了0.984,且平均絕對誤差和均方根誤差相比ELM更小,其中MAE為5.195,RMSE為26.085。
圖6展示了SVM、ELM和BSAS-ELM這3種算法的單步能耗預(yù)測回歸效果。由圖6結(jié)合表1可以看出:對地源熱泵機組能耗進行提前1步的單步預(yù)測時,ELM的預(yù)測效果要優(yōu)于SVM,盡管ELM的預(yù)測效果已經(jīng)較為理想,利用改進天牛須搜索算法優(yōu)化后的BSAS-ELM仍能提升不小的預(yù)測精度。

圖5 地源熱泵能耗時間序列變化

圖6 3種模型單步能耗預(yù)測回歸效果

表1 3種模型單步能耗預(yù)測效果對比
表2展示了SVM、ELM、BSAS-ELM這3種算法對地源熱泵機組進行提前36步的能耗預(yù)測效果。在進行多步能耗預(yù)測時,較常用的機器學(xué)習(xí)算法支持向量機的表現(xiàn)不好,其決定系數(shù)只有0.67,平均絕對誤差和均方根誤差卻高達77.761和138.275,總體預(yù)測效果不能讓人滿意;相比之下,ELM的決定系數(shù)為0.925,平均絕對誤差和均方根誤差也與單步預(yù)測時相差不多,總體預(yù)測效果較為理想;BSAS-ELM多步預(yù)測的決定系數(shù)高達0.989,平均絕對誤差和均方根誤差分別為4.210和18.410,相比ELM分別降低了65%和37%。

表2 3種模型多步能耗預(yù)測效果對比
圖7展示了SVM、ELM和BSAS-ELM這3種算法建立的能耗預(yù)測模型多步預(yù)測的回歸效果。結(jié)合表2可知,在對地源熱泵能耗進行多步預(yù)測時,SVM表現(xiàn)不好,尤其在0值附近表現(xiàn)很差;單獨的極限學(xué)習(xí)機較SVM有了一定提升,預(yù)測效果差強人意;BSAS-ELM在進行多步預(yù)測時相比ELM表現(xiàn)突出,BSAS尋優(yōu)算法的引入對ELM的能耗預(yù)測效果有顯著提升。

圖7 3種模型多步能耗預(yù)測回歸效果
1)改進算法BSAS可克服傳統(tǒng)的天牛須搜索算法BAS步長更新無反饋、單只天牛易迷失等問題,能更好地收斂于目標函數(shù)的全局最優(yōu)點。
2)利用BSAS尋優(yōu)算法優(yōu)化ELM網(wǎng)絡(luò)的輸入權(quán)值和隱層閾值,能克服ELM網(wǎng)絡(luò)不穩(wěn)定等問題,獲得泛化能力更佳的模型。
3)基于BSAS-ELM對地源熱泵能耗進行單步和多步預(yù)測,能顯著提升模型預(yù)測精度,便于對地源熱泵機組的運行策略進行實時、及時調(diào)節(jié),達到建筑節(jié)能的目的。