董 晨 周浩杰 宮銘舉* 王 晟 楊 鵬 趙 義
1(天津理工大學計算機科學與工程學院天津市智能計算及軟件新技術重點實驗室 天津 300384)
2(天津理工大學電氣電子工程學院 天津 300384)
3(春華(天津)能源管理有限責任公司 天津 300202)
4(天津華春智慧能源科技發展有限公司 天津 300000)
集中供熱系統是一種公用事業能源服務系統,不同于個別房屋的供暖,集中供熱系統需要投資于整個區域的分銷網絡[1-2]。集中供熱系統的合理調節和節能控制是一項跨學科、跨領域的綜合技術,對提高熱網的運行工況有著十分重要的意義[3]。
換熱站是集中供熱系統中非常重要的組成部分,它是連接鍋爐與熱用戶之間的橋梁,具有至關重要的作用。換熱站二次回水溫度直接反映用戶供熱質量,由于集中供熱系統的時變性、時滯性及非線性的特點,其換熱站溫度控制系統中的二次回水溫度需要根據實際情況確定,因此根據實際工況,建立換熱站二次回水溫度預測模型顯得尤為重要。在過去的幾十年里,學者們提出了許多提高預測準確性的方法。傳統基于統計的負荷預測方法包括線性回歸[4]、自回歸、移動平均、回歸樹、自回歸整合移動平均模型[5]及其一系列變體[6]。這些統計模型僅在穩定的數據上表現良好,熱負荷時間序列不可能是穩定的[7]。神經網絡算法也廣泛應用于二次回水溫度的預測。文獻[8]將一次供水溫度、一次供水流量、二次供水溫度、二次供水流量及室外溫度作為輸入,通過徑向基函數(RBF)預測模型來預測二次回水溫度。文獻[9]通過基于回水溫度平衡法的智能二網平衡系統來降低能耗。
本文根據實測的天津市文博園的換熱站數據及天氣情況數據,通過皮爾遜相關系數進行相關性分析建立三個預測特征集,分別構建了循環神經網絡(RNN)、深度神經網絡(DNNs)和長短期記憶網絡(LSTM)三種神經網絡預測模型,實現對二次回水溫度的預測,并根據各個模型在不同預測特征集上的實驗結果,挑選了最優的預測模型。
采集到的氣象數據包括室外溫度、風力、相對濕度及空氣質量(AQI),時間間隔為一小時;采集到的換熱站數據間隔是一分鐘,包括換熱站一次網的供水溫度、一次網的回水溫度、二次網的供水溫度及二次網的回水溫度。通過計算各個溫度參量在每個小時內的均值、最大值及最小值,構成換熱站的數據。
集中供熱系統中,換熱站每個小時內的一次供水溫度均值、一次供水溫度最大值、一次供水溫度最小值、一次回水溫度均值、一次回水溫度最大值、一次回水溫度最小值、二次供水溫度均值、二次供水溫度最大值、二次供水溫度最小值、室外溫度、相對濕度、風力及空氣質量,任意一條數據的變化都會引起二次回水溫度的變化,然而,這些因素對二次回水溫度影響程度各不相同,因此,采用皮爾遜系數來分析這些變量之間的相關性。
各影響因素與二次回水溫度之間的皮爾遜系數r的計算公式如下:
(1)
各個影響因素與二次回水溫度之間的皮爾遜系數r的值介于-1和1之間,即-1≤r≤1,且當0<|r|<1時,表示該變量與二次回水溫度存在一定程度的線性相關。|r|越接近1,表示兩變量間線性關系越密切;|r|越接近于0,表示兩變量的線性相關越弱。
在特征選擇時,各個影響因素與二次回水溫度之間的皮爾遜相關系數如圖1所示。

圖1 皮爾遜相關系數示意圖
圖1為各個影響因素與二次回水溫度的相關系數柱狀圖??梢钥闯?,氣象數據中的相對濕度和AQI與二次回水溫度的相關性較小,因此,將相對濕度和AQI這兩個參數剔除,并建立如下三個特征集來實現對二次回水溫度進行預測,如表1所示。

表1 二次回水溫度預測的特征集
Set1:只包含一次供水相關特征、室外溫度及風力,在系統實際運行過程當中,工作人員通過控制一次網供水溫度來調節集中供熱系統,所以此特征集可以模擬集中供熱系統實際運營狀況。
Set2:包含除了室外溫度之外的其他10個參數,可以探究室外溫度對二次回水溫度的影響。
Set3:包含所有參數,共11個特征。
根據相關性分析建立三個預測特征集,各個模型在特征集Set1、Set2和Set3的輸入神經元個數分別為5、10和11,輸出神經元個數為1。
RNN專門設計用于在順序數據或時間序列上運行,建立的RNN模型隱含層包含40神經元,RNN的結構如圖2所示。

圖2 RNN結構圖
給定一個輸入時間序列x={x1,x2,…,xt},RNN使用式(2)、式(3)迭代地計算隱藏狀態序列h={h1,h2,…,ht}以及輸出序列y={y1,y2,…,yt}。
ht=f(Whxxt+Whhht-1+bh)
(2)
yt=g(Wyhht+by)
(3)
式中:Whx、WhhWyh表示權重矩陣;向量bh、by表示偏差;f(·)表示隱藏層的激活函數;g(·)表示輸出層的激活函數。
建立的DNNs模型由4層構成,如圖3所示。

圖3 DNNs結構圖
第一層是輸入層,第二層和第三層是隱藏層,分別有50和40個神經元,最后一層是輸出層,只有一個神經元,這些層均采用ReLU激活函數。此外,為了克服過度擬合問題,在完全連接層中使用了Dropout[10],在某些訓練迭代過程中,神經元隨機死亡,即所選神經元的輸出值等于零。
建立的LSTM模型的兩個隱含層神經元個數分別為50和100,LSTM的結構[11]如圖4所示。

圖4 LSTM網絡結構圖
LSTM的存儲單元有三個門:輸入門、遺忘門及輸出門,單個LSTM單元的操作如下:
ft=σ(Wf·[[ht-1,xt]+bf)
(4)
it=σ(Wi·[ht-1,xt]+bi)
(5)
(6)
(7)
ot=σ(Wo·[ht-1,xt]+bo)
(8)
ht=ot×tanh(Ct)
(9)

換熱站二次回水溫度預測流程為:(1) 將包括天氣情況的數據和換熱站一次網二次網數據的原始數據加載到存儲器中;(2) 執行數據預處理,并且將數據歸一化到[0,1]范圍內;(3) 對數據進行特征相關性分析,通過相關性分析,確定二次回水溫度預測的輸入特征;(4) 根據特征相關性分析的結果建立3個預測特征集,將特征集劃分為訓練集、驗證集和測試集;(5) 用訓練集對預測模型進行訓練,通過在交叉驗證來優化參數并輸出最優預測模型。最后在測試集上進行驗證,測試集包含兩天(48 h)的數據,并計算各個預測模型在不同特征集下的預測性能。
二次回水溫度預測流程如圖5所示。

圖5 二次回水溫度預測流程圖
驗證實驗平臺為Windows 10系統的計算機(i7-7700 16GB DDR4 120GSSD+1T GTX1070 8GB獨顯),所用編程語言為Python,采用天津市文博園2017年至2018年采暖期的換熱站數據及該地區的氣象數據。第一步,安裝仿真軟件PyCharm(x64),并導入需要的函數庫:numpy,pandas,keras,matplotlib,math,sklearn,time,csv;第二步,通過pandas函數庫中的read_csv函數加載原始數據文件,并使用numpy函數庫中的corr函數對原始數據進行相關性分析,確定輸入,同時構建三個預測特征集;第三步,按訓練集、驗證集、測試集為8∶1∶1的比例劃分數據,并進行交叉驗證,最終輸出的最優模型為:三層RNN(隱含層包含40個神經元),四層構成DNNs(兩個隱含層分別包含50和40個神經元),四層LSTM(兩個隱含層神經元個數分別為50和100);第四步,用不同的預測模型(RNN、DNNs及LSTM)在測試集上進行模型性能測試,測試集為最后兩天共48組的實測數據。在測試中,除了預測模型不同,其他可能影響預測精度的因素均保持一致(如:迭代步數設置為400,目標函數均為MSE,優化算法均采用rmsprop等)。
為了更準確地評估預測模型的性能,使用了三種標準誤差測量來對性能進行基準測試,即均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)和平均百分比誤差(MPE)來分析預測性能。RMSE、MAPE和MPE的計算公式如下:
(10)
(11)
(12)

在實驗過程中,選擇的測試集共包含48個小時的數據,RNN、DNNs及LSTM三種預測模型的預測結果分別如圖6-圖8所示。其中:橫軸表示時間(h),縱軸表示二次回水溫度(℃)。

圖6 RNN預測結果

圖7 DNNs預測結果

圖8 LSTM預測結果
RNN模型的二次回水溫度預測結果如圖6所示,可以看出,RNN在數據集Set1、Set2和Set3上均能夠實現對換熱站二次回水溫度的預測,但是RNN在數據集Set3上的預測效果比在Set1和Set2上的預測效果好。DNNs模型的二次回水溫度預測結果如圖7所示,可以看出,DNNs在數據集Set3上的預測效果比在Set1和Set2上的預測效果好。LSTM模型的二次回水溫度預測結果如圖8所示,可以看出,LSTM在數據集Set3上的預測效果比在Set1和Set2上的預測效果好,但是,與DNNs預測結果相似,在兩個二次回水溫度突變處的預測效果并不理想。因此,各個預測模型在數據集Set3上的預測效果最好。
詳細實驗結果如表2-表4所示。表2為各個預測模型在Set1上的性能指標;表3為各個預測模型在Set2上的性能指標;表4為各個預測模型在Set3上的性能指標,表中最后一列為各個預測模型的運行時間。

表2 各模型在Set1上的性能指標

表3 各模型在Set2上的性能指標

表4 各模型在Set3上的性能指標
數據集Set1僅包含一次供水相關特征、室外溫度及風力共5個影響二次回水溫度的特征。由表2可知,通過Set1中的特征能夠實現預測二次回水溫度,且DNNs模型能夠更加準確地預測二次回水溫度。因此,在對換熱站的實際操控中,根據天氣情況通過改變一次供水溫度能夠相應改變二次回水溫度。
數據集Set3在Set2基礎上同時考慮了室外溫度。由表3可知,在數據集Set2上DNNs的預測效果最好。由表4可知,在數據集Set3上各個模型的MPE均為正值,其中RNN的預測效果最好、運行時間最短、運行效率最高。
MPE會告訴熱網控制器的操作人員,具有正值的模型預測的二次回水溫度沒有超過實際值,而具有負值的模型將過度預測實際回水溫度,從而造成能源浪費。因此,可以根據MPE相應地調整他們的操作。從表4中可知,各模型的MPE值均為正值,這表明模型預測的二次回水溫度沒有超過實際值,能夠適當地節約能源。并且,在數據集Set3上采用RNN模型能夠快速有效地預測二次回水溫度并節約能源。
對比表3和表4的性能指標可知:在模型的輸入中加入室外溫度這一特征,能夠提高預測性能,因此,在區域供熱系統中,室外溫度是影響二次回水溫度變化的重要因素。
各個模型預測精度與降低的二次回水溫度如表5所示。其中,最后一列為各個模型在數據集Set3上降低的二次回水溫度總和。

表5 各模型在Set3上降低的溫度
從表5中可以看出,在數據集Set3上各個模型的MPE均為正值,MPE越大,降低的溫度越多,節約的能源也越多。雖然LSTM降低的溫度最多,為4.633 1℃,但是RMSE和MAPE誤差較大,總體的預測結果不如RNN,而DNNs降低的溫度為1.144 8℃,遠小于RNN的3.677 3℃。因此,在數據集Set3上,RNN模型能夠更加準確地預測二次回水溫度,且二次回水溫度降低了3.677 3℃,能夠節約能源。
本文根據天津文博園實測的數據集,通過相關性分析建立三個預測特征集,分別構建RNN、DNNs和LSTM三種預測模型實現對換熱站二次回水溫度的預測。根據實驗結果,有如下結論:(1) 在對換熱站的實際操控中,根據天氣情況通過改變一次供水溫度能夠相應改變二次回水溫度;(2) 在集中供熱系統中,影響換熱站二次回水溫度的主要氣象因素是室外溫度,空氣質量和相對濕度對二次回水溫度影響較??;(3)在數據集Set3上,采用RNN模型能夠及時準確地預測二次回水溫度,并且節約能源。