孟祥然, 李 琦, 張騰達
(內蒙古科技大學 信息工程學院, 內蒙古 包頭 014000)
集中供熱一直是中國北方地區主要供暖方式,具有節能、環保、經濟等優點。但隨著社會的進步,人們對于供暖的需求變得越來越嚴苛,在大多數情況下熱量都不能按需供給,甚至會出現“熱上加熱”的情況,不僅會導致供熱不均衡,還會造成資源浪費。
因此,對熱力站進行優化控制顯得尤為重要。針對如何獲取、預測熱負荷的問題,國內外學者們已進行了大量研究工作。如:文獻[1]中通過MATLAB軟件,分別建立小波神經網絡與支持向量機熱負荷預測模型來預測熱負荷。文獻[2]提出了基于NARX RNN的數據驅動長期熱量預測模型,對建筑物進行長期的熱負荷預測。文獻[3]提出使用LSTM建立熱力站系統控制模型。文獻[4]使用淺層學習和深度學習預測建筑物冷負荷。文獻[5]提出了使用BP神經網絡預測熱負荷值,使用LSTM建立熱力站模型,通過DDPD網絡最終優化熱力站供水流量。文獻[6]提出基于小波變換的長短期記憶神經網絡(WTLSTM),解決短期負荷預測精度不高的問題。文獻[7]提出了一種基于注意力LSTM的“換熱站-熱用戶”的熱負荷預測算法,得到非線性預測模型。
綜上所述可以發現,數據在整個預測過程中起著至關重要的作用,因為建模訓練時需要大量數據并且還要保證數據的真實可靠。為解決此問題,可采用擬合方法求得真實情況下的熱負荷值;通過公式推導與室外溫度建立關系來確定熱負荷曲線趨勢,再通過瞬時熱量曲線得到供熱面積來確定熱負荷曲線的尺度,得到符合實際的熱負荷數據。將得到的熱負荷數據送入TCN網絡,最終得到預測后的熱負荷數據。
一直以來,循環神經網絡[8](Recurrent Neural Networks,RNN)都是解決時間序列建模的首選方案,特別是當長短期記憶[9](Long Short-Term Memory,LSTM)的出現。但循環神經網絡也存在不足之處,當輸入的序列長度過大時,將會產生嚴重的梯度消失或爆炸問題。2018年,Bai等[10]使用時域卷積神經網絡結構證明其在序列建模任務中也能表現出優異的性能。時間卷積網絡(TCN)主要由相同輸入和輸出長度的殘差塊組成。與傳統RNN相比,TCN的優勢是:
(1)實現并行處理。給定輸入時不必像RNN那樣做順序處理。
(2)感受野的靈活調整。TCN可以很輕易地改變感受野的大小,以此獲得更多的輸入。
(3)擁有較為穩定的梯度。RNN存在梯度消失和爆炸問題,但TCN基本不會出現。
TCN結構如圖1所示,其主要由1×1的普通卷積、因果卷積、膨脹卷積和殘差網絡構成。膨脹卷積是在因果卷積的基礎上改良得到,目的是為了減少因增減卷積感受野而不斷擴大的卷積層數所帶來的梯度消失、訓練復雜等問題。在因果卷積中,上一卷積層t時刻的值,只能依賴于下一卷積層t時刻和t時刻之前的值。因此,因果卷積不能看到未來的數據,是單向的結構,所以其是一種嚴格的時間約束模型。但其存在一個致命的問題是:如果需要更長時間的輸入特征,那么卷積層的層數將會變得異常龐大,導致訓練復雜、擬合效果不好等問題。
針對這些問題,Bai等人提出了使用大小排列的擴張卷積增加感受野,通過改變擴張系數獲得時間更長的輸入特征。如圖2所示。

圖2 膨脹卷積結構
當擴張系數的輸入大于原始輸入時,對原始部分進行補0操作,如式(1)所示:
(1)
其中,d為展開系數;k為卷積核的大小;(s-d·i)用來確定采用的單位上層。
在膨脹卷積后,引入ReLU函數使其變為非線性;設置強制規范化規范隱含層輸入,以此抵消梯度爆發的問題。為了防止過擬合,通過dropout引入正則化。由于輸入與輸出通道寬度不同,因此使用卷積調整張量的寬度,最終得到完整的TCN網絡。
對熱力站熱負荷預測的前提條件就是要擁有充足、準確的數據。數據包括熱負荷數據、室外風速數據和室外溫度數據等。其中,室外溫度和室外風速數據可通過中國氣象局網站直接獲取。熱負荷數據因為具有干擾因素多、難以直接采集和計算公式復雜等特點,成為影響預測結果準確程度的一個重要因素。因此,能否得到接近于熱負荷的序列數據對于熱負荷預測結果的準確程度起著決定性的作用。針對上述問題,使用在熱力站收集到的瞬時熱量與熱負荷之間建立聯系,通過室外溫度擬合熱負荷曲線,用面積相等的方式計算出總供熱量,使擬合的熱負荷曲線面積與總供熱量相等,最終得到較為準確的熱負荷擬合曲線。
熱力站瞬時熱量數據采用某市2020年12月1~30日熱力站瞬時熱量數據,以小時為間隔采集數據。室外溫度和風速也同樣選擇2020年12月份的數據。獲取到的12月熱力站瞬時熱量曲線如圖3所示。

圖3 12月份熱力站瞬時熱量
由圖3發現,瞬時熱量曲線存在異常點,在12月3日上午九點處,瞬時熱量為0,出現這種情況的原因多數是由于傳感器采集時出現數據遺漏的情況,因此需要對數據中出現的異常點做刪除、填補工作。利用程序將區間內的異常數據點去掉,使用nan代替后,應用Sklearn庫中的SimpleImputer對缺失的數據進行填補處理,處理后的數據曲線如圖4所示。處理完成后的瞬時熱量數據,將對熱負荷值的最終確定起至關重要的作用。
經研究發現,影響熱負荷變化因素較多,其中室外溫度為最主要因素。找出室外溫度與供暖熱負荷、供暖設計熱負荷之間的關系,即可得到室外溫度與熱負荷之間的關系,如式(2)所示:
Qn=α(tn-tw)
(2)
式中:tn為供暖室內計算溫度,tw為變化室外溫度,α為變化系數。

圖4 預處理后熱力站瞬時熱量曲線

得到熱負荷與室外溫度的關系后,通過收集到的某市2020年12月1~30日的室外溫度和供暖室內計算溫度,可以得到一個如圖5所示的擬合熱負荷曲線圖。

圖5 初步擬合后的熱力站熱負荷數據
初步擬合后的熱負荷數據雖然已經在趨勢上達到真正熱負荷的趨勢,但在數據的尺度上并沒有與真正的熱負荷尺度達到一致。因此使用面積相等的方式,將預處理后的瞬時熱量數據與初步擬合后的熱負荷數據做積分,使兩個面積相等,求出接近于真實熱負荷尺度的曲線。由于瞬時熱量曲線和熱負荷曲線均由一個個單獨的點組成,所以求曲線面積可以采用積分的方法求得。
首先,為每個曲線中兩兩相鄰的數據構建函數f(x)=kx+b。初步擬合后的累計熱負荷面積計算如式(3)所示,累計熱量面積的計算如式(4)所示:
(3)
(4)

將公式做進一步整理如下:
(5)
(6)
對兩式積分,使其相等,得到計算c值的公式如下:
(7)
通過計算,最終確定c=-38.55。因此,將初步擬合后的熱負荷整體向下移動38.55后,得到最終的熱負荷曲線如圖6所示。

圖6 最終擬合熱負荷曲線
將熱負荷數據與瞬時熱量對比(如圖7所示)發現,在12月7日下午15點,熱負荷達到了最低值,此時溫度達到最高,熱力站向各個熱用戶所供應的熱量應為最低值。但真實瞬時熱量值并不是最低值,這是因為熱力站的特性以及未有合理的優化指導所導致的?;诖耍褂肨CN對熱負荷進行精準預測,則可以提前對影響熱力站供熱量的參數進行調整,實現按需供熱并減少資源的浪費。

圖7 擬合熱負荷與瞬時熱量對比曲線
神經網絡的輸入數據包括熱負荷數據、室外風速數據和室外溫度數據。針對不同數據之間的尺度可能存在不同的問題,需要對數據做歸一化操作。使用“線性歸一化”方法對數據縮放后,不同數量級的數據將會滿足N(0,1)的分布。
將處理后的數據集以9∶1的比例劃分為訓練集和測試集。其中,訓練集用來訓練神經網絡,達到更高的精度,測試集則用來判斷神經網絡預測的精確程度。
評價指標是用來評估機器學習算法模型的性能。對于回歸問題來說,評價指標通常采用平均絕對誤差(MAE)、均方誤差(MSE)、根均方誤差(RMSE)、決定系數(R2)等。本文使用平均絕對誤差(MAE)、根均方誤差(RMSE)、平均絕對百分比(MAPE)作為評價指標。
熱力站模型設置為多輸入單輸出系統,如圖8所示。

圖8 熱力站網絡模型
其中,輸入到模型中的參量包括當前時刻的熱力站熱負荷值、當前時刻的室外溫度、當前時刻的風速和下一時刻的室外溫度,輸出為下一時刻的熱負荷值。
基于TCN的熱負荷預測模型如圖9所示。使用tensorflow搭建模型,在原有TCN結構的基礎上增加了6個殘差塊,并且將每個殘差塊中膨脹卷積的膨脹系數做調整,每一個殘差塊中的膨脹系數按2的次冪數不斷累加。上一個殘差塊的輸出數據作為下一時刻殘差塊的輸入數據,直到輸入到最終的殘差塊,將輸出預測值。

圖9 TCN模型
模型數據以24小時為一個時間周期,因此Time_step的數據為24,輸入數據的格式為[28,24,4]。通過實驗得到,當超參數設置為表1中的數值時,TCN模型可以得到最佳的輸出結果。

表1 TCN模型超參數設置
將處理好的數據輸入TCN模型中,最終得到的測試集24小時的結果如圖10所示。該模型的預測值與真實值的變化趨勢一致。

圖10 TCN測試集預測結果
分別使用BP和LSTM神經網絡模型對該時間段預測,最終得到的3種網絡模型預測圖和誤差圖如圖11、圖12所示。

圖11 測試集算法對比

圖12 算法誤差對比圖
由圖11、圖12可知,在相同輸入數據的條件下,TCN算法相對誤差在1%以內,比BP、LSTM預測更準確。
評價指標對比結果見表2。通過表2可以發現,TCN在MAE、RMSE和MAPE這3個評價指標中,相比LSTM和BP神經網絡要小很多,證明TCN在熱負荷預測中更準確,所得到的熱負荷預測數據能更好的指導熱力站供熱量的供給大小。

表2 算法評價指標對比
針對區域集中供熱中經常出現的供熱不均衡所導致的資源浪費的問題,對熱力站的熱負荷進行短期預測。由于熱負荷具有難收集、干擾多等特點,通過擬合的方式,使熱負荷值與室外溫度建立數學聯系,使用面積相等的方法確定熱負荷的尺度大小,最終獲得較為準確的熱負荷數據。將擬合后的熱負荷、室外溫度以及風速值輸入到tensorflow創建的TCN神經網絡模型中預測熱力站短期熱負荷。通過對比試驗證明,相較于其它神經網絡模型,TCN模型在短期熱負荷預測中更準確。后續將繼續對熱負荷數據優化,加入其它影響因素擬合數據,使熱負荷數據更加接近真實值。為熱力站供熱量按需分配提供可靠的數據來源。