田 野,李 銳,董 妍,王嘉明
(1.北京建筑大學 環境與能源工程學院,北京 100044; 2.北京市熱力集團有限責任公司,北京 100026)
精準預測熱力站日供熱量,無論對節能減排還是對提升供熱質量,都具有重要意義。許多學者提出了不同預測方法,如灰色預測法、回歸分析法、神經網絡法等[1]。神經網絡預測作為一種預測方法已經被大量應用于熱負荷預測,神經網絡的特點是無需建立復雜的輸入輸出關系,在非線性問題的處理上表現更好[2]。康勝文[3]在進行熱負荷預測時,比較了回歸分析法與神經網絡法,認為神經網絡法更具有優勢。宋軍等人[4]通過研究分析指出,BP神經網絡基本滿足了短期熱負荷預測的要求。李思琦等人[5]改進了神經網絡,得到了更加精確的熱負荷預測模型。
本文以北京某熱力站運行數據、氣象參數為樣本,采用BP神經網絡,建立日供熱量預測模型,對輸入變量、隱含層神經元數量的影響進行分析。
BP神經網絡具有非線性映射能力、泛化能力、容錯能力,因此本文采用BP神經網絡建立熱力站日供熱量預測模型。BP神經網絡結構包括輸入層、隱含層、輸出層[6]。輸出層神經元數量為1,輸出變量為熱力站日供熱量。
輸入變量的選取,影響著預測模型的預測效果。輸入層神經元數量(即輸入變量數量)過少無法達到預期效果,數量過多雖然會提高計算精度,但易使神經網絡結構過于復雜,訓練時間延長。熱力站日供熱量受多種因素影響,可分為氣象因素、系統因素。氣象因素包括室外溫度、相對濕度、大氣壓力、風速等。系統因素指供熱系統的特性,包括前幾日的供熱量等[1]。分析北京某熱力站運行數據發現,室外溫度、風速與供熱量存在相關性。因此,將日平均室外溫度、日平均風速、前1日供熱量作為必要的輸入變量。在此基礎上,增加日最低室外溫度、日最高室外溫度、日平均相對濕度、大氣壓力、前2日供熱量、前3日供熱量,分別建立預測模型1~3。隱含層神經元數量設定為10,預測模型1~3輸入變量見表1。

表1 預測模型1~3輸入變量
隱含層神經元數量決定了神經網絡的計算能力。隱含層神經元數量過少,神經網絡的計算能力不足,預測結果易發生欠擬合。隱含層神經元數量過多,預測結果易發生過擬合,使預測模型缺乏泛化性[7]。目前,大多采用經驗公式與試湊法相結合的方式來確定隱含層神經元數量[8]。為分析隱含層神經元數量對預測結果的影響,輸入變量與預測模型2一致,改變隱含層神經元數量,分別建立預測模型4~16(見表2)。實際上預測模型11與預測模型2一致,為不破壞預測模型4~16的連續性,仍保留預測模型11。

表2 模型4~16隱含層神經元數量
熱力站供熱面積為88 711 m2,站內設置了熱量表以及供水溫度、回水溫度、流量傳感器。除供熱量、供回水溫度、流量外,監測數據還包括室外溫度、風速等,每隔5 min采集1次數據,以日為單位對數據進行整理。選取2017—2020年供暖期數據進行研究,并對異常、缺失嚴重的數據進行處理,最后得到357個供暖日的有效數據。隨機將70%的樣本作為訓練集,15%的樣本作為驗證集,15%的樣本作為測試集。采用最大最小值歸一化法將輸入數據歸一化到[-1,1]。利用MATLAB軟件建立BP神經網絡預測模型。
預測模型的預測效果評價指標為擬合優度、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)。擬合優度通過決定系數R2度量,決定系數越接近1,預測模型的擬合效果越好。均方根誤差反映預測結果相對于實際結果的平均偏差情況,用于評價預測模型的穩定性,均方根誤差越小說明預測模型的穩定性越高。平均絕對百分比誤差可以反映預測結果的可信程度,平均絕對百分比誤差越小,說明預測結果可信度越高。
決定系數R2、均方根誤差σRMSE、平均絕對百分比誤差σMAPE的計算式分別為:
式中R2——決定系數
n——樣本數量
Qi,p——熱力站日供熱量預測值,GJ
Qi,m——熱力站日供熱量實際值,GJ
Qm,av——全部樣本實際值的平均值,GJ
σRMSE——均方根誤差,GJ
σMAPE——平均絕對百分比誤差
預測模型1~3部分樣本日供熱量預測值與實際值見圖1。樣本來自測試集。由圖1可知,在預測模型1~3中,預測模型2日供熱量預測值與實際值最接近。

圖1 預測模型1~3部分樣本日供熱量預測值與實際值
預測模型1~3的決定系數、均方根誤差見表3。由表3可知,在預測模型1~3中,預測模型2的決定系數最接近1、均方根誤差最小,說明模型2的預測效果最佳。預測模型1的預測效果最差,預測模型3的預測效果介于預測模型1、2之間。

表3 預測模型1~3的決定系數、均方根誤差
在隱含層神經元數量設定為10條件下,輸入變量為日平均室外溫度、日平均風速、前1日供熱量、日最低室外溫度、日最高室外溫度、前2日供熱量、前3日供熱量時,預測模型的預測效果最佳。輸入層神經元數量為3時,由于輸入變量不足,預測模型的預測效果最差。
預測模型4、5、11、14、16部分樣本日供熱量預測值與實際值見圖2。樣本來自測試集。由圖2可知,預測模型16日供熱量預測值與實際值的吻合度最好。

圖2 預測模型4、5、11、14、16部分樣本日供熱量預測值與實際值
由計算結果可知,從決定系數、均方根誤差評價預測模型4~16的預測效果比較困難。因此,采用平均絕對百分比誤差來評價模型的預測效果,預測模型4~16的平均絕對百分比誤差見表4。由表4可知,預測模型16的平均絕對百分比誤差最小,說明隱含層神經元數量為15時,預測效果最好。

表4 預測模型4~16的平均絕對百分比誤差
當輸入變量為日平均室外溫度、日平均風速、前1日供熱量、日最低室外溫度、日最高室外溫度、前2日供熱量、前3日供熱量時,隱含層神經元數量達到最多時(為15)的預測模型16預測效果最佳。隱含層神經元數量并非越多越好,在實際應用中,應選取多個隱含層神經元數量,根據預測效果選取合適的隱含層神經元數量。
① 當隱含層神經元數量設定為10,輸入變量為日平均室外溫度、日平均風速、前1日供熱量、日最低室外溫度、日最高室外溫度、前2日供熱量、前3日供熱量時,預測模型的預測效果最佳。輸入層神經元數量為3時,由于輸入變量不足,預測模型的預測效果最差。
② 當輸入變量為日平均室外溫度、日平均風速、前1日供熱量、日最低室外溫度、日最高室外溫度、前2日供熱量、前3日供熱量時,隱含層神經元數量達到最多時(為15)的預測模型預測效果最佳。隱含層神經元數量并非越多越好,在實際應用中,應選取多個隱含層神經元數量,根據預測效果選取合適的隱含層神經元數量。