門東坡,王金力,何超平,張 凱
(1.國家能源投資集團有限責任公司,北京 100011;2.中國礦業大學(北京),北京 100083)
煤炭是我國的主體能源,雖然能源結構調整的實施限制了煤炭消費的增長,但其占全國能源消費量的比重仍保持在60%左右[1-3]。隨著“煤改電”“煤改氣”政策的實施和散煤燃燒治理工作推進,未來煤炭消費結構將進一步向火電、冶金、建材和化工等主要耗煤行業集中。因此,客觀準確地預測我國主要耗煤行業煤炭消費量,有助于促進煤炭消費結構優化和煤炭產業健康發展,對我國能源戰略穩步調整和社會經濟穩定運行具有重要的意義[4]。
國內外煤炭消費預測方法較多,按建模原理和建?;A,可分為單項預測模型法和組合預測模型法[5]。單項預測模型法一是根據煤炭消費量隨時間變化規律建模的數學模型法,如移動平均法、回歸分析法、神經網絡法和灰色模型法等;二是根據煤炭消費量與經濟指標之間的關系建模的經濟模型法,如投入產出法、消費系數法和系統動力學法等。單項預測模型在煤炭消費量預測中的應用,王立杰[6]、謝和平[7]、Wang[8]、Zhu[9]等研究成果具有代表性,但單項預測模型往往存在一定缺陷,對復雜變動趨勢的擬合結果較差。組合模型法是由兩個或多個單項模型按照一定權重構建預測模型的方法。Bates[10]首次提出了以均方根預測誤差值的加權平均組合預測模型。張友蘭[11]和耿奎[12]認為組合預測法以最小均方誤差為原則,可以充分發揮各模型優勢,最大程度利用有用信息,提高預測水平。組合模型在煤炭消費預測應用方面,張金鎖[5]構建的趨勢外推組合模型、楊英明[13]構建的ARIMA-GM-ANN組合模型、顏筱紅[14]構建的時間序列和IOWGA算子的組合模型、呂占海[15]構建的多元回歸和GM(1,1)的組合模型等均能夠較準確的擬合和預測全國煤炭消費量。綜上,組合預測模型在全國煤炭消費量預測應用較多,但對于不同耗煤行業煤炭消費的預測研究較少,已有組合預測模型在各分行業的適用性有待深入研究。
為此,本文以灰色(GM)、差分自回歸移動平均(ARIMA)、邏輯斯蒂(LOGISTIC)和人工神經網絡(ANN)模型為基礎構建最優加權組合模型,通過模型檢驗和精度分析,篩選不同行業煤炭消費量預測的最優預測模型,在此基礎上對我國煤炭消費總量以及火電、冶金、建材和化工行業煤炭消費量進行預測,并分析未來煤炭消費結構的變化趨勢。

ARIMA(p,d,q)模型是時間序列的預測分析方法,其原理是利用差分思想對非平穩時間序列進行平穩化處理,將因變量僅對它的滯后值以及隨機誤差項的現值和滯后值進行回歸所建立的模型,其中p是自回歸項,q是移動平均項數;d是差分次數[16]。模型數學表達式為:
Φ(B)dxt=Θ(B)εt
式中,xt(t=1,2,…,n)是數據時間序列;εt(t=1,2,…,n)是殘差;B是延遲算子,Bnxt=xt-n;Φ(B)為自回歸系數多項式;d為差分運算,d=(1-B)d;Θ(B)為移動平均系數多項式。
邏輯斯蒂模型(Logistic)是主要的S形函數,適合解決研究變量在開始階段大致成指數增,后期變量增速逐漸放緩,并逐漸逼近一個極限值的問題。模型數學表達式為:
式中,t是時間變量;r是增長率;K是環境容量;yt0是原始數據序列初始值。
帶入原始數據,求得邏輯斯蒂方程的解:
式(1)中K和r是影響邏輯斯蒂曲線擬合效果的關鍵參數,通過Marquardt非線性函數確定最優匹配的K、r值。
神經網絡由輸入層、輸出層和隱含層構成,輸入層和輸出層與外界相連,隱含層承擔計算功能,其本質是通過信號向前傳播和誤差翻轉調整學習機制,沿梯度最速下降方向訓練和調整不同層神經元之間的權重和閾值,使實際輸出值和期望輸出值的誤差均方差為最小。



對式(2)用拉格朗日乘子法求解:
最優加權組合模型誤差平方和為:
為對比各單項模型和組合模型的擬合效果,選擇相關系數(R2)進行模型的相關性檢驗;選擇平均絕對誤差(MAE)、平均相對誤差(MAPE)和均方根誤差(RMSE)進行模型的誤差檢驗。
選用2005—2018全國煤炭消費總量及火電、冶金、建材和化工行業煤炭消費量為研究對象,全國煤炭消費總量數據采用《中國統計年鑒》,四大行業煤炭消費數據由各行業產品產量核算獲得,如圖1所示。

圖1 我國歷年全國及主要行業煤炭消費量(2005—2018)
根據2005—2018年全國和四大行業煤炭消費數據,各消費量ARIMA模型參數均為p=1,q=2,d=1;各消費量神經網絡結構均為1×12×1;邏輯斯蒂函數K總量=40.73,r總量=-0.38;K電力=20.14,r電力=-0.34;K鋼鐵=6.39,r鋼鐵=-0.37;K建材=5.38,r建材=-0.37;K化工=6.93,r化工=-0.10。
根據組合預測法,利用ARIMA、GM、ANN和LOGISTIC 4個單項模型組合構建全國和四大行業煤炭消費量預測模型時,理論上各消費量均可構建11個組合模型,包括6個2維組合模型、4個3維組合模型和1個4維組合模型?;谧顑灱訖嘟M合原理,首先利用MATLAB對各類煤炭消費量的11個組合模型進行最優權重規劃求解;然后用檢驗指標R2、MAE、MAPE和RMSE對各組合模型預測精度進行檢驗,篩選獲得最適合各類煤炭消費預測的最優組合模型。
2.2.1 全國煤炭消費量
對全國煤炭消費量的11個組合模型進行規劃求解,組合模型最優權重系數存在單項模型系數為0的現象,致使11個組合模型中存在重復。排除重復模型后共構建GM-ANN、GM-ARIMA、GM-LOGISTIC、ANN-LOGISTIC、LOGISTIC-ARIMA 5種組合模型。
單項模型、組合模型與原始數據擬合效果如圖2所示,模型檢驗結果見表1。單項模型中ARIMA模型R2值最高,達到0.97,同時MEA、MAPE和RMSE值最低,圖2(a)中ARIMA模型變化趨勢與實測值最接近,說明ARIMA模型用于預測全國煤炭消費變化趨勢的單項模型最為合理。由圖2(b)可知,5種組合模型擬合效果差異明顯,包含ARIMA模型的組合模型擬合效果明顯優于其他組合模型,說明單項模型的選取對于組合模型的影響顯著;表1數據顯示組合模型與實測值相關性均較好,GM-ARIMA、ANN-ARIMA和LOGISTIC-ARIMA模型R2值達到0.97,與ARIMA模型相同,但MEA、MAPE和RMSE值均小于ARIMA模型,說明組合模型擬合效果顯著優于單項模型。GM-ARIMA模型較其他模型誤差評價指標最低,因此選擇GM-ARIMA為全國煤炭消費量最優加權組合模型。與楊英明等[13]得出最優組合模型相比擬合R2由0.90增加到0.97,MAE由3.6降低到1.2,RMSE由4.1降低到1.5,而MAPE由1.8%增加到3.1%,對于煤炭消費總量來說,MAPE為3.1%是合理的,因此綜合判斷得出本文所建立的組合模型具有先進性。

圖2 全國煤炭消費單項模型和最優加權模型擬合效果

表1 煤炭消費單項預測模型與組合預測模型精度比較
2.2.2 火電行業煤炭消費量
對火電行業煤炭消費量的11個組合模型進行規劃求解,共構建2維組合模型5個,三維組合模型2個。
單項模型、組合模型與原始數據擬合效果如圖3所示,模型檢驗結果見表2。單項模型中ARIMA模型R2值最高,達到0.96,同時MEA、MAPE和RMSE值最低,說明ARIMA模型作為擬合火電行業煤炭消費變化趨勢的單項模型最為合理。由圖3(b)和表2可知,7種組合模型大致分為兩類,GM-LOGISTIC和ANN-LOGISTIC的相關性和誤差指標略差于ARIMA模型,剩余組合模型均優于ARIMA模型。綜合來看,GM-LOGISTIC-ARIMA的R2值最高,達到0.97,MEA、MAPE和RMSE值均最小,分別為0.56、3.00%和0.82,因此選擇該模型為火電行業煤炭消費量最優加權組合模型。

圖3 火電行業煤炭消費單項模型和最優加權模型擬合效果

表2 火電行業煤炭消費單項模型與組合模型擬合精度比較
2.2.3 冶金行業煤炭消費量
對冶金行業煤炭消費量的11個組合模型進行規劃求解,共構建GM-LOGISTIC、GM-ARIMA、ANN-LOGISTIC和ANN-ARIMA4種組合模型。
單項模型、組合模型與原始數據擬合效果如圖4所示,模型檢驗結果見表3。單項模型中LOGISTIC模型R2值最高,達到0.95,同時MEA、MAPE和RMSE值最低,說明LOGISTIC模型作為擬合冶金用煤變化趨勢的單項模型最為合理。由圖4(a)和表3可知,4種組合模型中GM-LOGISTIC和ANN-LOGISTIC的相關性和誤差指標均優于ARIMA模型,對比來看,GM-LOGISTIC的R2值最高,達到0.96,MEA、MAPE和RMSE值均最小,分別為0.23、4.01%和0.28,因此選擇該模型為冶金行業煤炭消費量最優加權組合模型。

圖4 冶金行業煤炭消費單項模型和最優加權模型擬合效果

表3 冶金行業煤炭消費單項模型與組合模型精度比較
2.2.4 建材行業煤炭消費量
對建材行業煤炭消費量的11個組合模型進行規劃求解,共構建GM-LOGISTIC、GM-ARIMA、ANN-LOGISTIC和ANN-ARIMA 4種組合模型。
單項模型、組合模型與原始數據擬合效果如圖5所示,模型檢驗結果見表4。單項模型中ARIMA模型R2值最高,達到0.93,同時MEA、MAPE和RMSE值最低,說明ARIMA模型作為擬合建材用煤變化趨勢的單項模型最為合理。由圖5(b)和表4可知,4種組合模型中GM-ARIMA和ANN-ARIMA的相關性和誤差指標均優于ARIMA模型,其中ANN-ARIMA的R2值最高,達到0.96,MEA、MAPE和RMSE值均最小,分別為0.19、3.68%和0.23,因此選擇該模型為建材行業煤炭消費量最優加權組合模型。

圖5 建材行業煤炭消費單項模型和最優加權模型擬合效果

表4 建材行業煤炭消費單項模型與組合模型擬合精度比較
2.2.5 化工行業煤炭消費量
對化工行業煤炭消費量的11個組合模型進行規劃求解,共構建GM-LOGISTIC、GM-ARIMA、ANN-ARIMA、LOGISTIC-ARIMA和GM-LOGISTIC-ARIMA 5種組合模型。
單項模型、組合模型與原始數據擬合效果如圖6所示,模型檢驗結果見表5。

表5 化工行業煤炭消費單項模型與組合模型擬合精度比較
4種單項模型R2值均達到0.99,說明各單項模型均具有較好的擬合效果,這可能與化工用煤變化趨勢波動較弱有關;對比來看ANN模型誤差值最低,因此ANN模型作為擬合化工用煤變化趨勢的單項模型最為合理。由圖6(b)和表5可知,受單項模型擬合程度較高影響,5種組合模型R2值均達到0.99,對比誤差評價指標分析,ANN-ARIMA模型MEA、MAPE和RMSE值均最小,分別為0.03、1.67%和0.04,因此選擇該模型為化工行業煤炭消費量最優加權組合模型。

圖6 化工行業煤炭消費單項模型和最優加權模型擬合效果
利用各類煤炭消費最優加權組合模型預測煤炭消費量見表6,各類煤炭消費變化趨勢如圖7所示??梢钥闯?,2020—2030年我國煤炭消費總量和四大行業煤炭消費量變化趨勢差異明顯。其中,全國煤炭消費總量總體呈增長趨勢,但受國家能源戰略規劃影響,加之環境污染和碳減排等條件制約,未來全國煤炭消費總量增幅有限,預計2020年為40.51億t,2030年達到41.67億t;火電耗煤總量總體呈增長趨勢,但因光伏、風能等新能源對傳統火電替代效應逐漸凸顯,限制了火電煤耗的增長,預計2020年為21.06億t,2030年達到22.10億t;冶金和建材耗煤總量總體呈穩定趨勢,2020年分別為6.5億t和5.11億t,2030年分別達到6.60和5.04;化工行業煤炭消費呈較快增長趨勢,受煤炭清潔轉化技術日益成熟和地方煤炭就地轉化政策的影響,未來10年化工行業煤炭消耗將保持較高速增長,預計2020年為3.06億t,2030年達到3.78億t。

圖7 煤炭消費預測變化趨勢圖

表6 2019—2030年全國和四大行業煤炭消費預測億t
1)最優加權組合模型充分利用單項模型所反映的有效信息,彌補單項模型的缺陷,相關系數、平均絕對誤差、平均相對誤差和均方根誤差等檢驗指標均優于單項模型,適合我國煤炭消費總量和主要行業煤炭消費量的預測分析。
2)根據2005—2018年煤炭消費數據,分別構建了權重為(0.32,0.68)的我國煤炭消費總量預測模型GM-ARIMA;權重為(0.28,0.14,0.58)的火電行業預測模型GM-LOGISTIC-ARIMA;權重為(0.40,0.60)的冶金行業預測模型GM-LOGISTIC;權重為(0.32,0.68)的建材行業預測模型ANN-ARIMA;權重為(0.79,0.21)的化工行業預測模型ANN-ARIMA。
3)基于最優加權組合模型,預測未來我國煤炭消費總量和火電行業消費量呈小幅增長趨勢,2030年分別達到41.67億t和22.10億t;冶金和建材行業消費量呈穩定趨勢,2030年分別達到6.60億t和5.04億t;化工行業消費量呈快速增長趨勢,2030年達到3.78億t。