高嘉慧
















摘?要:煤炭在中國經濟發展中占據著重要的位置,它不僅是工業的主要能源,也是民用的主要能源和化工原料,并且是我國出口的商品,它在國民經濟中具有重要的戰略地位。近幾年來,我國煤炭的價格一直處于較大的波動范圍,特別是近幾年的煤炭大幅下降引起了社會的廣泛關注。煤炭作為基礎能源,需求關系的變化,必然會導致價格的變化。煤炭作為國家主要能源,客觀分析個判定煤炭價格的影響因素,了解預測未來煤炭的價格,對于掌握決策的主動權,是非常重要的。本文主要對某市2006年7月3日起至2020年4月31日的煤炭價格相關數據以及從網絡上收集的從2019年5月到2020年3月的煤炭價格相關數據進行分析,運用相關性分析中的灰色關聯分析,建立了灰色模型,得到了影響某市煤價格的主要因素的排序;其次,用python軟件分析附件1中煤炭價格數據,建立了ARIMA模型,預測了未來31天、35周、36個月的煤炭價格;然后,利用回歸分析,建立了多元線性回歸方程,綜合考慮了未來各種情況(例如突發事件)引起的煤炭價格影響因素在結構性和重要性方面的變化。
關鍵詞:煤炭價格;灰色關聯分析;SPSS軟件;ARIMA模型;逐步回歸方法
【一】基本假設
1.查找得到的數據真實可靠,可以作為分析依據,且每周/月/年/煤炭價格的均值為全國平均價格;
2.假設秦皇島港動力煤的月平均價格可以直接視作該月各周其價格的均值。
3.短期內煤炭價格及需求量不受國家政策的強制干預。
【二】符號說明
【三】 問題分析
首先要給出影響煤炭價格的重要因素并排序,因此需要搜索影響煤炭價格的指標數據,由于數據較少,我們認為是灰色系統,利用灰色關聯分析求出煤炭價格與指標之間的兩兩相關性并排序。接著我們對煤炭價格進行預測,需要掌握一定量的數據。通過附件1可以獲得我國某市2006年7月至2020年4月的煤炭價格。通過對所得到的數據進行分析,發現煤炭價格與時間呈非線性關系,可以建立煤炭價格與時間序列之間的時間序列模型,并據此對于煤炭未來價格進行預測。最后,為了得到精準的預測模型,且考慮變量間的多重共線性問題,我們采用逐步回歸方法使用SPSS,找到一個能描述煤炭價格變化的多元線性回歸方程。
【四】 建模過程
4.1.1模型準備
1.數據收集
我們從網絡上收集到2019年5月到2020年3月份煤炭進口量/萬噸,煤炭出口量/萬噸,全國鐵路煤炭發運量/萬噸,居民消費者指數價格指數(上月=100),全國煤炭企業庫存/萬噸,GDP,煤炭加工成本指數,秦皇島平均最高氣溫/℃。
2. 數據預處理
鑒于數據收集之繁瑣且困難,在保證絕大部分數據真實可信的條件下,我們對某些自變量(煤炭出口量,全國煤炭企業庫存,煤炭產量,煤炭進口量)值進行臨近線性插值和算術平均處理,以及對因變量煤炭價格進行平均處理,求得每月平均價格。大致數據如下表:
3. 灰色關聯分析介紹
對于都有兩個系統之間的因素,其隨時間或不同對象而變化的關聯性大小的度量稱為關聯度,在系統發展過程中,若兩個因素變化的趨勢具有一致性及同步變化程度較高,即可為兩者關聯程度較高,反之則較低。因此,灰色關聯分析方法是根據因素之間發展趨勢的相似或相異程度,以及灰色關聯度作為衡量因素間關聯程度的一種方法,在實際獲取數據中,常常受到客觀因素和人為因素的影響,使獲得的數據部分正確,部分不準確,具有一定灰度;并且傳統的數理統計要求樣本服從某個典型的概率分布,要求各數據與系統特征數據之間呈線性關系且各因素之間彼此無關,這種要求在本題中難以滿足。因此,我們選擇灰色關聯分析方法進行量化分析,建立數學模型得出影響某市煤價格的主要因素的排序。
4.1.2模型建立一
1.確定分析序列
灰色關聯度分析的進行需要確定參考序列,反映系統特征的數據列,還需要確定比較數據序列,是影響系統變化的數據序列。
設為母序列(因變量)煤炭價格為X0,子序列(自變量)依次為X1,X2?,…,X9
2.對數據進行預處理
為了消除量綱以及縮小變量范圍簡化計算,我們母序列和子序列中的每個指標進行預處理。令
,其中為各序列的均值。
3.序列絕對差
對標準化后的參考序列與比較序列進行差值運算并取絕對值,計算得出每列數列的最大差與最小差。數學表達式如下:
4.定義關聯系數
5.計算灰色關聯度
灰色關聯度是對灰色關聯系數做均值運算,將參考序列與比較序列在各個時刻所體現的關聯度數值,轉變為兩序列間的關聯度數值,以λ(0,k)代表母序列X0與子序列Xi之間的灰色關聯度,則計算公式表示為:
4.1.3 模型求解
利用Matlab R2017a平臺(代碼見附錄),我們對母序列X0與子序列Xi灰色關聯分析度進行求解,子序列中各個指標的灰色關聯度分別為:
由計算結果可知,從2019年5月1日至2020年4月30日,影響秦皇島煤炭價格的主要因素依次排序為經濟水平,煤炭生產成本,煤炭產量,季節因素。
4.2.1模型建立二
附件1中給2006-2020年某市所在“周”的煤炭價格最低價值、最高價值、平均值,為了預測此趨勢之下預測未來31天、35周、36個月的煤炭價格的變化,通過煤炭價格平均值的變化研究來對煤炭未來價格的發展趨勢作出預測分析。建立時間序列模型,首先檢索到原始數據時間間隔沒有規律,然后對附件1中的數據進行重采樣。
隨后建立模型:
4.2.2模型求解
1.讀取數據
我們先讀取附件1給出的煤炭價格數據,并選擇我們需要的數據,由于原始數據的時間索引間隔是沒有規律的,所以我們需要對數據進行重采樣,根據問題二的要求,我們分別以天、周、月為單位對數據重采樣,并取平均價格那一列作為預測數據。
我們把附件1中某市煤炭價格以日平均量為單位的以折線圖的形式表示出來,
通過分析可以看到上圖數據的平穩性較差,需要對數據做差分。
3、平穩化處理
因為原序列呈現非線性趨勢,需要進行一階差分
4.時間序列定階
定階問題,主要是確定p,d,q三個參數,差分的階數d一般通過觀察圖示,1階或2階即可。我們主要確定p和q的值,通過以下兩個函數確定。
(1)自相關函數ACF
自相關函數ACF描述的是時間序列觀測值與其過去的觀測值之間的線性相關性。計算公式如下:
其中k代表滯后期數,如果k=2,則代表yt和yt-2。
(2)偏自相關函數PACF
偏自相關函數PACF描述的是在給定中間觀測值的條件下,時間序列觀測值預期過去的觀測值之間的線性相關性。
綜上,p和q的階數確定規則如下:
通過對PACF和ACF的分析,我們可以得到PACF圖和ACF圖:
5.信息準則定階
通過拖尾和截尾對模型進行定階的方法,往往具有很強的主觀性。因此我們可以通過信息準則定階,常用的信息準則函數有下面2種:
AIC準則
AIC準則全稱為全稱是最小化信息量準則(Akaike Information Criterion),計算公式如下:
其中L表示模型的極大似然函數,K表示模型參數個數。
AIC=-2ln(L)+2k
BIC準則
AIC準則存在一定的不足之處。當樣本容量很大時,在AIC準則中擬合誤差提供的信息就要受到樣本容量的放大,而參數個數的懲罰因子卻和樣本容量沒關系,因此當樣本容量很大時,使用AIC準則選擇的模型不收斂與真實模型,它通常比真實模型所含的未知參數個數要多。BIC貝葉斯信息準則彌補了AIC的不足,計算公式如下:
其中 n 表示樣本容量。
得出結果如下:
我們取BIC的結果,因此可以確定p、q的值分別為1、1
6.訓練模型,預測數據
通過求解模型,我們可以得到所預測的未來31天、35周、36個月的煤炭價格
4.3.1模型準備
回歸分析是確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法,運用十分廣泛。在進行線性回歸分析時,容易出現自變量(解釋變量)之間彼此相關的現象,我們稱這種現象為多重共線性。適度的多重共線性不成問題,但當出現嚴重共線性問題時,會導致分析結果不穩定,出現回歸系數的符號與實際情況完全相反的情況。本應該顯著的自變量不顯著,本不顯著的自變量卻呈現出顯著性,這種情況下就需要消除多重共線性的影響。為了消除多重共線性對回歸結果的影響,對回歸模型做出準確有效地估計,我們采用向后逐步回歸方法,篩選自變量。
4.3.2模型介紹
逐步回歸求解最優回歸方程的重要方法,它的基本思想是將變量逐個引入模型,每引入一個解釋變量后都要進行F檢驗,并對已經選入的解釋變量逐個進行t檢驗,當原來引入的解釋變量由于后面解釋變量的引入變得不再顯著時,則將其刪除。以確保每次引入新的變量之前回歸方程中只包含顯著性變量。這是一個反復的過程,直到既沒有顯著的解釋變量選入回歸方程,也沒有不顯著的解釋變量從回歸方程中剔除為止。以保證最后所得到的解釋變量集是最優的。
4.3.3模型建立
回歸模型建立,涉及n個自變量的多元線性回歸模型可表示為,
βi為未知的回歸系數,ε為無規則但服從正態分布的擾動項。
4.3.4.模型求解
1.回歸方程確定
首先申明本次回歸自變量為第一問所收集的9個指標,接下來我們利用spss軟件對這9個指標進行向前逐步回歸。最后得到煤炭價格關于生產成本指數與秦皇島日最高氣溫的二元線性回歸方程。
可以看到回歸方程y=1.548x8+0.696x9+422.072(x8是煤炭生產成本指數,x9是秦皇島日均最高氣溫),且每個回歸系數對應t統計量的p<0.05,說明這些指標都與因變量線性關系顯著。
2.回歸模型的顯著性檢驗
可以看到,經選擇后相關系數為0.899,且F統計量對應p值<0.05,說明回歸方程線性顯著。
4.3.5模型結果討論
根據回歸方程我們得出以下結論:
1.煤炭價格與煤炭生產成本呈明顯正相關,且生產成本上升1個百分點,煤炭價格會隨之上升1.548個百分點。
2.煤炭價格與氣溫有關,說明煤炭價格波動是有著一定的季節性,從本模型中,可以看到,溫度每上升一度,煤炭價格上升0.696元。一定程度上來說,夏季的煤炭價格比冬季的煤炭價格更高。
3.煤炭價格與市場經濟水平有一定關系,由于煤炭生產成本與市場經濟有著密不可分的關系,可以說,煤炭價格的決定與市場經濟制度有著強烈的正相關性。
【五】模型的綜合評價及推廣
5.1 模型的優缺點
模型的優點:
1.沒有采用片面主觀的層次分析法,而是引入相關性分析中的灰色關聯度分析方法。該方法非常適合數據稀少,且自變量與因變量具有大致變化趨勢的情況。可以減少由于信息不對稱帶來的損失。
2.ARIMA模型,使用方便,且對短期情況的預計結果較為準確。
3.原有數據中存在缺失值,利用SPSS處理了缺失值問題。
模型的缺點:
1.ARIMA模型預測時序數據時,必須是穩定的,如果不穩定的數據,是無法捕捉到規律的。
2.影響煤炭價格變化的指標數據難以尋找,導致回歸方程具有很大的片面性。同時只利用了煤炭近一年的價格數據進行逐步回歸,難以提供長期預測。
5.2模型的推廣
灰色關聯分析方法不僅適用于煤炭的綜合評價這一類問題,而且,類似的可以用來研究解決諸如工程方案的綜合評價問題,灰色關聯分析方法在實際中非常有推廣應用價值。時間序列模型可以在有限個樣本總量的情況下,預測短期的經濟形勢、規避風險等。
參考文獻:
[1] 姜啟源,謝金星,葉俊,數學模型(第四版)[M],北京高等教育出版社,2011年
[2]司玲君,煤炭價格波動的影響因素研究[J],現代經濟信息,2018年,01期:350
[3]張同功,雷仲敏,煤炭價格波動的影響因素分析[J],中國能源,2005年,12期,16-19