曹昱東,王 浩
(北京師范大學珠海分校,廣東珠海,519085)
隨著經濟的不斷發展,城市生活垃圾產生量也越來越多,這些生活垃圾嚴重阻礙了城市的發展,帶來了一系列經濟、社會、環境問題。全國大部分城市都面臨著垃圾快速增長而處理垃圾的設施多年不變的局面。幾乎2/3的城市已經被垃圾所包圍,而且這種情況日益嚴峻。城市生活垃圾問題也受到政府的強烈關注,準確的預測未來城市生活垃圾產生量是解決城市生活垃圾問題的第一步,也是關鍵一步。
ARIMA模型的全稱是求和自回歸移動平均模型,ARIMA(p,d,q)模型。使用 ARIMA 模型去做預測,通俗的講,就是將需要預測的對象隨時間變化的數據作為一個隨機序列,然后分析出這個序列的特點與性質,從而通過時間序列過去的數值來推測未來的走勢。ARIMA(p,d,q)模型具有以下三條性質:


在獲取一個觀察值序列之后,首先是判斷它的平穩性,通過平穩性檢驗,可以把序列分為平穩序列和非平穩序列兩種,要用ARIMA模型進行數據分析,所分析的序列必須是平穩序列,而非平穩的序列則不能直接通過ARIMA模型計算,需要將非平穩序列轉化為平穩序列。這里轉化的過程就是一種有效提取序列中蘊含的確定性信息的過程。對序列進行差分運算則是一種常用的轉化過程。差分運算的實質是使用自回歸的方式提取確定性信息。由于差分運算的這種強大提取信息的能力,許多非平穩序列差分之后會顯示出平穩序列的性質,對差分后平穩序列可以使用ARIMA模型進行擬合,從而去分析序列的特點。
而具體進行ARIMA模型分析的時候,通過計算ACF,PACF可以有效的確定出ARIMA(p,d,q)中各參數p,d,q的具體數值,從而最終擬合序列并進行預測。具體的ARIMA建模流程圖如圖1.
根據上海市綠化和市容管理局提供的數據,做出1978年到2011年上海市生活垃圾產生量表1。

1978到2011年上海市生活垃圾產生量表(單位:萬噸)
在SAS軟件中,繪制出該序列的時序圖圖2

圖2:上海市生活垃圾產生量時序圖
由圖2可看出,隨著經濟的發展與人口的增加,自1978年來,上海市垃圾產生量大體上呈遞增趨勢,除了2000年到2002年有一個短暫的回落。垃圾產生量從開始的100萬增長到700萬,增長的幅度比較塊,平均每年增長幅度超過20%。整個圖像具有顯著的趨勢,站在時間序列的角度來說,該序列是典型的非平穩序列。
因為時序圖明顯非平穩,所以對數據進行一階差分處理,一階差分后自相關圖和白噪聲檢驗圖見圖3.

圖3:一階差分自相關、白噪聲檢驗圖
由圖3可以看出,原序列進過差分運算后,已經向平穩序列方向發展,但是p=0.0341 還是大于標準值0.005,所以我們對該序列繼續做差分運算。
進過二階差分,序列在均值附近比較穩定的波動,白噪聲檢驗如圖3。

圖3:二階差分后的白噪聲檢驗圖
圖3 顯示,差分后序列在均值附近比較穩定的波動,p值<0.005,可以認為序列平穩。所以對二階差分后的數列進行分析。
由偏自相關系數圖4可得在延遲期數大于等于4后,偏自相關系數就基本保持在兩倍標準差之內。對序列進行相對最優定階,得到最小信息量結果為圖5.

圖4:二階差分后偏自相關圖

圖5:相對最優定價圖
圖5 顯示,在自相關系數小于等于5,移動平均延遲系數小于等于5的所有ARMA(p,q)模型中,BIC信息量相對最小的是 ARMA(2,1)模型,也就是 ARIMA(2,2,1)模型。
對2階差分后的序列進行殘差自相關分析,殘差自相關檢驗結果如圖6:

圖6:殘差白噪聲檢驗圖
由于p顯然大于0.05,所以殘差序列為白噪聲序列,擬合模型顯著成立,模型檢驗通過。
所以擬合模型為: 1 + 0.72298B + 0.65197,具體預測數值表2

表2:上海市生活垃圾產生量7期預測(單位:萬噸)
最終得到上海市垃圾產生量走勢預測圖7:

圖7:上海市生活垃圾產生量走勢預測圖
運用ARIMA模型對序列進行預測時,預測的準確度隨著時間的推移呈發散的趨勢,所以ARIMA模型只適合短期預測。而且由于ARIMA模型基本使用純數學方法來提取序列中的有效因素,不能從機理上來解釋生活垃圾產生量快速增加的原因,從而不利于對垃圾產生做出具體分析,從源頭上解決垃圾產生問題。
但是ARIMA模型在預測分析中,理論比較成熟,而且垃圾產生量常常是自相關非平穩的,所以運用ARIMA模型比較合理,且得出的結論可信度較高。
垃圾治理問題關系到城市發展的方方面面,是重要的城市建設問題之一。本文通過分析過去幾十年的數據,運用ARIMA(2,2,1)模型對上海市未來7年的生活垃圾產生量做了具體的預測,具有一定的應用價值。
[1]徐禮來,崔勝輝,閆禎,等.城市生活垃圾產生預測的核心問題探討[J].環境科學與技術,2013,36(002):184-190.
[2]芮少權,匡安樂.高速公路月度交通量 ARIMA 預測模型[J].長安大學學報:自然科學版,2010,30(4):82-85.
[3]王燕.應用時間序列分析[M].中國人民大學出版社,2008.
[4]上海統計年鑒:2012[M].中國統計出版社, 2012.
[5]趙鑫,郭嘉,吳建川.ARIMA 模型和 GM (1,1)與 ARMA(p, q)組合模型在滑坡短期預報中的對比分析[J].安全與環境工程,2012,19(3):24-28.