

【摘 要】環保監測數據的更新是一個不斷變化的動態過程,隨著數據量的增加,數據所反映的信息也更加完善,給人民的生活和生產帶來了重要的影響。利用灰色GM(1,1)系統建模理論和新陳代謝建模原理,建立基于動態數據驅動的灰色GM(1,1)新陳代謝模型。該模型根據空氣質量指數的動態數據更新,去掉舊數據加入新數據,弱化了對數據服從怎樣統計規律這一要求,避免了模型與數據統計規律不適應的難題,使得模型預測精度較傳統GM(1,1)、線性模型及BP神經網絡模型要好得多。
【關鍵詞】空氣質量 GM(1,1)模型 線性模型BP 神經網絡
【中圖分類號】TV139.1 【文獻標識碼】A 【文章編號】1674-4810(2015)27-0032-02
空氣質量指數(Air Quality Index,簡稱AQI)是定量描述空氣質量狀況的無量綱指數,通過空氣質量指數的變化可直觀地評價大氣環境的質量狀況,并對空氣污染的控制和管理進行指導。目前,我國已有367個城市建立了全國城市空氣質量日報和小時報制度,實時公布相應城市的空氣質量指數、級別和首要污染物,為工農業生產和人民生活提供幫助。因此,對空氣質量指數的預測研究在實際生產和生活中顯得非常重要。
一 模型選擇分析
目前,監測部門對環境監測數據只是在實時更新相關環境指標數據,沒有對其相應的指標進行預測,這給人民生活和工業生產造成了一定的影響。例如,居民如果不知道明天的PM2.5的預測濃度,也就不能對明天的生活進行合理地安排。環保部門沒有對未來幾天空氣質量指數及空氣污染指數的預測數據,從而不能對一些工業生產進行有效地控制,一定程度上造成處于被動的局面。
對空氣質量指數的預測研究大多利用統計學知識從大量數據中找到數據變化規律,再利用此規律找到匹配的數學模型。采用較多的預測模型主要有線性回歸模型、自回歸求和滑動平均模型(ARIMA)、自回歸條件異方差類模型(ARCH類)、神經網絡方法、灰色預測模型。這些模型存在兩方面的不足:一是這些模型建模過程中的數據均固定不變,沒有體現數據的不斷更新;二是在選模型之前首先統計分析數據規律,若得出的規律與模型的適用性不匹配則仍用該模型進行建模預測難度較大,模型選擇失效。
為克服這兩點不足,將動態數據驅動原理與新陳代謝理論相結合,建立基于動態數據驅動的灰色GM(1,1)新陳代謝模型,該模型在不斷補充新信息的同時,要及時地去掉舊信息,使數據不斷更新;同時,該模型解決了建模運算量不斷增大的困難,GM(1,1)模型對數據服從怎樣統計規律這一要求較弱,避免了模型與數據統計規律不適應的難題。
二 模型選擇與建立
在環保部網站選取2014年12月1日到2015年6月19日四川省瀘州市空氣質量指數共199個數據建模,預測2015年6月20日至2015年6月29日共10個數據,分析模型預測。
1.灰色GM(1,1)模型
設原始數據序列為嚴格的指數序列,即:x(0)(k)=Ae-a(k-1),k=1,2,…N
建立GM(1,1)模型最終擬合結果為:
利用MATLAB7.0編程,建立GM(1,1)模型,預測結果見表1:
————————————————————————
* 瀘州市社科聯2015年哲學社會科學研究規劃項目(LZ15A17)、四川省教育廳2014年度科學研究計劃項目(14ZB0397)、瀘州職業技術學院2013年度院級科研資助金項目(K-1302)
2.基于動態數據驅動的灰色GM(1,1)新陳代謝模型
定義:設原始序列X(0)=(x(0)(1),x(0)(2),…x(0)(n))。(1)用X(0)=(x(0)(1),x(0)(2),…x(0)(n))建立傳統GM(1,1)模型稱為GM(1,1);(2) ,用X(0)=(x(0)(k0),x(0)(k0+1),…x(0)(n))建立的GM(1,1)模型稱為部分數據GM(1,1)模型;(3)設x(0)(n+1)為最新信息,將x(0)(n+1)加入到X(0)中,再利用X(0)=(x(0)(1),x(0)(2),…x(0)(n+1))建立的GM(1,1)模型稱為新信息GM(1,1);(4)加入最新信息x(0)(n+1),刪除最老的信息x(0)(1),將這個過程稱為新陳代謝。利用新陳代謝理論和數據X(0)=(x(0)(2),x(0)(3),…x(0)(n+1))建立的GM(1,1)模型稱為基于動態數據驅動的灰色GM(1,1)新陳代謝模型。
該模型隨著舊的數據刪除,新的數據加入,數據序列得到不斷更新,雖然數據總量和建模方法未發生變化,但是在新舊數據的更換過程中使得數據特征發生量變甚至質變,新形成的數據序列更能反映當前數據的特征,因此新陳代謝方法是可行的。根據灰色GM(1,1)模型中的步驟進行,利用Matlab7.0編程可得預測數據,預測結果見表1。
3.線性回歸模型
為與其他預測效果進行比較,利用Eviews5.0軟件建立自回歸AR模型,該模型為線性模型,其參數估計方法為普通的最小二乘法。預測結果見表2。
X(t)=104.6622621+0.7883649588*X(t-1)+εt,t=2,…199。
X(t)為原始數據t時刻數據,εt為隨機擾動項。
4.神經網絡模型
神經網絡模型是利用某種連接方法將各信息處理部分連接為一個計算系統,該系統對進入的信息進行處理,通過處理后的信息模擬類似人腦的神經網絡。使用該模型網絡對信息進行分析和建模。該神經網絡模型具有較高的非線性擬合能力和良好的泛化能力,對非線性數據具有較高的擬合度。瀘州市空氣質量指數數據有非線性特征,故采用三層BP神經網絡模型對其擬合和預測,預測結果見表1。BP神經網絡模型調用格式如下:net=newff([-11;-11],[2,5],{'tansig','pureline'},'trainbr','learngdm','msereg')
三 預測結果比較和結論
1.預測結果
用均方誤差和平均絕對百分比誤差來分析模型預測效果,預測結果及比較見表1。
表1 各模型預測結果
日期真值線性模型BP神經網絡模型GM(1,1)模型新陳代謝GM(1,1)模型
6.207088777373
6.217391817272
6.225094837271
6.234996867269
6.245598897268
6.255399697167
6.2655101737166
6.2762101767165
6.2869102807164
6.2968103837063
表2 預測效果比較
MSE38.352322.020414.074811.8152
MAPE64.510134.778521.091217.7961
2.結論
第一,因原始數據成非線性特征,若采用線性模型進行擬合預測,會造成建模偏差,使得預測誤差加大,甚至失去可靠性。第二,在采用BP神經網絡模型進行建模預測時,考慮了數據的非線性特征,預測精度優于線性模型。但受數據量較小的影響,神經網絡建立不夠完善,因此此模型預測精度較基于動態數據驅動的灰色GM(1,1)新陳代謝模型預測精度較差。第三,在利用基于動態數據驅動的灰色GM(1,1)新陳代謝模型建模過程中既考慮了數據的實時更新,又能將老的信息及時刪除并增加新信息在系統中,盡量讓建模數據充分反映數據的最新特征,其預測精度優于線性模型、BP神經網絡模型及GM(1,1)模型。第四,使用基于動態數據驅動的灰色GM(1,1)新陳代謝模型對瀘州市空氣質量指數進行動態預測分析,可以及時掌握空氣質量指數的變化,根據預測數據采取相應措施應對環境的變化。
參考文獻
[1]鄧聚龍.灰色理論基礎[M].武漢:華中科技大學出版社,2002
[2]李夢梅、朱家明、楊光等.西安市環境空氣質量評價與預測[J].貴州師范學院學報,2014(3):11~15
[3]張延利、張德生、井霞霞等.基于無偏灰色馬爾科夫模型的人民幣/美元匯率短期預測模型[J].陜西科技大學學報(自然科學版),2011(6):135~139
[4]楊建剛、儲慶中.對人工智能未來發展的幾點思考[J].甘肅科技縱,2006(6):125~126
[5]王夢冬.人民幣匯率短期組合預測研究[D].天津大學,2008
〔責任編輯:林勁〕