何曉云 羅澤蓉 李明悅 李亞斌 趙盛萍
摘 要:隨著社會的進步,我國空氣質量指數日益下降,一氧化碳、顆粒物、臭氧等是影響最嚴重的大氣污染物,且它們已經成為檢測空氣質量品質的重要參數,對這些空氣質量參數的監控和預測已變得尤為重要。BP神經網絡對非線性系統函數有良好的逼近能力,符合我們對空氣質量建模的實際要求。本文選擇BP網絡進行建模,以空氣中幾種主要污染物為輸入,AQI參數作為輸出。并結合實際情況進行了引入時間參量和引入動量因子兩種優化方法。經過仿真論證,優化后的模型擬合度更好,收斂速度更快。
關鍵詞:BP網絡;自適應學習;動量因子;神經網絡改進
DOI:10.16640/j.cnki.37-1222/t.2018.17.210
1 引言
人工神經網絡,是根據生物神經網絡而來的一種可以處理信息的仿真模擬,它是由很多的人工神經元以某種規則銜接成人工神經網絡,神經網絡對訓練過的數據有存儲的功能,只要是訓練過的數據,便可以自動生成一個訓練模式,具備很高的自適應性。因為網絡具有較好的獨立處理數據的能力,網絡實用性十分地強。神經網絡對信息的處理具備諸多的優點,便于應用各個領域,因此人工神經網絡廣泛應用在計算機科學、模式識別技術、人工智能控制等領域[1-3]。
2 BP神經網絡介紹
BP神經網絡是最常用的一種網絡模型。標準的BP神經網絡通過不斷修正網絡的權值和閾值,從而使網絡達到優化的目的。BP神經網絡,又稱前饋型網絡,主要依靠輸入信號(空氣中的幾種主要污染物)的正向傳播,和誤差的反向傳遞來進行優化建模。
3 BP算法的空氣質量建模
本文用到的數據來自“中國空氣質量在線監測分析“平臺,數據類型。選擇2016年成都的空氣質量情況為依據,建立成都的空氣質量數據庫,隨機選擇260天的空氣質量為訓練樣本,剩下的空氣質量為測試樣本,輸入變量時六種大氣污染物,分別是顆粒物PM10和PM2.5、SO2、NO2、O3、CO等,輸出變量是空氣質量AQI,AQI也是代表空氣質量好壞的一個綜合性因素。
(1)參數的分析與選擇。在《環境空氣質量標準》中,明確說明了顆粒物PM10和PM2.5、SO2、NO2、O3、CO等是需要我們檢測的大氣污染物,所以每個參數都有重要的意義:顆粒物PM10和PM2.5對造成霧霾天氣有重要的影響;PM10,是可吸入顆粒物,影響著人體的健康;臭氧(O3),有著消毒、殺菌的效果,但是過量就會對人體有害;二氧化硫,在高濃度時人甚至會出現潰瘍直至窒息死亡,還可以形成酸雨。一氧化碳,是約占大氣百分之三十的污染物,如果濃度過高,還會危害人體的心臟、神經系統的功能;NO2,是棕紅色的顏色,會快速破壞肺細胞,可能造成肺氣腫、哮喘病和肺癌。
因此,在對空氣質量進行建模的過程中,選擇PM10和PM2.5、SO2、NO2、O3、CO這六個參數作為模型的輸入變量,空氣質量AQI作為模型的輸出進行建模。
(2)數據的處理。歸一化:利用相應的公式把樣本數據限制在規定的區間內。本文里的數據都限制在了(0 1)之間。可以使神經網絡的收斂性變好。所用公式如下:
在公式中,數據庫樣本的最大值用max表示,樣本數據的最小值用min表示。X為歸一化后的數據。
3.1 BP網絡仿真訓練
隨機選擇數據庫中260天的空氣質量數據作為訓練樣本,一年中其他的104天的空氣質量作為測試樣本,首先建立以PM10和PM2.5、SO2、NO2、O3、CO這六個參數為輸入的六輸入、單輸出的網絡拓撲結構如下圖:
得到模型訓練結果:
通過分析訓練誤差圖和擬合結果圖,可以看出該模型的訓練誤差下降較快,第1000步訓練完成時誤差為0.01,平均誤差為0.639,預測值基本跟蹤實際值。
3.2 加入時間參量的模型優化
考慮到成都各個季節的氣溫、風量、雨量的變化對空氣質量的變化可能有較大的影響,本文考慮加入月份作為模型的輸入,建立7個輸入變量,一個輸出變量BP網絡模型,來提高模型的準確性。得到的仿真結果如圖3、圖4所示。
藍色的點表示預測的空氣質量AQI值,紅色的點表示實際的空氣質量AQI值,經驗證,沒有增加月份的影響時的的平均誤差為0.0639,增加月份后的平均誤差為0.428,可見增加月份作為輸入參數后,模型的準確性得到了提高。
不難理解,因為不同的季節,不同的月份,空氣質量的品質可能會有差異。
3.3 引入動量因子的模型優化
引入動量項的改進,可以近似使用最速下降法得到權值在空間中的軌跡。在學習中,η越小,權值的改變量就越小,軌跡也可以變的更光滑。在BP網絡中,引入動量項后,就可以有效的改變步長η,使它不再是一個恒定的值。相當于加入了一個擾動,可以自動的調節著步長,并向著平均方向改變,所以動量項起到了加快收斂速度的效果[7]。
加入動量因子后的更新公式:
w(n0+1)=w(n0)+ η(n0)d(n0)+w(n0)
其中:
d(n0)=
w(n0)=w(n0)-w(n0-1)=η(n0-1)d(n0-1)
這是,權值修正量已經加入了修改的記憶方向,動量因子的選取一般是0.1-0.8。
同樣以成都的空氣質量參數為例進行建模,隨機選擇260天的空氣質量作為訓練樣本,一年中其它幾天的104個空氣質量作為測試樣本,加入了動量項,標準的BP算法采用的訓練方法traingd,改進是加入動量項,所以訓練函數變成了traingdx,它是引入了動量項的具有自適應的學習方法,可以自動的調整學習步長。進行建模,得到的結果如圖5、圖6所示。
通過分析訓練誤差圖和擬合結果圖,可以看出該模型的訓練誤差下降較快,第858步訓練完成時誤差為0.001,收斂速度變快了,平均誤差為0.0322,預測值基本跟蹤實際值。
4 結論
在大量的實際應用中,標準BP算法存在收斂速率慢、學習步長固定、網絡不穩定,甚至會達不到網絡收斂精度的要求,本文也主要根據BP算法的局限性,從而展開對空氣質量的建模分析。所以在本文中,加入了動量項,對BP算法進行了改進,從而使BP算法的迭代次數變少,也減小了誤差,最終優化了網絡,提高了BP算法的品質。從上面可以看出在沒有改進前,BP神經網絡的訓練函數用的是梯度下降法traingd,收斂速度很慢。所以,這里引入了優化網絡的改進方法,加入動量項,也改變了訓練函數,它是帶有動量項的自適應學習算法traingdx,可以自動的調整學習步長。
經過仿真對比,得出加入動量項改進BP網絡后,模型的收斂效果明顯變好了,網絡的誤差平方和也變小了,所以平均誤差也減小了,使得網絡的擬合能力也大大地提高了,提升了網絡的品質。
參考文獻:
[1]曹曉強,劉勝榮,黃學敏.空氣質量評價智能信息處理技術的研究[J].微計算機信息,2008(13):1-3.
[2]胡輝,謝靜,侯祺棕,李湘男,徐雙慶.城區大氣污染物——NO_X濃度預測預報模式研究[J].城市環境與城市生態,2002(01):11-16.
[3]楊文東.大氣環境質量評價的模糊綜合評判法[J].武漢理工大學學報,2001(12):7-13.
[4]裴詠.淺析幾種環境空氣質量評價方法的優缺點[J].遼寧教育學院學報,2001(09):8-16.
[5]郝新波.環境影響評價與可持續發展芻議[J].科技情報開發與經濟,2000(04):8-17.
[6]Arti3.Advances in Environmental Research[J].ElsevierScience,1997(04):5-11.
[7]C.L.M.Harnold,K.Y.Lee.Free-model Based Adaptive Inverse Neuro-controller for Dynamic Systems[C].The 37th IEEE Conference on Decision and Control,Tampa,Florida,1998:507-512.