陳志文 劉立



摘要??? 自進入工業化社會以來,空氣污染逐漸成為全球最大的環境問題之一。空氣中的懸浮粒子對人類身體健康產生有害影響,減少空氣污染的重要前提就是預測PM2.5的濃度。因此,對大氣質量污染的監測以及預測研究顯得尤為重要。本文采用openstack云計算組件,部署了大數據平臺,通過歷史數據加實時抓取的數據來完善BP神經網絡,以實現自我學習來提高預測數據的準確度。
【關鍵詞】PM2.5 云計算 BP神經網絡 預測
1 引言
空氣污染是全球最大的環境問題之一。空氣污染涉及若干因素,包括工廠產生的大量有毒氣體、車輛的尾氣、農作物的焚燒以及火災等,其中主要成分包括CO、SO2、O3、NO2。空氣污染是對人類健康的嚴重威脅,會導致嚴重的呼吸道疾病和皮膚病,如肺部、呼吸系統病變、哮喘等,甚至引起死亡,所以對空氣質量污染的監測以及預測研究顯得特別重要。
國內許多學者在空氣質量預測等方面做了大量的研究工作。王燦星等人構建了BP神經網絡對空氣中顆粒物進行研究,能得到較高的預測精度;秦霞提出了一種用貝葉斯歸一化訓練算法訓練改進的BP預報模型;李龍提出了一種基于與PM2.5濃度相關性較強的因素組成特征向量的最小二乘支持向量機預測模型,該模型有較準確地預測精度,泛化能力也較強;HuangM構建了一種新的基于數據挖掘和人工神經網絡的空氣污染預測模型,該模型在天氣嚴重污染時預測準確率高,中度污染及以下準確率接近;唐曉城提出一種基于BP神經網絡改進算法的大氣污染預測模型,較大的提高了預測準確率;TianJ采用模糊C-均值聚類算法(FCM)對空氣質量監測的原始數據進行分類,通過對數據的仿真訓練,建立了預測空氣質量水平的BP神經網絡模型。
由于PM2.5的形成因素比較多而復雜,因此全面對它進行準確實時的預測比較困難,當前存在的主要問題包括:
(1)模型比較復雜,計算量較大;
(2)實時數據難以獲取,隨時間與地點發生極大的變化。
眾多專家雖然構建了各類模型對其變化進行預測,但在實時性與精確性難以同時得到保證。本文以openstack云計算組件為平臺,以網絡爬蟲為實時數據獲取手段,以三層神經網絡為核心算法,構建出基于云計算的PM2.5監控系統,為PM2.5的預測提供參考。
2 BP神經網絡
BP網絡的學習算法就是BP算法,又叫δ算法。此算法的一個簡單模型是三層BP神經網絡,由輸入層、隱含層和輸出層構成。以此為例,當網絡輸出和期望輸出不等時,存在輸出誤差E,定義如下:
將運算結果代入至輸入層,則:
從上述變化能夠得出,BP神經網絡的輸入誤差是關于和uij的函數,改變這兩個函數的大小就可調整誤差E。為了使預測結果及輸出數據更接近真實數據,及減小誤差,應使權值和誤差的梯度下降成正比,即
BP神經網絡算法中,各層權值調整公式原理都是一樣的,均由學習率η、本層輸出的誤差信號δ和本層輸入信號Y組成。為簡化計算,本文采用最簡單的三層神經網絡。從中國氣象局網站爬取上海、北京、武漢等十個城市的天氣數據,以各城市不同時間點的pm2.5、風速、溫度以及濕度的四個指標作為輸入數據構成輸入層,輸出層數據則為該城市的pm2.5預測值。
3 系統實現
本文采用openstack云計算組件,通過openstack的sahara部署大數據平臺spark1.6,通過歷史數據加實時抓取的數據來完善BP神經網絡。由于影響PM2.5的突發不可控因素比較多,如突發火災,焚燒秸稈等,所以選擇了方差貢獻率最高的且可獲取資源的前日PM2.5的濃度、風速、溫度、濕度為輸入因子,如表1輸入因子所示。
通過BP神經網絡的自我學習來調整層與層之間的權值和閾值,抓取有效數據來不斷完善正確率。系統獲取當前時間點的PM2.5濃度數據,對當前時間的空氣情況進行分析,并繪制最近十二小時的PM2.5濃度趨勢圖。預測結果頁面如圖1所示,本系統演示界面如圖2所示。
4 結論
本文根據氣象站的資料,設計并實現了一套基于云計算平臺的PM2.5監控系統,以預測霧霾的實時性變化。該研究能實時抓取數據并進行精確預測。研究的主要局限性之一是:預測模型比較簡單,因此在預測精度上有一定的不足。
參考文獻
[1]?王燦星,祁國偉,何曦等.BP神經網絡用于大氣中顆粒物(TSP)預測的研究[J].儀器儀表學報,2003,24(z2):539-540.
[2]?秦俠,雷蕾,姚小麗等.大氣污染預測中提高BP網絡泛化能力的方法[J].北京工業大學學報,2007,33(08):849-852.
[3]?李龍,馬磊,賀建峰等.基于特征向量的最小二乘支持向量機PM2.5濃度預測模型[J].計算機應用,2014,34(08):2212-2216.
[4]HuangM,ZhangT,WangJ,etal.Anewairqualityforecastingmode1usingdataminingandartificialneuralnetwork[C].IEEEInternationalConferenceonSoftwareEngineeringandServiceScience.IEEE,2015:259-262.
[5]唐曉城.基于BP神經網絡改進算法的大氣污染預測模型[J].河南科技學院學報(自然科學版),2018(01).
[6]TianJ,FanZ,SunL.PredictionandanalysisforairqualitybasedonBPNeuralNetwork[J].JournalofUniversityofScience&Technology.Liaoning,2015.