
能源工業(yè)和交通運輸業(yè)作為中國經(jīng)濟發(fā)展的支柱產(chǎn)業(yè),在生產(chǎn)作業(yè)過程中會產(chǎn)生大量污染物。這些污染物對于環(huán)境的危害尤為突出,其中首要污染物為顆粒物( PM2.5 和 PM10 )。因此,對大氣中的顆粒物濃度進行監(jiān)測是很有必要的。國內(nèi)外現(xiàn)有空氣污染統(tǒng)計模型有三類:基于傳統(tǒng)統(tǒng)計方法的統(tǒng)計模型[1-2]學習數(shù)據(jù)模式的機器學習模型[3-4]以及利用多層神經(jīng)網(wǎng)絡(luò)學習復雜特征的深度學習模型[5-6]。針對這一問題,現(xiàn)有的深度學習模型在預測顆粒物濃度時,具有穩(wěn)定性差、準確性低的情況[7],基于本文提出的CNN-BiLSTM-Attention模型,綜合考慮空間、時間和氣象因素的影響,為我國揭示空氣污染物濃度變化規(guī)律,提前預測診斷污染狀況,為我國環(huán)保部門應對大氣污染提供量化參考。
1 研究方法
1.1 卷積神經(jīng)網(wǎng)絡(luò)(CNN)
假設(shè)預測模型輸入為
,其包括過去的氣象數(shù)據(jù)、大氣污染物濃度,計算公式:

1.2 BiLSTM模型
考慮到預測受到前后時刻輸人的綜合影響,采用了雙向長短期記憶網(wǎng)絡(luò)(BiLSTM)[8],門控定義的數(shù)學表達式可以用如下公式表示:
g(x)=σ(Wx+b)
式中, X 為輸入矩陣, Y 為輸出的特征矩陣, c 是卷積核數(shù)量, W 表示卷積核的權(quán)重矩陣, b1 表示偏置 ,f 代表激活函數(shù)的作用。
1.3 CNN-BiLSTM-Attention模型
本研究考慮了遼寧省各市監(jiān)測站站點的空氣質(zhì)量和氣象時序數(shù)據(jù)中的信息記憶、存儲與傳遞,以及氣象因素與 PM2.5 和 PM10 濃度的相關(guān)性,設(shè)計了CNN-BiLSTM-Attention模型。利用了CNN優(yōu)秀的空間特征提取能力,之后引入了BiLSTM,更好地分析過去不同時間點的特征狀態(tài)對顆粒物濃度的影響程度[8]。最后加入注意力機制,給定查詢向量Q ,鍵向量集合
,值向量集合
,
,鍵向量的維度 d?K ,該部分計算過程可以用如下方式表示:

式中:Attention,表示注意力權(quán)重向量; T 表示輸入序列維度。
2 實驗結(jié)果與分析
2.1 相關(guān)性分析
為研究 PM2.5 和 PM10 與氣象因子之間存在的相關(guān)性,考慮空氣溫度、露點溫度、氣壓、降水量、風速、風力等級等因素。總體而言,顆粒物與氣象因子之間的相關(guān)性較弱,相關(guān)系數(shù)通常低于0.5,見圖1。

2.2 模型評估
本文分析了LSTM模型,CNN模型與CNN-BiLSTM-Attention模型預測結(jié)果與真實值之間的差距,見圖2。


研究使用的評價指標為平均絕對百分比誤差(MAPE)均方根誤差(RMSE)和擬合優(yōu)度 (R2) 。CNN-BiLSTM-Attention模型在 PM2.5 和 PM10 濃度預測中表現(xiàn)最好,且對直徑越小的顆粒物預測效果越好,詳見表1、表2。

3結(jié)論
基于LSTM模型進行優(yōu)化得到CNN-BiLSTM-Attention模型對遼寧省大氣顆粒物濃度進行了預測,得出以下結(jié)論:
(1)CNN-BiLSTM-Attention模型提取了空間特征與雙向時序信息,與LSTM模型,CNN模型進行對比,該模型評估效果更好,預測精度更高。
(2)利用皮爾遜相關(guān)性分析法分析了顆粒物濃度與氣象因子之間的相關(guān)性,但由于部分氣象相關(guān)數(shù)據(jù)過于不完整、不均衡等,這將對模型的預測帶來不確定性,因此尋找更好的數(shù)據(jù)處理方法,是以后預測研究的重點。
參考文獻:
[1]魏書禾.基于三次指數(shù)平滑法對太原市空氣質(zhì)量的預測[J].科教導刊(下旬),2019(27):167-169.
[2]高曉輝.灰色指數(shù)平滑模型及其在空氣質(zhì)量預測中的應用[D].邯鄲:河北工程大學,2019
[3]任才溶,謝剛.基于隨機森林和氣象參數(shù)的 PM2.5 濃度等級預測[J].計算機工程與應用,2019,55(2):213-220.
[4]孔宇,王海起,張浩然,等.基于集成學習算法的 PM2.5 濃度值預測[J].環(huán)境保護科學,2021,47(4):17-23.
[5]趙文芳,林潤生,唐偉,等.基于深度學習的 PM2,5 短期預測模型[J].南京師大學報(自然科學版),2019,42(3):32-41.
[6]趙文怡,夏麗莎,高廣闊,等.基于加權(quán)KNN-BO神經(jīng)網(wǎng)絡(luò)的 PM2,5 濃度預測模型研究[J].環(huán)境工程技術(shù)學報,2019,9(1):14-18.
[7]劉杰,楊鵬,呂文生,等.基于氣象因素的 PM2,5 質(zhì)量濃度預測模型[J].山東大學學報(工學版),2015,45(6):76-83.
[8]于伸庭,劉萍.基于長短期記憶網(wǎng)絡(luò)-卷積神經(jīng)網(wǎng)絡(luò)(LSTM-CNN)的北京市 PM2.5 濃度預測[J].環(huán)境工程,2020,38(6) :176-180.