于秀麗
(大連海洋大學 遼寧 大連 116023)
環境問題一直以來都是世界各國關注的焦點,大氣污染影響著人類的身心健康,是生態文明的根源,影響著社會可持續發展。區域大氣環境質量問題是我國經濟發展中出現的重要問題,許多學者都開始對此進行關注。[1]PM2.5對人類健康和大氣環境質量影響十分嚴重,建立可靠的空氣污染預測預警系統,為決策部門控制污染物排放提供參考,對于保護人們的身體健康和促進社會的和諧穩定具有重要的科學價值和實際意義。
目前,國內外學者對大氣污染預測的研究主要是對空氣質量指數(Air Quality Index,AQI)的研究,尤其集中在以PM2.5為主的污染物濃度預測。Vlachogianni等利用多元線性回歸對不同地區的NOx和PM10濃度進行研究,檢驗了由于不同氣候條件而導致的模型預測能力變化,[2]練秀緣結合時間序列模型和多元回歸理論對PM2.5建模預測研究;[3]Wu等人研究了日常城市空氣質量預測的問題,通過對變分模式子序列進行重組解決過度分解的問題;[4]Wang等人研究了一種基于L1范式的空氣質量預測問題,使用多跟蹤器優化算法參數確定最終的預測結果;[5]羅宏遠等人提出了基于二層分解技術和改進極限學習機模型的PM2.5濃度預測方法,融合了模態分解技術以及差分演化算法優化。[6]上述模型針對多特征共同作用的常規性大氣污染,雖然也能滿足對空氣質量預測的要求,預測模型可以顯著提高PM2.5濃度的預測精度,但計算過程相對比較復雜,尤其針對由單特征顯著主導的突發性大氣污染時,融合模型需要進一步探索。本文聚焦沿海區域火災煙塵排放數據,融合氣象信息,探索該排放對周圍居民空氣質量預測的影響。在王旭坪等[7]的研究基礎上,選用高斯煙羽模型求解PM2.5的污染擴散,利用蟻群神經網絡模型進行預測問題討論,并用具體的監測數據對模型進行了驗證,結果表明模型能夠完成對該地區的污染預測分析。
針對沿海區域突發性大氣污染,以火災為例探索如何以特征信息為核心,通過特征融合的不斷創新以最大限度捕捉信息,獲取較大的預測進展以及較好的預測精度。
依據《環境空氣質量標準(GB3095-2012)》中的AQI計算方法:第一步是比較各項污染物的分級濃度限值,分別計算得出空氣質量分指數(IAQI);第二步是從各項污染物的IAQI中選擇最大值,并將其確定為AQI,當AQI大于50時,IAQI最大的污染物被確定為首要污染物。由此可知,當園區發生火災、泄漏等事件引起的大氣污染時,由于首要污染物的顯著性擴散,其IAQI將直接決定周圍的空氣質量指數。
因此,本文針對突發性園區大氣污染設計特征處理的方法,分析大氣污染的特征變量,針對由單特征顯著主導的突發性大氣污染情況,分析單特征污染物的擴散結果,結合高斯擴散模型和神經網絡模型,實現大氣污染影響預測。該方法根據沿海區域突發性大氣污染的特征,建立融合準則,并在此基礎上選擇或修正模型形成最佳的特征融合方案,從而有效提高預測質量。
沿海區域內火災雖然不是最嚴重的環境突發事件,但卻是最常見的,火災的發生通常會伴隨大量的煙塵、一氧化碳、熱(溫度)、光(火焰)等,如果通過火災把有毒物質泄漏到大氣環境中或是水中,對沿海生態環境的破壞是非常嚴重的。因此,識別園區火災發生后的隱患,為決策者提供技術支撐,降低發生重大環境污染事件的可能性,保障沿海生態環境更加有其重要的實際意義。
火災發生時,物質在燃燒過程中產生的大量煙塵,成為對大氣影響主要的因素,對周圍環境產生不利影響。在此將煙塵(PM2.5)作為顯著單特征,事故現場被視為污染源,研究這一時期大氣污染物的擴散和濃度分布時,選擇高斯煙羽模型進行解釋,計算事故發生后釋放的煙塵物質擴散對周圍環境的影響,對園區周圍監測點位的空氣質量指數進行預測。假設所有影響物質擴散的因素變量是恒定不變的,并且物質在擴散過程中不會發生任何根本性的變化,定義Kx、Ky、Kz分別為x、y、z方向上的湍流擴散系數,將x軸表示為物質的流動方向,根據擴散微分方程化簡得到:
高斯煙羽公式
(1)
其中,C(x, y, z)表示地點(x, y, z)處的物質濃度,(x0,y0,0)為煙羽中心坐標,σx、σy、σz分別表示x, y, z方向上的擴散系數,Q代表整個過程中物質的排放量。
一般情況下,污染物質的產生是在某一時段內連續地排放,因此以高斯煙羽為基礎,將T時段內多個地點排放的污染物質看作是在點(x, y, z)處多個時間點產生的疊加。根據此假設,得出一種新的擴散模式:
可得擴散濃度公式:
(2)
通常計算,取σx=σy=γ1Xα1,σz=γ2Xα2。在確定穩定度后,取樣時間在30分鐘以內,根據橫向、垂直擴散參數冪函數表達式數據,選取有風條件下的擴散參數σy、σz。
本研究中,SO2質量指數、NO2質量指數、CO質量指數、O3質量指數等均來自當地環境監測站空氣質量日報數據中心,風速、大氣壓和溫度均來自氣象局,如表1所示。

表1 當地空氣和氣象數據采集
確定穩定度后,取樣時間在30分鐘以內時,根據有風條件下的擴散參數σy、σz,假設突發火災區域為20m*20m*1m的空間,則根據火災發生當前PM2.5的濃度值,可以得到Q=0.27*105,風速u為研究日的當天風速,監測點位距離著火源1km,PM2.5的濃度突然增值兩倍,繼而高斯擴散模型求出2019年4月21日的火災。因倉庫木質材料起火,面積約400m2,可燃氣體增加了PM2.5在空氣中的濃度,進入大氣造成大氣污染。發生擴散數小時后,距離火災發生地1km外的沿海核心居民生活區監測點的PM2.5污染濃度值,如2所示。

表2 PM2.5污染擴散的計算結果
對于火災擴散引起的突發性大氣污染,與以往的常規性空氣污染預報系統相比,其內部結構更加精簡化,分析單特征污染物的擴散結果,在一定程度上縮短了火災擴散信息的獲取時間,提高了預測環節的效率。比較PM2.5污染擴散情況與當天監測點位的實際檢測指數,與實測PM2.5走勢基本一致。表明污染擴散模型具有良好的擬合效果,基本能夠描述實際PM2.5污染物的產生和擴散。
對污染特征的選取問題,若特征參量選取合理有效,系統識別處理信息的正確率就高。討論火災煙塵的擴散對大氣環境的影響, PM2.5的演變和其它污染物以及氣象條件有直接關系,所以將SO2、NO2、CO、O3、風速、大氣壓和溫度這7個特征參量也納入特征參量的集合,判斷當前沿海區域待監測環境中發生污染存在的概率,y為空氣質量指數(無污染、輕微污染、輕度污染、中度污染、重度污染和嚴重污染等),作為預測的輸出結果。采用三層前饋BP神經網絡進行網絡參數的訓練,建立BP神經網絡結構,如圖1所示。

圖1 BP神經網絡結構
上圖中BP神經網絡有八個輸入節點xi,分別表示PM2.5濃度、CO濃度、…、溫度大小,每一個輸入層節點對應一個傳感器信號,ωik表示輸入層節點i到隱藏層節點k的連接權值,ωko表示隱藏層節點k與輸出層節點o的連接權值,yo表示網絡的輸出層節點。由于BP神經網絡的局部極小、收斂速度慢等問題,通過蟻群算法為BP神經網絡的初始權值和閾值尋優,經過合理選取蟻群模型參數,利用最佳的權值和閾值組合來優化BP神經網絡性能,加快算法收斂速度,提高預測精度。
通過PM2.5、SO2、NO2、CO、O3、風速、大氣壓和溫度共8個自變量數據來預測對應的空氣質量等級。針對不同的機器學習算法,本質是在不同的數據空間觀測數據,根據自身算法規則構建相應模型。預測結果通過擬合優度(R2)進行評測,擬合優度R2的值越接近1,說明回歸對觀測值的擬合程度越好。不同模型的R2在數據集的表現如圖2所示。

圖2 多種機器學習算法在R2的表現
結果發現,神經網絡擬合優度的值最接近1,預測效果最優。選擇3層BP神經網絡進行仿真分析,按照經驗公式并經反復訓練調試。誤差收斂因子為0.00001,學習率為0.1,為使神經網絡獲得更好的預測效果,選擇合理的蟻群模型,調整神經網絡的權重和偏置參數,進行網絡的有效訓練,蟻群算法的參數為信息素強度Q=0.1,信息素揮發系數ρ=0.05,螞蟻數h=20,最大優化次數10。獲得最優個體,并將最優個體解作為BP網絡的初始權值和閾值,在此基礎上進行網絡訓練。將預測值和實際值進行比較,可得出BP神經網絡的訓練誤差曲線及蟻群神經網絡訓練誤差,結果表明,蟻群神經網絡模型具有較高的預測精度,實際值與預測值的曲線趨勢如圖3所示。

從給出的圖結果可以看出,ACO-BP的曲線擬合效果優于BP神經網絡,ACO-BP模型建立的可靠性和可信性水平較高,能夠解決和說明實際問題。兩種方法對比情況如表3所示。

表3 BP網絡算法和ACO-BP算法的比較
輸出結果表明,蟻群神經網絡的輸出誤差較小,說明蟻群神經網絡能有效地提高BP神經網絡的收斂速度,同時克服了陷入局部極小值的缺陷,顯著提高了預測精度,證明了算法的可行性和有效性。
針對單特征顯著主導的突發性大氣污染情況,分析單特征污染物的擴散結果,然后基于特征融合模型預測污染影響,從而有效提高預測質量。研究首先采用高斯模型對PM2.5的擴散趨勢進行預測,并計算出PM2.5的污染擴散范圍;而后,結合氣象因素及其它空氣污染物對PM2.5濃度的影響,構建一個空氣質量指數的演變模型,通過蟻群神經網絡完成對沿海區域的污染影響預測,最后用監測點的數據對模型進行驗證。結果表明,模型能夠完成對該地區的污染預測分析。通過研究發現,高斯煙羽模型可以很好地擬合PM2.5的擴散規律,但由于擴散本身是一個非常復雜的問題,因此模型的適應范圍仍需要進一步研究。例如,擴大其應用范圍,考慮更多的因素對模型進行適度改進,以獲得更好的模擬效果,解決更多的實際問題。