馬宗禾,駱哲文,孫 鐸,劉子炎,楊睿誠
(武漢理工大學,湖北 武漢 430070)
野火通常發(fā)生在農(nóng)村地區(qū)或山區(qū),監(jiān)測站點數(shù)量有限且分布不均,因而難以實現(xiàn)整個火災區(qū)域PM2.5的擴散方式和傳輸特性等研究?;诜抡娴拇髿饪諝赓|(zhì)量模式預報在空間上具有連續(xù)覆蓋性,但分辨率較低,結(jié)果誤差較大。另外,野火PM2.5有高濃度高度變化的特點,現(xiàn)有的統(tǒng)計模型對于PM2.5-AOD的關(guān)系在時間和空間上無法完全解釋變化。
為解決現(xiàn)有野火PM2.5測算野火熱輻射高、易受風影響的難點,引入哨兵二號影像、風向等新變量;另一方面,采用機器學習算法,使用高分辨率AOD數(shù)據(jù),對野火PM2.5進行遙感反演,以期來填補高濃度PM2.5的估算領(lǐng)域的空白并嘗試提高最終PM2.5反演結(jié)果的精度。
2019年9月以來澳大利亞東海岸森林火災引起國際社會廣泛關(guān)注,其產(chǎn)生的大量野火煙霧已環(huán)繞地球半周。因此,亟需高分辨率野火PM2.5濃度數(shù)據(jù)為環(huán)境科學、生態(tài)經(jīng)濟發(fā)展提供數(shù)據(jù)支撐,同時對公共衛(wèi)生和流行病學的研究也有重要意義。

圖1
2.2.1 數(shù)據(jù)處理
由于各類數(shù)據(jù)的來源、數(shù)據(jù)類型、空間分辨率不盡相同,要對各類數(shù)據(jù)進行預處理。模型的時間分辨率是24h,所搜集的數(shù)據(jù)大多為每日均值,對于非標準格式的數(shù)據(jù)按照數(shù)學與統(tǒng)計方法進行處理與驗證。
(1)填補AOD缺失:檢查AOD缺失,將Aqua和Terra AOD進行融合,再以AO據(jù)為基準建立一公里格網(wǎng)。
(2)對哨兵2號數(shù)據(jù),計算改進歸一化燃燒指數(shù)(NBRT),分離燃燒區(qū)和非燃燒區(qū)。

式中,NIR波段范圍0.76-0.9μm;SWIR波段范圍2.08-2.35μm;Thermal波段10.4~12.5μm。
接著采用雙線性內(nèi)插方法對其做降尺度處理,再用1*1km格網(wǎng)對其重采樣。
(3)對于MODIS NDVI數(shù)據(jù),因其分辨率比較低,用Aggregation函數(shù)對其進行數(shù)據(jù)整合,保證計算過程是一公里格網(wǎng)的均值。
(4)對每個MODIS火點數(shù)據(jù)創(chuàng)建多級緩沖區(qū),計算每個網(wǎng)格單元MODIS的火點數(shù),以15km緩沖區(qū)進行火點統(tǒng)計。
(5)使用最鄰近分類算法為每個氣象監(jiān)測站點分配氣象字段,從而獲取區(qū)域內(nèi)氣象要素的連續(xù)表面,然后使用反距離加權(quán)方法插值到1*1km網(wǎng)格中。
(6)對于土地利用數(shù)據(jù),以每個PM2.5監(jiān)測站點為中心,建立1*1km的緩沖區(qū),平均森林覆蓋率、高程值、道路長度到緩沖區(qū),并計算每個緩沖區(qū)的人口密度。
(7)對于PM2.5數(shù)據(jù),將某一網(wǎng)格單元內(nèi)所有PM2.5站點同一天的數(shù)據(jù)進行平均后賦值給該網(wǎng)格單元。
(8)對各因子與PM2.5濃度做多變量相關(guān)分析,并計算相關(guān)系數(shù),移除會造成顯著共線性的變量,選取最優(yōu)預測變量。
2.2.2 模型構(gòu)建
剔除了數(shù)據(jù)的缺失值及異常值后,將數(shù)據(jù)集按照7:3的比例隨機劃分為訓練集和測試集。訓練集用于建立模型,測試集用于精度評價。
我們使用隨機森林對訓練集進行構(gòu)建模型。隨機森林具有以下優(yōu)點:運算量小,但預測精度高;可以高效的處理非線性過程;預測結(jié)果對非平衡數(shù)據(jù)和缺失數(shù)據(jù)較穩(wěn)健。我們將預處理后的相關(guān)因子作為模型的特征,監(jiān)測站點的PM2.5濃度作為監(jiān)督值,使用Python的Scikit-Learn模塊的算法訓練。同時幫助我們判斷本研究加入的哨兵2號數(shù)據(jù)、風向數(shù)據(jù)等是否真的提高了模型精度。
2.2.3 模型驗證
用先前劃分的測試集對建立的模型進行驗證,在此階段中,我們采用了模型預測值與地面觀測值之間的決定系0數(shù)(R2)、平均預測誤差(MPE)、均方根預測誤差(RMSE)、相對預測誤差(RPE)等統(tǒng)計指標來對模型擬合與交叉驗證結(jié)果進行比較,從而對模型表現(xiàn)和過度擬合現(xiàn)象進行評估。
2.2.4 模型應用
(1)澳大利亞野火煙霧PM2.5時空特征分析。因為地面監(jiān)測站點的稀疏性,所以僅靠地面監(jiān)測站的數(shù)據(jù)無法得知澳洲森林火災中煙霧PM2.5的整體變化。而我們建立的模型可以反演澳洲野火日均尺度PM2.5的濃度,研究澳洲野火PM2.5濃度的空間分布特征,并對其形成原因進行探討;同時會研究時間變化特征,并基于日時間序列和月均時間序列,分析澳洲野火期間PM2.5污染的時間變化趨勢。
(2)人口野火煙霧PM2.5暴露風險評估。基于建立的模型對火災期間的居民健康風險進行評估。我們將研究期分為以下三個子階段:“火災前”時期,即研究區(qū)域的PM2.5水平正常;“火災中”時期,即研究區(qū)域內(nèi)大多數(shù)AQ站中PM2.5的濃度急劇增加時;“火災后”時期,即PM2.5濃度恢復到正常水平。在不同的時期內(nèi),我們將分別用空氣質(zhì)量濃度、人口暴露強度、人口加權(quán)濃度3種指標來對人口PM2.5暴露風險進行評估。
(3)野火顆粒物與相關(guān)疾病致死率關(guān)系研究。我們將澳大利亞全境范圍的AOD與PM2.5濃度時空分布情況與WHO提供的相關(guān)疾病的致死率健康數(shù)據(jù)結(jié)合,通過反距離權(quán)重(IDW)插值與提取等方法得到澳大利亞森林火災野火顆粒物與相關(guān)疾病致死率關(guān)系,從而對二者的關(guān)系進行分析與研究,為環(huán)境科學、生態(tài)經(jīng)濟發(fā)展提供數(shù)據(jù)支撐,對公共衛(wèi)生和流行病學的研究與決策提供有價值的建議。
由于野火PM2.5相對于城市PM2.5更難估算,傳統(tǒng)的建模變量不夠,本文采用多源數(shù)據(jù)進行PM2.5濃度空間估算,除常用的AOD數(shù)據(jù)、氣象數(shù)據(jù)(相對濕度、風速和行星邊界層)、土地利用數(shù)據(jù)外,引入火點數(shù)據(jù)、哨兵二號數(shù)據(jù)和風向數(shù)據(jù)等輔助數(shù)據(jù)。既利用了AOD數(shù)據(jù)對于PM2.5良好相關(guān)關(guān)系,同時又考慮了野火煙霧所產(chǎn)生的高濃度高度變化的PM2.5難以被有效估算的問題。已有研究表明,風向?qū)τ赑M2.5的分布有重要影響,但由于風向數(shù)據(jù)分析的復雜性,多數(shù)PM2.5濃度估算的研究沒有將其考慮在內(nèi),因此,為了提高結(jié)果數(shù)據(jù)的準確性,加入風向數(shù)據(jù),結(jié)合其他多源數(shù)據(jù)對PM2.5濃度估算的結(jié)果進行對比驗證。
采用1km分辨率的AOD數(shù)據(jù)作為基礎(chǔ),將其他因素數(shù)據(jù)進行重采樣配準到該數(shù)據(jù)上,保證高空間分辨率。MAIAC算法使用時間序列分析并同時處理固定的25*25 km2塊中的像素組,以得出表面雙向反射率分布函數(shù)和氣溶膠參數(shù),顯示出增強的對比局部尺度氣溶膠變化的能力,并提高了云雪探測和氣溶膠檢索的質(zhì)量。
我們對隨機森林算法進行優(yōu)化,解決PM2.5-AOD關(guān)系的時空異質(zhì)性問題,以提高模型的估算精度。對PM2.5人口暴露風險,我們利用隨機森林優(yōu)化模型估算的高精度PM2.5濃度空間分布數(shù)據(jù)進行評估,且利用多指標評價方法從多個角度對澳大利亞的PM2.5人口暴露風險進行評估。該評估方式的可信度高。
2020年7月28日,世界自然基金會(WWF)發(fā)布一份報告,顯示2019年到2020年發(fā)生的澳大利亞叢林大火,造成了近30億只動物死亡或流離失所。面對自19世紀中葉以來最嚴重的火災,數(shù)據(jù)監(jiān)測方法與管理體系在不斷蔓延的火勢面前也顯得不盡人意。因此,針對本次火災的研究不僅具有深刻的現(xiàn)實意義,更是對于澳大利亞與整個國際社會的火災監(jiān)管體系有著深遠影響。我們的研究模型旨在為解決監(jiān)測與反演方法中現(xiàn)存部分缺陷并設(shè)法為相關(guān)監(jiān)管提出輔助決策與分析建議,而研究成果的應用則深化現(xiàn)實意義,在澳大利亞野火煙霧PM2.5時空特征分析、人口野火煙霧PM2.5暴露風險評估、野火顆粒物與相關(guān)疾病致死率關(guān)系研究等方面孵化研究成果。