廖國蓮,曾 鵬,莫雨淳,鄭鳳琴
(1.廣西氣象臺,南寧 530022;2.廣西氣象災(zāi)害防御技術(shù)中心,南寧 530022;3.廣西氣候中心,南寧 530022)
精準(zhǔn)的空氣質(zhì)量預(yù)報是有效應(yīng)對重污染天氣的重要前提和基礎(chǔ)。目前空氣質(zhì)量預(yù)報領(lǐng)域使用的模型主要有統(tǒng)計(jì)模型與數(shù)值模式兩類[1]。常用空氣質(zhì)量預(yù)報統(tǒng)計(jì)模型有回歸模型[2-5]、聚類分析模型[6]、BP神經(jīng)網(wǎng)絡(luò)模型等[7-11]。數(shù)值模式預(yù)報是定量研究大氣污染問題的一種重要手段[12],經(jīng)過數(shù)十年的發(fā)展,國內(nèi)外被廣泛應(yīng)用的空氣質(zhì)量模式能夠較好地模擬區(qū)域大氣污染物濃度的時空分布[13-17],但由于排放源清單的不確定性及物理過程參數(shù)化和化學(xué)機(jī)制極其復(fù)雜,數(shù)值模式的預(yù)報誤差仍較大。以CUACE模式為例,何金梅等[18]指出該模式產(chǎn)品對PM2.5和NO2的等級預(yù)報準(zhǔn)確率不足50%。楊關(guān)盈等[19]發(fā)現(xiàn),CUACE模式對合肥地區(qū)O3濃度的預(yù)報值明顯偏大。李曼等[20]指出,當(dāng)烏魯木齊市污染達(dá)到重度或嚴(yán)重時,CUACE模式預(yù)報效果較差。王曉敏等[21]認(rèn)為,CUACE模式對PM10、PM2.5和SO2濃度的預(yù)報值較實(shí)況明顯偏大。因此,需要結(jié)合統(tǒng)計(jì)方法對模式預(yù)報結(jié)果進(jìn)行客觀訂正,以改進(jìn)污染物濃度預(yù)報,提高空氣質(zhì)量預(yù)報水平。
近年來,很多學(xué)者采用線性回歸、神經(jīng)網(wǎng)絡(luò)、偏最小二乘回歸等統(tǒng)計(jì)方法訂正模式輸出結(jié)果[17,22-26],這些方法可顯著降低模式系統(tǒng)誤差。本文采用線性回歸和神經(jīng)網(wǎng)絡(luò)方法對CUACE 模式空氣質(zhì)量預(yù)報產(chǎn)品進(jìn)行訂正,并比較兩種方法在廣西14個地市的預(yù)報效果,研究基于CUACE模式指導(dǎo)產(chǎn)品的空氣質(zhì)量短期預(yù)報模型,用以提高廣西空氣質(zhì)量預(yù)測水平。
文中所用空氣質(zhì)量實(shí)況監(jiān)測資料來自廣西生態(tài)環(huán)境監(jiān)測中心,包括2016年廣西14個地市6種污染物濃度(SO2、NO2、CO、PM2.5、PM10、O3-8 h)的逐日實(shí)況資料。氣象資料來自廣西氣象信息中心CIMISS數(shù)據(jù)庫,資料包括2015年11月至2016年12月廣西14個地市逐日02時、08時、14時、20時的地面風(fēng)速、氣壓、溫度、相對濕度、露點(diǎn)、總云量、水平能見度資料,以及08時的24 h變壓、24 h累積降水量資料。
CUACE模式空氣質(zhì)量預(yù)報產(chǎn)品來自2016年中國氣象局業(yè)務(wù)化運(yùn)行并下發(fā)的基于CUACE模式的城市6種污染物濃度和AQI指數(shù)預(yù)報指導(dǎo)產(chǎn)品,預(yù)報時效為72 h,文中采用24 h、48 h及72 h 6種污染物濃度的預(yù)報值。
本文利用主成分分析方法(PCA),分析預(yù)報要素(SO2、NO2、CO、PM2.5、PM10、O3-8 h)前期的氣象因素、污染特征和擴(kuò)散條件等相關(guān)預(yù)報因子,選取與預(yù)報要素相關(guān)顯著且方差貢獻(xiàn)大的主成分作為綜合預(yù)報因子。以此為基礎(chǔ),結(jié)合線性回歸和非線性神經(jīng)網(wǎng)絡(luò)方法,建立廣西各地市空氣質(zhì)量統(tǒng)計(jì)預(yù)報模型,并比較神經(jīng)網(wǎng)絡(luò)模型與回歸模型的預(yù)報效果。
大氣污染的形成與前期的污染特征、氣象因素、擴(kuò)散條件及大氣環(huán)流形勢密切相關(guān)。文中選取了前期常規(guī)地面氣象觀測要素、空氣污染物濃度監(jiān)測資料等30個要素作為初選預(yù)報因子:前日20時、當(dāng)日02時、當(dāng)日08時、當(dāng)日14時的地面風(fēng)速、地面氣壓、地面溫度、地面濕度、地面露點(diǎn)、水平能見度資料,前日20時、當(dāng)日08時、當(dāng)日14時的總云量資料,當(dāng)日08時的24 h累積降水量和24 h變壓資料,以及前日某項(xiàng)污染物濃度實(shí)況資料。
先對每一個預(yù)報日每一種污染物前60天的初選預(yù)報因子場作標(biāo)準(zhǔn)化處理,再對這些預(yù)報因子作主成分分解,取累積方差貢獻(xiàn)率大于80%的前n個主成分序列作為最終的預(yù)報因子場。
對經(jīng)過主成分分析所得的前n個主成分序列、空氣質(zhì)量預(yù)報模式產(chǎn)品和對應(yīng)的污染物濃度實(shí)況值,分別動態(tài)建立24 h多元回歸模型和神經(jīng)網(wǎng)絡(luò)模型,把預(yù)報日當(dāng)天24 h的CUACE模式預(yù)報產(chǎn)品及預(yù)報因子場數(shù)據(jù)代入方程,最終計(jì)算得出污染物濃度多元回歸模型和神經(jīng)網(wǎng)絡(luò)模型的24 h預(yù)報值。48 h和72 h的多元回歸和神經(jīng)網(wǎng)絡(luò)預(yù)報模型建立步驟以此類推。本文預(yù)報日為2016年1月1日至2016年12月30日,每一個城市每一個預(yù)報日針對每一種污染物濃度(SO2、NO2、CO、PM2.5、PM10、O3-8 h)分別建立24 h、48 h、72 h的多元回歸預(yù)報模型和神經(jīng)網(wǎng)絡(luò)預(yù)報模型。
圖1為2016年南寧市線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型、CUACE模式O3濃度24 h預(yù)報圖。從圖1可以看到,對于南寧市O3濃度的24 h預(yù)報,CUACE模式預(yù)報值明顯偏低,在O3濃度較高的夏半年,預(yù)報結(jié)果與實(shí)況值有較大的誤差。線性回歸和神經(jīng)網(wǎng)絡(luò)預(yù)報模型的擬合情況與實(shí)況較為接近,但線性回歸預(yù)報產(chǎn)品波動更大。

圖1 2016年南寧市線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型、CUACE模式O3濃度24 h預(yù)報圖
圖2為2016年南寧市線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型、CUACE模式PM10濃度24 h預(yù)報圖。從圖2可知,總體上,3種預(yù)報產(chǎn)品均能預(yù)報出PM10濃度的大致變化,基本能報出每一個污染過程,但1至3月波動較大。

圖2 2016年南寧市線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型、CUACE模式PM10濃度24 h預(yù)報圖
從2016年南寧市線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型、CUACE模式PM2.5濃度24 h預(yù)報圖可知(圖3),3種預(yù)報產(chǎn)品與PM2.5濃度實(shí)況值的變化趨勢較一致。PM2.5濃度24 h預(yù)報同樣存在1至3月波動較大的情況,且該段時間CUACE模式對PM2.5濃度的預(yù)報值大部分偏高,線性回歸對PM2.5濃度的預(yù)報值大部分偏低。

圖3 2016年南寧市線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型、CUACE模式PM2.5濃度24 h預(yù)報圖
3.2.1 O3濃度預(yù)報絕對誤差
圖4為2016年廣西14個地市線性回歸、神經(jīng)網(wǎng)絡(luò)模型和CUACE模式對O3濃度24 h預(yù)報的平均絕對誤差對比圖。由圖4可看出,誤差最大的是CUACE模式對北海的預(yù)報,平均絕對誤差為53.5 μg·m-3。線性回歸和神經(jīng)網(wǎng)絡(luò)模型預(yù)報的平均絕對誤差均明顯小于CUACE模式預(yù)報。梧州和河池這兩個城市的線性回歸模型預(yù)報誤差小于神經(jīng)網(wǎng)絡(luò)模型預(yù)報誤差,而這兩種預(yù)報在柳州和桂林的平均誤差基本一致,在其他地市則是神經(jīng)網(wǎng)絡(luò)模型預(yù)報誤差較小。

圖4 2016年廣西14個地市線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型和CUACE模式對O3濃度24 h預(yù)報的平均絕對誤差對比圖
從2016年廣西14個地市O3濃度48 h預(yù)報的平均絕對誤差對比圖(圖略)可見,線性回歸僅在河池預(yù)報誤差較小,梧州和賀州的線性回歸和神經(jīng)網(wǎng)絡(luò)模型的預(yù)報誤差基本一致,其他城市則是神經(jīng)網(wǎng)絡(luò)模型的預(yù)報誤差較小,而CUACE模式預(yù)報在各地市的預(yù)報性能均不如其他兩種模式的預(yù)報性能。
線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型和CUACE模式對O3濃度72 h預(yù)報的平均絕對誤差對比特征與48 h的基本一致(圖略)。可見對于污染物O3而言,神經(jīng)網(wǎng)絡(luò)模型在24-72 h預(yù)報時次均有著較優(yōu)秀的預(yù)報能力,適合作為廣西大部分地市的空氣質(zhì)量預(yù)報指導(dǎo)產(chǎn)品。
3.2.2 PM10濃度預(yù)報絕對誤差
圖5為2016年廣西14個地市線性回歸、神經(jīng)網(wǎng)絡(luò)模型和CUACE模式對PM10濃度24 h預(yù)報的平均絕對誤差對比圖。由圖5可看出,誤差最大的是CUACE模式對柳州的預(yù)報,絕對誤差為31.4 μg·m-3。線性回歸和神經(jīng)網(wǎng)絡(luò)模型預(yù)報均優(yōu)于CUACE模式預(yù)報;對于河池而言,線性回歸模型預(yù)報誤差小于神經(jīng)網(wǎng)絡(luò)模型預(yù)報誤差,其余城市則是神經(jīng)網(wǎng)絡(luò)模型預(yù)報效果更好。

圖5 2016年廣西14個地市線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型和CUACE模式對PM10濃度24 h預(yù)報的平均絕對誤差對比圖
PM10濃度的48 h預(yù)報,平均絕對誤差最大的是柳州的CUACE模式預(yù)報(圖略)。與CUACE模式預(yù)報相比,線性回歸預(yù)報性能下降,在北海、南寧、玉林和欽州這4個地市其誤差均大于CUACE模式預(yù)報誤差,而神經(jīng)網(wǎng)絡(luò)模型預(yù)報性能在各地市依然較好,適宜作為廣西大部地區(qū)的參考指導(dǎo)產(chǎn)品。
PM10濃度的72 h預(yù)報(圖略),線性回歸預(yù)報的誤差繼續(xù)有所增大,在北海、南寧、玉林、欽州和防城港這5個城市均不如CUACE模式預(yù)報性能。總體而言,對于24-72 h預(yù)報時效,神經(jīng)網(wǎng)絡(luò)模型對PM10濃度的預(yù)報效果穩(wěn)定,有較好的業(yè)務(wù)參考價值。
3.2.3 PM2.5濃度預(yù)報絕對誤差
圖6為2016年廣西14個地市的線性回歸、神經(jīng)網(wǎng)絡(luò)模型和CUACE模式對PM2.5濃度24 h預(yù)報的平均絕對誤差對比圖。由圖6可看出,誤差最大的是CUACE模式對桂林的預(yù)報,絕對誤差為21.3 μg·m-3。通過各城市對比分析可知,除了河池的神經(jīng)網(wǎng)絡(luò)模型預(yù)報誤差大于CUACE模式預(yù)報誤差外,其他城市均是線性回歸和神經(jīng)網(wǎng)絡(luò)模型預(yù)報誤差小于CUACE模式預(yù)報的誤差;對于河池,仍然存在線性回歸模型預(yù)報誤差小于神經(jīng)網(wǎng)絡(luò)模型預(yù)報誤差,其余城市仍是神經(jīng)網(wǎng)絡(luò)模型預(yù)報效果更好。

圖6 2016年廣西14個地市線性回歸模型、神經(jīng)網(wǎng)絡(luò)模型和CUACE模式對PM2.5濃度24 h預(yù)報的平均絕對誤差對比圖
從2016年廣西14個地市PM2.5濃度48 h預(yù)報的平均絕對誤差對比圖(圖略)可知,線性回歸、神經(jīng)網(wǎng)絡(luò)模型和CUACE模式48 h預(yù)報誤差對比特征與24 h的基本一致,仍存在河池線性回歸模型預(yù)報誤差小于神經(jīng)網(wǎng)絡(luò)模型預(yù)報誤差,其余城市仍是神經(jīng)網(wǎng)絡(luò)模型預(yù)報誤差更小。預(yù)報誤差最大的是CUACE模式對柳州和桂林的預(yù)報。
對于河池市,線性回歸、神經(jīng)網(wǎng)絡(luò)模型和CUACE模式對PM2.5濃度72 h預(yù)報的平均絕對誤差相差不大(圖略),而其他地市均是神經(jīng)網(wǎng)絡(luò)模型預(yù)報誤差較小。與24 h及48 h PM2.5濃度預(yù)報相比,線性回歸模型預(yù)報誤差有較明顯增長,在南寧、柳州、玉林、賀州、欽州和防城港線性回歸模型預(yù)報誤差均高于CUACE模式預(yù)報的誤差。
可見對于污染物PM2.5而言,神經(jīng)網(wǎng)絡(luò)模型在24-72 h預(yù)報時次均有著較優(yōu)秀的預(yù)報能力,適合作為廣西各地市預(yù)報的指導(dǎo)產(chǎn)品。
根據(jù)中國氣象局《城市空氣質(zhì)量預(yù)報檢驗(yàn)評估和考核辦法(試行)》的評分內(nèi)容,表1列出2016年廣西14個地市CUACE模式、神經(jīng)網(wǎng)絡(luò)模型、線性回歸模型的預(yù)報評分。從表1可以看出,預(yù)報評分值為57~70,3種模式的預(yù)報效果主要有以下特征:

表1 2016年廣西14個地市CUACE模式、神經(jīng)網(wǎng)絡(luò)模型和線性回歸模型的預(yù)報評分
(1)從預(yù)報地市分析,南寧、崇左、來賓、貴港、賀州這5個地市的神經(jīng)網(wǎng)絡(luò)模型預(yù)報評分最高(24 h),而柳州、梧州、河池、玉林則是線性回歸模型預(yù)報評分最高(24 h),3種模式在北海和百色預(yù)報評分一致,在桂林是CUACE模式預(yù)報和線性回歸模型預(yù)報評分相同,而欽州和防城港則是神經(jīng)網(wǎng)絡(luò)模型和CUACE模式預(yù)報性能一致。
(2)從預(yù)報時效分析,CUACE模式預(yù)報效果最穩(wěn)定,其評分基本不隨預(yù)報時效的延長而明顯降低,變化幅度一般約為0~1分;神經(jīng)網(wǎng)絡(luò)模型的預(yù)報效果在崇左、來賓、梧州、貴港隨預(yù)報時效明顯下降(5~7分),在其他地市變化不大(0~4分);線性回歸模型在來賓、桂林、百色、貴港和賀州等市預(yù)報效果隨時效略有下降(1~3分),在其他地市則有3~9分的下降幅度。在24 h預(yù)報時效內(nèi),神經(jīng)網(wǎng)絡(luò)或線性回歸模型表現(xiàn)較優(yōu)異的崇左、柳州、梧州、河池、玉林等地市,隨著預(yù)報時效延長至72 h,其評分均低于CUACE模式預(yù)報評分。
(3)從預(yù)報評分極值分析,預(yù)報評分最高的是神經(jīng)網(wǎng)絡(luò)和線性回歸模型對防城港的24 h預(yù)報(70分),最低的是神經(jīng)網(wǎng)絡(luò)模型對河池的72 h預(yù)報(57分);神經(jīng)網(wǎng)絡(luò)模型預(yù)報的高分值區(qū)域主要在桂西南和沿海地市(欽州、防城港、南寧和崇左),線性回歸模型預(yù)報的高分值區(qū)域主要在沿海和桂東部分城市(防城港、欽州、梧州和賀州),CUACE模式預(yù)報的高分值區(qū)域主要位于沿海三市(北海、欽州、防城港)。
表2為2016年南寧市CUACE模式、神經(jīng)網(wǎng)絡(luò)模型和線性回歸模型24 h預(yù)報的逐月評分。由表2可見,在南寧24 h空氣質(zhì)量預(yù)報中,線性回歸預(yù)報分?jǐn)?shù)為55~71,各月預(yù)報分?jǐn)?shù)差別較大,低分月份主要出現(xiàn)在夏秋季節(jié)。6月和10月的CUACE模式預(yù)報分?jǐn)?shù)均高于神經(jīng)網(wǎng)絡(luò)和線性回歸模型的預(yù)報分?jǐn)?shù)。而1-5月、8-9月及12月均是神經(jīng)網(wǎng)絡(luò)模型的預(yù)報分?jǐn)?shù)最高,各月均在66分以上,預(yù)報分?jǐn)?shù)較穩(wěn)定。由此可見,神經(jīng)網(wǎng)絡(luò)預(yù)報模型對CUACE模式24 h預(yù)報產(chǎn)品的訂正效果最明顯,神經(jīng)網(wǎng)絡(luò)預(yù)報模型可作為南寧市空氣質(zhì)量預(yù)報業(yè)務(wù)的重要參考。

表2 2016年南寧市CUACE模式、神經(jīng)網(wǎng)絡(luò)模型和線性回歸模型24 h預(yù)報的逐月評分
(1)線性回歸對南寧的預(yù)報分?jǐn)?shù)為55~71,各月預(yù)報分?jǐn)?shù)差別較大,低分月份主要出現(xiàn)在夏秋季節(jié)。神經(jīng)網(wǎng)絡(luò)模型對南寧各月的預(yù)報分?jǐn)?shù)均在66分以上,對CUACE模式24 h預(yù)報產(chǎn)品的訂正效果最明顯,可作為南寧市空氣質(zhì)量預(yù)報業(yè)務(wù)的重要參考。
(2)在顆粒物(PM10和PM2.5)濃度的預(yù)報業(yè)務(wù)中,神經(jīng)網(wǎng)絡(luò)模型預(yù)報在廣西大部分城市預(yù)報誤差較小,具有較高參考價值;河池和梧州可利用線性回歸模型對O3濃度進(jìn)行預(yù)報,廣西其他地市則可采用神經(jīng)網(wǎng)絡(luò)模型預(yù)報O3濃度。
(3)神經(jīng)網(wǎng)絡(luò)預(yù)報模型適用于桂南和桂中的大部分城市,線性回歸適用于桂北的柳州、百色、河池及桂東的梧州等市,沿海三市可同時參考神經(jīng)網(wǎng)絡(luò)和線性回歸模型的預(yù)報結(jié)果。
(4)CUACE模式預(yù)報效果最穩(wěn)定,其評分基本不隨預(yù)報時效的延長而明顯降低,因此在時效較長的趨勢預(yù)報上,可以重點(diǎn)關(guān)注CUACE模式預(yù)報。
總體來說,通過應(yīng)用線性回歸和神經(jīng)網(wǎng)絡(luò)方法對CUACE模式指導(dǎo)產(chǎn)品重新建模后,各類污染物預(yù)報性能均得到了一定程度的改進(jìn)和提高,可以為業(yè)務(wù)提供有意義的指導(dǎo)依據(jù)。在實(shí)際的預(yù)報業(yè)務(wù)中,針對不同地市、不同預(yù)報時效和污染物類別分別采用合適的預(yù)報方法,可以更有效地提高大氣污染物的預(yù)報質(zhì)量。