殷美祥,羅瑞婷,陳榮泉,劉顯通
(1. 廣東省氣象服務中心,廣東 廣州 510641;2. 廣東省突發事件預警信息發布中心,廣東 廣州 510641;3. 肇慶市氣象局,廣東 肇慶 526000;4. 中國氣象局廣州熱帶海洋氣象研究所,廣東 廣州 510641)
大氣能見度是表征大氣透明程度的重要物理量,是基本氣象觀測項目之一。大氣能見度受到水汽、降水、霧霾、風等的影響,其變化具有復雜的非線性和局地性特征,因此其精細化預報業務仍是氣象預報業務中最具挑戰的領域之一[1-4]。雷州半島地區三面環海,是全國沿海地區四大海霧高發區域之一。湛江港是我國沿海主要港口之一,是“一帶一路”倡議的戰略支點港和西南沿海港口群的龍頭港。冬春季雷州半島常因低能見度事件導致港口航線停航,甚至導致海上交通事故,對港口生產和港口經濟造成巨大損失。為了保證海上交通安全,減少低能見度天氣下的災害發生,亟需提高雷州半島沿岸能見度短臨預報能力[5-7]。
目前能見度預報主要是采用天氣學診斷方法、傳統統計方法和數值預報方法[8-11]。孫連強等[12]采用常規氣象觀測資料和衛星資料,研究了丹東附近海域海霧的變化規律和條件,研發了基于天氣學預報方法的海霧預報方法。黃輝軍等[13]基于海洋氣象觀測數據,分析海霧液態含水量的演變特征及其同期的天氣學背景,表明更大范圍的均壓場,小的低空和地面風速,弱不穩定狀態的低層大氣,高濕度的近地層更容易造成海霧過程中低能見度的出現。王燕濱等[14]在對朝連島海區海霧天氣學特征總結后,建立海霧預報方程,用主成分分析方法對霧日數進行外延預報,其趨勢預報準確率達到85%。高榮珍等[15]采用青島地面觀測資料和FNL 再分析資料,利用分類與回歸樹方法構建青島沿海海霧決策樹預報模型,結果表明72 h內海霧預報準確率達到70%~75%,可基本滿足常規業務預報需求。黃輝軍等[16]采用NCEP 再分析氣象資料、臺站觀測資料和海霧野外試驗的觀測資料建立預報變量因子,利用GRAPES 模式得到變量因子,選取湛江、珠海、汕頭3 站為代表,構建24 h 的廣東沿海海霧判別預報,檢驗表明該海霧MOS 判別預報方法預報準確率為84%~90%。饒莉娟[17]基于WRF(Weather Research and Forecasting)模式,研究其不同邊界層方案對黃海海霧的模擬效果,選取2次典型的海霧個例作為研究對象,利用衛星反演數據、再分析數據與常規觀測數據,詳細分析海霧演變特征、海霧天氣形勢與邊界層特征,對比分析不同參數方案對海霧的模擬效果。史得道等[18]采用WRF 中尺度數值模式,基于循環三維變分數據同化方案,構建渤海海霧數值預報系統,經過20次海霧過程統計檢驗,預報準確率達到60%。崔馳瀟等[19]利用WRF模式耦合不同閉合方式邊界層參數化方案,對江蘇地區的一次平流霧過程進行數值模擬,對比分析模擬結果與實測氣象數據,評估了他們對此次平流霧模擬效果,分析邊界層高度對此次平流霧的生成和發展的影響。姜昊宇等[20]利用WRF 模式,利用SLAB 方案與Noah 方案2 種陸面方案,對一次陸地霧和一次海霧個例進行模擬并進行對比分析,探究模擬效果迥異的原因。但是天氣診斷方法需要大量人力成本,且難以做好精細化預報。線性回歸、逐步回歸等傳統統計方法對能見度復雜非線性特征處理能力不足,難以達到精度的要求。海霧數值預報模式近年來取得了良好的業務應用效果,受到初始場限制和運算時間成本影響,難以根據實況進行快速運行迭代。
近年來,機器學習在霧天氣和大氣能見度預報等方面表現出了顯著優勢[21]。機器學習在理論上能以任意小的誤差來近似任意的連續函數,能夠根據大量的氣象觀測數據學習出能見度規律的數學表示[22-24],從而實現對能見度預測。相比傳統的能見度預報數學模型,基于機器學習技術的能見度預測模型能根據氣溫、氣壓、風力和相對濕度等氣象觀測數據學習出特征表示,并學出氣象觀測數據與能見度的映射函數,從而應對了天氣的瞬變性。韓婷婷[25]利用卷積神經網絡和長短期記憶網絡結合構建大霧短臨預測模型,通過實驗確定預測模型的最優參數,并證明了預測模型的有效性。鄭成[26]基于時間卷積網絡與遷移學習提出了一種能見度預報方法,先對源域能見度數據進行學習,優化模型參數,再對目標域的小數據集進行學習,證明了在小數據集條件下,遷移學習能夠提升模型的預報性能。趙亞[27]利用深度學習構建預測能見度模型,并與傳統的BP 神經網絡對比,證明了深度學習模型預測能見度的效果要比傳統的BP神經網絡效果更好。
因氣象觀測數據少、能見度局地特征強、氣象條件復雜多變等問題,目前基于深度學習的近海岸能見度預報研究不多。李昕蓓等[28]利用福州氣象觀測站地面觀測數據,基于循環神經網絡建立了福州單站能見度短臨預報模型。檢驗表明,相比傳統BP 神經網絡,循環神經網絡對能見度預報具有優勢,其平均絕對值誤差比傳統BP 神經網絡減小12.90%。胡海川等[29]基于BP 神經網絡方法,利用地面常規氣象觀測數據及NCEP 再分析資料,構建環渤海沿海城市能見度預報模型,檢驗表明該方法對低能見度天氣過程的能見度預報具有指示意義。可見,在雷州半島地區基于深度學習的近海岸能見度預報研究幾乎是空白的。本文以湛江市國家基本氣象站作為主要參考站,將GRU神經網絡應用于雷州半島近海岸能見度短臨預報模型構建,研究不同的模型結構對雷州半島近海岸能見度的短臨預報能力。
本研究使用的數據包括廣東省湛江、遂溪、吳川、雷州國家氣象觀測站(圖1)2017 年1 月1 日—2020 年12 月31 日(北京時間,下同)氣象觀測歷史數據。以上氣象觀測站每5 min采集一次數據,氣象要素包括1 min 平均能見度、5 cm 地溫、草面平均溫度、小時內最高地表溫度、小時內最低地表溫度、氣溫、相對濕度、海平面氣壓、蒸發、水汽壓、地表溫度、露點溫度、過去12 h 極大瞬時風速、過去3 h降水量、24 h變溫、10 min平均風速等。

圖1 雷州半島沿岸代表站點分布
初始數據集在部分時段存在缺失值,本研究利用拉格朗日插值方法[30]對缺失值進行處理,形成完整的能見度實況數據集,共421 091 組數據。由于能見度實況數據與各變量的數據范圍不同,為了減少誤差,提高深度學習訓練的速度,對能見度實況數據集各變量進行標準化(公式(1))處理,將各變量的值縮放至0~1區間內,
式中,X為某一氣象因子原始值,Xmin表示其最小值,Xmax表示其最大值,X'表示X歸一化后的值。完成歸一標準化后,把能見度實況數據集按照7:3劃分為訓練集和測試集,其中訓練集294 763組數據,測試集126 328組數據。利用前24 h的數據預報未來1 h 的能見度,形成適合訓練GRU 模型的輸入數據。為了保證測試樣本的獨立性,將測試樣本進行隨機排序。
為了保證輸入預報模型的因子具有統計學意義,對能見度實況數據集進行person 相關性分析,p值設為0.05,如公式(2)所示,
其中,Xi為某一氣象因子的第i個時間節點對應的數值為某一氣象因子的平均值,Yi為第i個時間節點能見度值為能見度平均值,R為計算得到的相關系數。
能見度降低的主要因素是大氣中懸浮粒子對可見光的散射和吸收造成的。除了大氣污染物外,氣象要素會通過直接或間接方式影響能見度的變化。將湛江站能見度與同時刻的各氣象因子進行相關分析,研究其相互關系及影響機理,挑選出相關系數較大的22個因子,其p值都小于0.05,均具有統計學意義。
水汽主要是通過兩種方式來影響能見度,一是本身對可見光的散射和吸收,二是使邊界層中吸濕性氣溶膠吸收更多水分,增加氣溶膠的散射截面,改變氣溶膠的光學性質,造成能見度降低。上述影響機理同樣可解釋相對濕度、水汽壓、溫度露點差等氣象要素和能見度的關系。
邊界層溫度場通過影響大氣層結穩定性,影響大氣懸浮粒子的聚集或者散射,從而間接影響能見度的變化。
穩定的氣壓場,有利于邊界層中氣溶膠和水汽的聚集,從而降低能見度,反之不穩定的氣壓場容易提高能見度。
風對能見度的影響比較復雜,風速較低時,大氣顆粒物不容易擴散,導致能見度下降;較大的風容易稀釋大氣顆粒物,從而提高能見度水平。
氣溫對能見度的影響是多方面的,由輻射而降溫時,有利于能見度降低,由冷空氣入侵而降溫時,有利于能見度提高。
蒸發量受風、日照、溫度等其它氣象要素影響,表現為多種氣象要素共同對能見度的影響,一般蒸發越大,能見度越好。
能見度有日變化特征,霧容易在凌晨形成,導致能見度降低。日出后,氣溫升高,相對濕度減小,大氣層結不穩定度增加等因素,有利于能見度提升。海霧容易在冬春季生成,夏秋季較少,因此能見度也有月變化特征。
相比本站的氣象要素,周邊上下游的遂溪、雷州、坡頭站能見度與本站的能見度相關系數更高,均超過0.5。因為影響雷州半島近岸沿海能見度的霧主要是平流霧,此類霧特點是水平范圍很廣,這導致湛江站能見度變化與上下游觀測站的能見度除了時間維度聯系,在空間維度上也有聯系。因此本文將同時引入周邊上下游自動站能見度觀測資料,包括遂溪、雷州、坡頭站,用于構建短臨能見度預報模型。

表1 湛江站能見度與各氣象因子相關關系
本文分別使用門限循環神經網絡(GRU)和多元逐步回歸方法進行模型的構建,對1 h后的能見度進行預報,從而實現逐5 min更新的高時間分辨率能見度短臨預報。
2.4.1 門限循環神經網絡(GRU)
門限循環神經網絡(GRU)是2014 年提出的全新的神經網絡結構(圖2),它彌補了循環神經網絡(RNN)無法學習長期依賴關系的不足,又比長短期記憶神經網絡(LSTM)參數更少,結構更簡單。在對門限循環神經網絡(GRU)進行訓練的過程中,需要計算更新門、重置門,這兩個門的值都在0~1之間,代表對特征信息的過濾程度。門限循環神經網絡(GRU)的前向傳播如公式(3)~(6)所示,

圖2 GRU神經網絡結構示意圖
其中,Zt為t時間步時更新門狀態值,rt為t時間步時重置門狀態值,σ為Sigmoid 激活函數,ht-1是t-1 時間步輸出的狀態信息,xt為當前時刻輸入的能見度特征向量表示t時間步時狀態信息候選值,ht是t時間步輸出的狀態信息,tanh為雙曲正切激活函數。Wz、Wr、Wh?為權重矩陣參數。
2.4.2 多元逐步回歸方法
多元逐步回歸預報方法是一種建立最優多元回歸方程的統計方法。根據因子的顯著性程度,從大到小依次逐個引入回歸方程。每次引入新的因子后,都對回歸方程中所有的因子逐個進行檢驗,并剔除方差貢獻變得不顯著的因子,直至既無顯著變量可引入回歸方程,又無不顯著的變量留在回歸方程中為止。
本研究采用均方根誤差RMSE、平均絕對誤差MAE、決定系數R2來定量評價預報模型的精度。其中,RMSE、MAE 越小,說明模型精度越高,而R2越大,模型精度越高。各指標計算公式如公式(7)~(9):
式中,n為數據的數量為預報值,yj為真實值為真實值的平均值。
為了測試不同建模方法和方案的效果,本研究數據資料分別使用單站和多站的氣象觀測數據,建模方法分別使用GRU 神經網絡和多元逐步回歸法,建立對應的預報模型,進行試預報檢驗,分析不同數據和方法的預報效果。
GRU神經網絡隱藏層節點的設置會影響預報模型的準確性。通過大量的訓練,對比不同變量因子組合方案,不斷優化神經網絡各項參數,挑選最優GRU 參數構建模型。最終采用兩層GRU 隱藏層,其中,第一層GRU 隱藏層節點數為128,第二層GRU 隱藏層節點數為96,兩層GRU 隱藏層后都設計一個dropout層,設置為0.2。在訓練過程中,取訓練集和測試集比例為7:3,采用SGD 更新方式,損失函數采用均方誤差MSE,訓練epoch 為100 次,batch 為32,學習率為0.001,采用早停機制避免過度擬合,耐心值patience 為20,形成能見度單站GRU 預報模型VisNetS 和能見度多站GRU預報模型VisNetM。
接著采用多元逐步回歸方法建立預報方程。采用資料與神經網絡一致,設定p值為0.05,經過對因子進行多次的引入和剔除,最后選取16 個因子參數建立能見度單站逐步回歸預報模型VisMlrS,如公式(10);選取18 個因子參數建立能見度多站逐步回歸預報模型VisMlrM,如公式(11)。
基于測試集,采用均方根誤差RMSE、平均絕對誤差MAE、決定系數R2對比四個預報模型的定量化評價指標(表2)。從模型構建方法看,多站GRU 模型VisNetM 和單站GRU 模型VisNetS 平均絕對誤差分別為4.10 km、4.76 km,均方根誤差RMSE 分別為5.36 km、5.90 km,顯著低于多元線性回歸模型,決定系數R2評分分別為0.65、0.57,約為多元逐步回歸模型的兩倍,因此整體上GRU 模型預報準確率顯著高于多元線性回歸模型。

表2 各預報模型在測試樣本中的預報效果
相比單站數據建模,增加上下游觀測站數據,GRU 模型VisNetM 預報準確性得到顯著提升,平均絕對誤差、均方根誤差數值分別減小了14%、9%,決定系數增加了13%。而同樣情況下,基于逐步回歸方法構建的模型,各類定量評價指標并沒有因為引入了上下游觀測站數據而得到顯著性提高。可見相比逐步回歸方法,GRU 模型能夠更好地識別并表達出能見度在空間維度上變化特征,從而提升預報效果。
選取2022年1月2—3日雷州半島地區持續性霧天氣作為案例,驗證模型預報效果。2021 年12月下旬廣東省受到寒潮的影響,2022年1月2日寒潮影響結束,冷高壓主體逐漸東移入海,雷州半島處于其后部,氣壓梯度較小,2 日晚上到3 日凌晨雷州半島沿海一帶轉偏東風,此時陸地仍然是弱偏北風,近地面弱東風場將外海暖濕空氣輸送到陸地冷面(圖3)。來自海上暖濕氣流經過雷州半島溫度較低的陸面,冷卻形成高壓入海型的平流霧,自東向西影響雷州半島。1 月2 日早晨和夜間雷州半島及其沿海主要以輕霧為主。1月3日海霧逐漸加強,00 時50 分遂溪站首先觀測到能見度為900 m,持續到1月3日08時轉為輕霧,最低能見度250 m。雷州站于1月3日01時25分觀測到霧出現(能見度800 m),并持續到3日09時30分才轉為輕霧,期間雷州站出現20 m 左右最低能見度。湛江站在1 月2 日21 時開始出現輕霧,輕霧持續到3 日10時,期間最低能見度為2.3 km (圖4)。

圖3 2022年1月3日南海北部風場和氣溫場

圖4 2022年1月3日雷州半島最小能見度分布
四種預報模型都能預報出海霧能見度下降趨勢(圖5),但是擬合效果有顯著區別。多站GRU模型VisNetM 模擬效果最佳,整個過程最契合實況,平均絕對誤差MAE 和均方根誤差RMSE 分別為1.83 km、2.44 km,決定系數R2達到0.81(表3)。但其對低能見度預報結果較觀測偏大,這可能和訓練數據中低能見度樣本偏少有關。其次是多站逐步回歸模型VisMlrM,平均絕對誤差MAE 和均方根誤差RMSE 分別為2.39 km、3.09 km,決定系數R2達到0.7,尤其是在低能見度時期預報值更接近實況,最低能見度出現的時間也比較接近觀測情況。單站GRU 模型VisNetS 模擬效果和單站逐步回歸模型VisMlrS效果稍差,二者決定系數R2均為0.62,但單站GRU模型VisNetS既沒有預報出輕霧過程中能見度最低值出現的時間,對最低值的預報誤差也是最大的。單站逐步回歸模型VisMlrS對最低值的預報誤差比VisNetS 模型更小。可見,多站GRU模型VisNetM能識別海霧上下游的氣象時空特征,以此有效提高了預報準確性。多站逐步回歸模型VisMlrM 也能識別上下游的海霧氣象時空特征,但是效果稍弱。而單站GRU 模型VisNetS 和單站逐步回歸模型VisMlrS 沒法識別上下游的海霧氣象時空特征,導致預報準確性最弱。另外,并非GRU 預報模型效果一定會比傳統的統計模型效果更佳,這需要構建更加有效的模型結構,才能更好地發揮出GRU模型的擬合潛力。

表3 各預報模型在2022年1月2—3日海霧個例過程中的預報效果

圖5 各預報模型在2022年1月2—3日海霧個例過程預報效果
本文利用GRU 神經網絡,采用廣東省湛江市國家基本氣象站及其上下游站點觀測資料,構建湛江市國家基本氣象站能見度短臨預報的多站GRU 模型,并進行了隨機樣本測試和個例預報檢驗。同時,對比采用湛江市國家基本氣象站觀測數據構建的單站GRU 預報模型,以及采用多站和單站觀測資料建立的逐步回歸預報模型,研究不同的預報模型在雷州半島近海岸能見度的短臨預報能力,得到以下結論。
(1) GRU 模型預報結果與實際觀測的變化趨勢一致性較好,整體上預報準確性顯著好于多元線性回歸模型。在隨機檢驗和個例檢驗中,多站GRU 模型平均絕對誤差、均方根誤差明顯低于多元線性回歸模型,決定系數評分明顯高于多元線性回歸模型。
(2) 合理的模型結構對能見度短臨預報效果至關重要,將上下游的氣象特征引入到能見度短臨預報模型可顯著提升預報效果。在個例檢驗中,多站GRU 模型較單站GRU 模型平均絕對誤差、均方根誤差下降了36%和29% ,決定系數提高了30%。相比傳統的逐步回歸方法,GRU 神經網絡能更好地識別上下游能見度的時空變化特征,從而提高沿海近岸能見度臨近預報的準確性。
(3) GRU 模型對低能見度預報結果較觀測偏大,這可能和訓練數據中低能見度樣本偏少,高能見度樣本占大多數有關。而傳統的逐步回歸模型并沒有出現類似的不足。
本文只用了小部分代表站進行能見度預報模型的構建,還沒有將基于GRU 神經網絡的能見度的預報潛力完全發揮出來。為進一步提升預報模型性能,今后可進一步優化模型參數和結構,還可增加模型的訓練數據,包括增加更長年份的歷史數據,或者加入布設密度更大的氣象區域自動站數據。今后還可將基于GRU 模型的試驗結果與一般的機器學習方法,如隨機森林、XGBoost 方法進行比較,對比不同的機器學習方法對近海岸能見度短臨預報的能力。本文只使用了一次海霧過程作為預報試驗,試驗評估數據具有一定的局限性。今后將使用更多個例進行預報模型的檢驗。