毛 波, 楊 昊,, 周世杰, 楊康權, 陳 敏
(1.成都信息工程大學計算機學院,四川 成都 610225;2.電子科技大學信息與軟件工程學院,四川 成都 610054;3.四川省氣象臺,四川 成都 610072;4.四川省氣象局重點實驗室,四川 成都 610072)
風能作為一種高效清潔的新能源,其巨大的發展潛力引起了國內外廣泛的重視。實現準確的風速預測能夠有效地提高風能資源的利用率,降低風功率波動對電網穩定性的影響,從而提升風電場的經濟效益[1]。集合數值預報模式由于提供了關于天氣預報的不確定性信息,相比于單一的確定性數值預報模式,往往能夠得到更準確的風速預報結果,現已在全球多個國家的天氣業務預報中心實現常規運行[2]。但在實際應用中,由于集合預報模式設計之初的各種不完美以及大氣系統的不確定性,集合預報模式一直存在系統性誤差,從而造成風速預報的結果出現系統性偏差。為了滿足更加精確和可靠的風速預報需求,需要對集合數值預報模式的結果進行偏差訂正,以提升模式對風速的預報能力。
目前,受限于風場本身所具有的變性特征,國內對風場集合預報結果偏差訂正的方法還是多以傳統的統計訂正方法為主[3],如集合模式輸出統計法[4]和貝葉斯模型平均法[5]。這類訂正方法均通過建立線性統計模型來訂正風場集合預報的誤差,對于風場變化的隨機特征,傳統的線性統計模型往往不能很好地捕捉其中的非線性關系。隨著近年來計算機硬件設備的不斷提升以及人工智能技術的蓬勃發展,國內外氣象領域的研究人員開始逐步結合機器學習方法或深度學習方法對數值預報模式結果進行偏差訂正,實現風速的精細化預報。Lahouar A 等[6]使用隨機森林的機器學習方法,建立了提前一小時的風速預測模型。與其他大多數機器學習方法相比,隨機森林方法不需要進行調整或優化,結果表明,使用該模型的風速預報精度有顯著的提高。孫全德等[7]使用常見的幾種機器學習算法(LASSO 回歸、隨機森林等)對數值天氣預報模式ECMWF 預測的華北地區近地面10 m風速進行訂正,將訂正結果與傳統訂正方法得到的訂正結果進行對比。結果表明,基于機器學習算法的風速訂正方法效果均好于傳統訂正方法,顯示了機器學習方法提升數值預報風速預報精度的潛力。但上述機器學習方法僅限于對確定性數值預報的數據進行偏差訂正,尚未對集合數值預報模式進行嘗試。且機器學習較依賴于復雜的特征工程,將機器學習應用于模式的偏差訂正時,需要研究人員具備專業的氣象知識和大量的時間,使訓練過程成本偏高且十分具有挑戰性。
深度學習作為機器學習的一種特定形式,由于不需要進行特征工程,因此在對海量數據進行非線性建模時具有更大的優勢。過去十年中,深度學習已在計算機視覺、語音識別及自然語言處理等多個領域取得了豐富的成果,為人類社會的進步和發展帶來了極大的幫助。對于大氣系統所具有的特殊的高度非線性特征,深度學習現已成為人工智能領域與大氣科學領域交叉應用的研究熱點和主流發展方向。Stephan Rasp等[8]率先使用深度神經網絡在分布回歸框架中對集合預報預測的2 m溫度進行偏差訂正實驗,將連續分級概率評分(continuous ranked probability score,CRPS)作為其模型的損失函數。該實驗的局限在于只考慮單一站點位置以及單一天氣變量的偏差訂正,對目前的數值預報模式生成的二維網格數據不具有適用性。對于二維網格數據所具有的空間特性,需考慮使用諸如卷積神經網絡[9]等方法來提取其空間特征。受此啟發, Gr?nquist Peter 等[10]基于Unet 模型搭建了集合預報的偏差訂正模型,結果表明其模型在CRPS 評分方面相比于傳統訂正方法取得了超過14%的相對改進。L Han 等[11]基于Unet 提出了一個CU-net(Correction U-net)模型,將格點預報數據的偏差訂正問題轉化為深度學習中的圖像識別問題,對ECMWF-IFS 模式的格點預報數據進行訂正,也取得了不錯的訂正效果。張延彪等[12]為進一步加強CU-net 模型對復雜的氣象格點數據的偏差訂正能力,引入稠密卷積模塊[13](Denseblock)對CU-net 進行改進,構建了Dense-CUnet模型。上述研究雖然都對格點預報數據的偏差訂正有較好的效果,但考慮到格點預報數據的空間特征,仍存在一些不足,主要體現在沒有考慮模型對格點預報數據的時間維度特征的提取融合。
集合數值預報模式預報的格點數據具有復雜的空間特征和時間特征,屬于典型的時空序列數據。對這類數據進行偏差訂正的深度學習方法,本文引入時空序列預測問題常用到的ConvLSTM 模型[14]對CMAREPS 預報的近地面(10 m)風速格點數據進行偏差訂正,訂正的預報時間為24 h、48 h和72 h。將訂正結果與CMA-REPS 原始預報數據和Unet 模型得到的結果進行對比,結果表明該模型方法能進一步提升集合數值預報模式風場格點數據的預報精度。
CMA-REPS 是中國氣象局自主研發的新一代區域集合預報系統,其前身是GRAPES-REPS(global and regional assimilation and prediction enhanced system-regional ensemble prediction system)區域集合預報系統,基于中國自主研究并建立的新一代多尺度通用資料同化與數值天氣預報系統-GRAPES 的區域模式發展而來[15-16]。集合預報擾動方法對集合預報的可靠性提升極為重要,當前CMA-REPS 初值擾動采用6 h循環計算方案的GRAPES 模式面集合變換卡爾曼濾波[17];模式擾動采用單一物理過程參數化方案與隨機物理過程傾向項(stochastic perturbed parameterization tendencies, SPPT)[18]組合;邊界擾動通過提取GRAPESGEPS(global and regional assimilation and prediction enhanced system-global ensemble prediction system)全球集合預報系統擾動成員相比于自身控制預報的擾動測邊界,并疊加在CMA-REPS 的控制預報測邊界上得到[19]。CMA-REPS 參數配置如表1 所示,其水平分辨率為0.1°,垂直分辨率為50 層,集合預報成員數15個,預報區域為中國區域,預報時效84 h(00 時,12 時(協調世界時)),6 h(06 時,18 時(協調世界時))。CMA-REPS 中的控制預報初值和側邊界來源于NCEPGFS(national centers for environmental prediction-global forecast system)全球模式的預報場;并且CMA-REPS加入了云分析同化技術與條件性臺風渦旋重定位技術[20],以期提高短臨降水和臺風預報能力。CMAREPS 具體參數配置見表1。

表1 CMA-REPS 具體參數配置
集合數值預報模式的格點預報數據是在時間上連續分布的空間數據[21],具有典型的時空特征。僅靠單一的基于CNN 的深度學習模型如Unet,雖然可以有效地提取格點預報數據復雜的空間分布特征,但無法捕捉數據的時間序列信息。隨著深度學習的發展,LSTM(long short-term memory)對于氣象要素站點數據的序列預測能力得到了驗證。因此,考慮將時間成分納入深度學習模型(例如通過使用LSTM),可以進一步提高深度學習模型對集合數值預報模式格點預報數據的偏差訂正能力。但是,傳統的長短期記憶單元無法實現對空間特征的提取。基于此,引入ConvLSTM 模型,嘗試對CMA-REPS 預報的近地面(10 m)風速格點數據進行偏差訂正。ConvLSTM 模型是Shi 等[14]為解決時空序列預測問題,結合卷積神經網絡對數據空間特征的提取與編碼能力及長短期記憶網絡的序列特征編碼特性而提出的。
ConvLSTM 的單元結構圖如圖1 所示。由圖1 可以看到,ConvLSTM 是LSTM 結構的一種變體,通過遺忘門(ft)、輸入門(it)和輸出門(ot)控制數據在細胞內部的交流。各個門控制數據參與到細胞狀態的更新,通過門來選擇性地保留或舍棄信息。ConvLSTM 與LSTM 的區別在于ConvLSTM 在“輸入到狀態”和“狀態到狀態”兩部分都采用卷積運算來代替矩陣乘法,并且其所有的輸入X1,…,Xt,細胞輸出C1,…,Ct,隱藏狀態H1,…,Ht,和遺忘門(ft)、輸入門(it)和輸出門(ot)都是3 維張量,這樣做的好處是在提取序列的空間信息同時,可以去除大量空間冗余特征并且解決數據的時間依賴問題。

圖1 ConvLSTM 單元結構圖
ConvLSTM 門之間的傳遞關系如下:
式中it為輸入門,ft為遺忘門,Ct為細胞狀態,ot為輸出門,Ht為隱藏層輸出,*表示卷積運算符, 表示Hadamard 乘積,σ為sigmoid 激活函數。遺忘門可以控制信息的遺忘,丟棄被認為冗余的信息,保留有用的信息并將其向后傳遞;繼續傳遞的信息進到輸入門,通過sigmoid 層確定需要更新的信息,并通過tanh 層得到新的細胞信息對細胞進行更新。最后通過輸出門中的sigmoid 的信息乘以通過tanh 的記憶細胞的信息得到模型的最終輸出。
對于本文的集合數值預報模式風場格點預報數據的偏差訂正問題,通過堆疊多個ConvLSTM 網絡層搭建偏差訂正模型,模型結構如圖2 所示。模型輸入由Yt和Pt+△t組成,其中Yt是2t、10u、10v和10w這4 個要素在t時刻的實況數據,Pt+△t是2t、10u、10v及10w在t時刻的△t小時集合平均預報數據,△t可取的值有24、48 和72。將實況數據Yt與預報數據Pt+△t拼接在一起,得到的模型輸入數據大小為101×101×8。輸入數據經過最小最大值歸一化后進入兩個ConvLSTM2D網絡層,最后經過一層全連接層輸出偏差訂正后的CMA-REPS 的△t預報數據。兩層ConvLSTM-2D 網絡層卷積核數目均為10,考慮數據本身的特征分布和網格分辨率大小,選用3×3 大小的卷積核以避免丟失局部特征,并且卷積過程中使用填充設置使中間過程生成的特征圖大小一致。輸出層(全連接層)的神經元個數為1,其激活函數為ReLu,用以提高模型的非線性表達能力。在每個ConvLSTM-2D 網絡層后加入批標準化層,通過對每層的輸出進行批標準化處理,防止模型出現訓練過擬合的同時加速模型訓練的收斂過程。

圖2 基于ConvLSTM 的風速訂正模型結構圖
在模型訓練過程中,使用Adam[22]作為模型的優化器,其學習率設為0.001,一階矩估計的指數衰減率設為0.9,二階矩估計的指數衰減率設為0.999。Adam算法相比于傳統的隨機梯度下降算法,可以通過計算梯度的階矩為不同的參數設計獨立的自適應性學習率,并且擁有更高效的計算效率。訓練的每一批數據大小batchsize 設為10,并選取均方誤差(MSE)作為模型的損失函數:
式中yi和分別代表訓練集中的觀測值和經模型訓練后的訂正值,n代表訓練集樣本數量。
選取CMA-REPS 預報的格點數據作為預報數據,采用第五代ECMWF 全球再分析產品(ERA5)數據作為格點“實況”數據。其中,CMA-REPS 的格點預報數據的空間分辨率為0.1°×0.1°,網格數為751×501,空間范圍為10 °N ~60 °N、70 °E ~145 °E(2022年6月7日之前的空間范圍為15 °N ~65 °N、70 °E ~145 °E),起報時間為00UTC 和12UTC,預報時效為0-84 h(逐小時),成員數為15。ERA5 數據的空間分辨率為0.1°×0.1°,網格數為101×101,空間范圍為32 °N~42 °N、110 °E ~120 °E。對CMA-REPS 預報的華北地區近地面10 m風速格點數據進行偏差訂正,因此需要將CMA-REPS 的格點預報數據裁剪成網格數為101×101,空間范圍為華北地區(32 °N ~42 °N、110 °E ~120 °E),并選取預報時效為24 h、48 h以及72 h的2 m氣溫(2t)、10 m風速(10u:東西風;10v:南北風)的預報數據。兩套數據的時間范圍均為2019年10月20日至2022年5月1日。
首先將10 m 緯向風分量(u)和10 m經向風分量(v)合成為10 m風速(w),合成公式:
現在選取的CMA-REPS 預報數據和ERA5 數據包含的氣象要素有2t、10u、10v和10w,然后對兩套數據進行質量控制,檢測數據中是否存在缺失值或異常值。經檢測,ERA5 4 個要素的數據均存在缺失值。這是由于ECMWF 數值模式預報資料數量大,存儲空間占比高,導致資料在存儲過程中出現數據缺失。針對格點預報數據空間上存在連續性的特點,ERA5 缺失值采用相鄰非缺失值線性插值方法進行補缺。
為了防止模型訓練出現過擬合的現象,提升模型的泛化能力,還需要將所選數據分為訓練集、驗證集和測試集。由于實驗訂正的預報時間為24 h、48 h 和72 h,因此將數據分為3 組,每組選取2019年10月20日至2021年4月30日的對應預報時效的數據為訓練集,2021年5月1日至2021年10月31日對應預報時效的數據為驗證集,2021年11月1日至2022年5月1日對應預報時效的數據為測試集。在單個訓練數據集合中,以訂正24 h預報數據為例,模型輸入數據為起報時間t的ERA5 實況格點數據和CMA-REPS 的24 h預報數據,訓練標簽為t+24 h的ERA5 實況格點數據。
采用ConvLSTM 深度學習模型對CMA-REPS 模式預報的華北地區近地面10 m 風場數據(10u、10v和10w)進行偏差訂正,訂正的預報時效為24 h、48 h和72 h,并將訂正結果分別與CMA-REPS 原始預報結果、EMOS 方法訂正結果和Unet 模型訂正結果進行比較,同時結合ERA5 再分析場對模型的訂正能力進行客觀檢驗。對于模型訂正性能的衡量,使用均方根誤差(RMSE)來評估模型的訂正效果。RMSE 的計算公式如下:
式中n代表測試集樣本數量,yi和?yi分別代表測試集的觀測值和模型訂正值。
圖3 顯示了CMA-REPS、Unet 模型和ConvLSTM模型對測試集24 h、48 h及72 h預報的10u數據進行偏差訂正的RMSE 對比結果。由圖3 可以看出,使用ConvLSTM 模型訂正的預報結果相比CMA-REPS 原始預報數據和Unet 模型的訂正結果要更貼近于實況數據。尤其對24 h預報的10u數據的訂正效果最好,ConvLSTM 模型的RMSE 比CMA-REPS 降低36.57%,比Unet 模型降低15.73%。訂正效果其次的是對72 h預報的10u數據的訂正,RMSE 比CMA-REPS 和Unet 模型分別降低了14.83%和4.91%。對于48 h預報的10u數據的訂正,ConvLSTM 模型相比于Unet 模型提升效果微乎其微,RMSE 僅降低0.54%,但相比CMA-REPS原始預報數據,RMSE 降低了6.46%,依舊取得不錯的偏差訂正效果。

圖3 24 h、48 h 及72 h 預報10u 訂正前后RMSE 對比圖
圖4 顯示了2022年4月4日00 時24 h預報的10u訂正結果,可見CMA-REPS(圖4b)原始預報數據整體誤差較大,經過Unet 模型(圖4c)和ConvLSTM 模型(圖4d)訂正后誤差有明顯的改善,并且ConvLSTM 模型訂正的結果從整體上更趨近于ERA5(圖4a),著重體現在研究區域的東部沿海和北部地區。

圖4 2022年4月4日00 時24 h 預報10u 訂正結果
圖5 顯示了CMA-REPS、Unet 模型和ConvLSTM 模型對測試集24 h、48 h及72 h預報的10v數據進行偏差訂正的RMSE 對比結果。可以看出,ConvLSTM 模型得到的預報數據效果更好。其中效果最好的是48 h預報的10v數據,與CMA-REPS 和Unet 模型相比,ConvLSTM 的RMSE 分別下降了38.45%和20.56%。其次是24 h預報的10v數據,RMSE 比CMA-REPS 和Unet 模型分別降低25.16%和12.75%。對于72 h預報的10v偏差訂正,Unet模型和ConvLSTM 模型訂正的效果提升幅度不大,但總體上偏差訂正的結果更趨近于ERA5。

圖5 24 h、48 h 及72 h 預報10v 訂正前后RMSE 對比圖
從2022年3月25日00 時24 h預報的10v訂正結果(圖6)可以看出,在CMA-REPS 原始預報數據整體偏小的情況下,Unet 模型對研究區域北部地區的偏差訂正效果欠佳,而ConvLSTM 模型對其進行偏差訂正的結果整體上都具有明顯的改善,著重表現在研究區域的中部和北部地區,在東部沿海地區也取得了不錯的訂正效果。

圖6 2022年3月25日00 時24 h 預報10u 訂正結果
圖7 顯示了CMA-REPS、Unet 模型和ConvLSTM模型對測試集24 h、48 h及72 h預報的10w數據進行偏差訂正的RMSE 對比結果。從圖7 可以看出,ConvLSTM 模型對不同預報時效的10 m風速的訂正均有明顯的提升,尤其是對48 h預報的10w訂正,ConvLSTM 的RMSE 相比CMA-REPS 原始預報數據和Unet 模型降低了28.37%與11.21%。24 h預報的10w經ConvLSTM訂正后,相比CMA-REPS 和Unet 模型RMSE 分別降低了19.42%和6.01%。對于72 h預報的10w,經ConvLSTM 訂正后的RMSE 比CMA-REPS 降低18.52%,比Unet 模型降低8.19%,整體改善效果與24 h 預報的10w相比相差不大。

圖7 24 h、48 h 及72 h 預報的10w 訂正前后RMSE 對比
圖8 顯示了2022年2月7日00 時的48 h預報的10w訂正結果。可以看出,該時刻的CMA-REPS 原始預報數據整體上數值偏大,經Unet 模型偏差訂正得到的預報結果雖有所改善,但整體數值上相比于ERA5依舊稍微偏大。融合了時間序列特征編碼特性和空間特征提取功能的ConvLSTM 模型偏差訂正的結果在整體上與ERA5 更加一致,說明本文提出的ConvLSTM模型可以有效改善CMA-REPS 對10 m風速預測值偏高的情況。

圖8 2022年2月7日00 時48 h 預報10w 訂正結果
基于深度學習方法對中國自主研制的CMA-REPS預測的近地面10 m風場格點數據進行了偏差訂正。針對格點預報數據具有的空間和時間雙重特征,構建了一種融合時間序列特征編碼特性和空間特征提取功能的ConvLSTM 訂正模型,并將其訂正結果與僅考慮空間特征提取的Unet 模型的訂正結果和CMA-REPS原始預報數據進行對比。實驗結果表明,ConvLSTM對CMA-REPS 3 個預報時效(24 h、48 h和72 h)的近地面10 m風場預報數據均有明顯的正向訂正作用,且訂正效果均要優于Unet 模型的訂正效果,這說明融合格點預報數據的時間序列特性可以幫助深度學習模型進一步提升對格點預報數據的偏差訂正能力。另外從3 個個例分析可以看出,在CMA-REPS 原始預報數據整體較離散的情況下,ConvLSTM 可以減小預報數據與實況數據間的誤差,有效提升CMA-REPS 對近地面10 m風場數據的預報能力。
隨著深度學習技術的不斷進步,注意力機制[20]已被證明可以有效提升模型對序列數據的特征提取能力,考慮將注意力機制與ConvLSTM 模型結合可以進一步提升模型的偏差訂正效果。另外,將傳統集合數值預報模式訂正方法如集合模式輸出統計(EMOS)與深度學習模型方法融合,也是未來集合數值預報模式偏差訂正值得嘗試的研究方向。