譚燕 黃偉 楊玉華 張旭 陳葆德 2
1 中國氣象局上海臺風研究所, 上海 200030
2 中國氣象局臺風數值預報重點實驗室, 上海 200030
經過近半個世紀的發展,集合預報的研究已經從全球大尺度數值預報擴展到中尺度區域數值預報,甚至更小尺度的對流尺度數值預報(Clark et al.,2009; Kain et al., 2013)。模式的時空分辨率更為精細,集合擾動的技術也更為全面,集合預報已經逐步從研究領域向業務預報部門推廣應用,并取了良好的應用成效(Schwartz et al., 2015; Swinbank et al., 2016)。而這其中,短期的中尺度區域集合預報是這十多年來從研究領域向應用領域轉化的熱點,雖然國內外的研究成果頗豐,但卻很難取得重大的根 本 性 的 進 展(Hacker et al., 2011; Jankov et al.,2017)。難點可能有兩方面的原因:其一是與區域集合預報關注的預報對象有關,因為區域模式更多地關注中小尺度高影響天氣的發生發展,而這類天氣過程的空間尺度小,生命史短并且移動迅速,且伴隨著強烈的突發性和轉折性,同時與大尺度環境場之間還存在著復雜的相互作用,其物理和動力的機制較為復雜(孫建華等, 2013),此外,中小尺度天氣系統還會受到如地形等局地環境因素的影響(Volker et al., 2008),所以要想全面地認知這類高影響天氣的本質仍然需要時間。其二來自集合方法本身,我們知道,集合預報研究的核心問題即集合擾動方法的研究,當今成熟的集合擾動方法是針對大尺度的天氣過程提出,以大尺度的斜壓不穩定理論為基礎,有著明確的物理含義(Buizza et al.,2005),而對中小尺度的天氣對象而言,其動力過程是以對流不穩定為主,誤差增長和發展的方式與大尺度過程截然不同(Mass et al., 2002; Grimit and Mass, 2002),對一種尺度適合的擾動方法對其它尺度并不一定適合,這就使得構造合理的集合擾動難度增大,以至于現有的各類擾動方案是否同樣適用于中小尺度天氣過程至今仍沒有統一答案。近十年來,大量的研究來探討初始誤差、模式誤差,以及側邊界條件的重要性問題,評估各類擾動方案在區域集合預報系統中的作用(Ha et al., 2015; 劉暢等, 2018),業務應用上也取得了很好的效果,例如:美國空軍的中尺度集合預報系統(The U.S. Air Force Weather Agency’ s mesoscale ensemble;Hacker et al., 2011)采用分辨率為45 km和15 km的兩層嵌套方式來構建10個集合成員,測試各類不同的擾動方案,發現通過集合后,其效果明顯優于控制預報,且任意一種集合擾動方法所構建的集合預報均比直接降尺度全球集合的效果好,其中初始場的擾動會對12 h之內地面要素的預報有顯著影響;采用隨機物理擾動方案,會比多物理參數化組合的效果好,后者的影響主要體現在邊界層附近;當同時結合多種隨機物理擾動方案時,效果最優。同樣的,在分辨率為13 km的北美快速更新集合系統(North American RAP Ensemble;Jankov et al.,2017)和分辨率為15 km的GRAPES中尺度集合預報系統中(張涵斌等, 2014; Xu et al., 2020)也開展了類似的工作。此外,對于區域模式所面臨的側邊界條件的不確定性問題,已有的研究大都表明,有必要對集合成員的側邊界進行擾動(Nutter et al.,2004a, 2004b; Hohenegger and Sch?r, 2007;Hohenegger et al., 2008; Saito et al., 2012)。其中最直接的方法即從全球集合預報或較大尺度的集合預報中獲取側邊界資料,為較小尺度的集合預報各成員提供側邊界條件,如Nutter et al.(2004a, 2004b)采用該方法發現側邊界條件的擾動能夠迅速地傳遍整個嵌套區域,從而改善區域集合的離散度;Hohenegger et al.(2008)后續指出:隨著預報時效的延長,側邊界擾動的影響可以疊加到初始場的擾動上,從而改善集合系統的預報性能。
整體而言,當綜合地考慮各類不確定性的來源,集合系統的離散度會增加,對強降水和地面變量的預報能力會顯著提升。然而,在各類擾動方案的比較研究中,Hamill and Whitaker(2011)也指出:增加的各類誤差,在一些情況下,不僅會抑制集合離散度的發散,還會使得集合平均的誤差增大,效果適得其反??偟膩碚f,怎樣結合各類擾動方法,構建一個有效的中尺度集合預報系統,與模式系統自身有著密切的關系。如何針對區域數值預報中的不確定性構建有效的區域集合擾動方法,初始誤差、模式誤差、以及側邊界條件的作用如何考慮,以及他們相對于模式分辨率和天氣系統時空尺度的配置等,仍然是值得深入研究的問題,也是集合預報技術在業務應用中的關鍵點。
華東區域中尺度集合預報系統(SWARMSENV1)自2010年在華東區域氣象中心投入業務應用,主要用于支撐3~5天的短期預報。在常年的應用和檢驗中,發現SWARMS-ENV1也存在著大多數集合預報系統的通病之一,即系統發散度不足(Stensrud et al., 1999; Buizza et al., 2005; Romine et al., 2014),從而使得集合預報系統不能有效地體現預報的不確定性,使用效果往往達不到預期。
SWARMS-ENV1采用增長模繁殖向量來表征初始場的不確定性;同時通過數值試驗,最終選取三類積云對流參數化方案(Kain-Fritsch new方案、Betts-Miller-Janjic方 案 和Grell-Devenyi ensemble方案)、兩類地表參數化方案[Monin-Obukhov方案和Monin-Obukhov(Janjic)方案]以及2類邊界層方案(MYJ方案和YSU方案)進行優化組合(Skamarock et al., 2008),最終形成21個集合成員。短期集合預報常用上述多物理參數化方案的組合來表征模式的不確定性,一方面,因各種參數化方案之間的差異性較大,可增加集合的離散度,有助于提升預報技巧(Berner et al., 2011, 2015),但另一方面,該方法在理論和實際應用上也存在著明顯的缺點。Knutti et al.(2013)的研究明確指出:從統計學的角度看,集合預報所添加的小擾動應滿足隨機變量的統計特征,即變量之間是相互獨立且滿足一定的概率密度分布,集合預報所表征的預報不確定性是隨機的預報誤差隨時間演化的結果,而多物理參數化方案并不符合這一前提,不同的物理參數化方案之間的物理假定、觸發機制、概念模型等均存在差異,不同方案也有各自不同的氣候特征和系統性的誤差分布特征(Jankov et al., 2017),從而導致系統偏差或成員聚類(Johnson et al.,2011)。此外,要發展和運維多套物理參數化方案也要耗費大量的資源,目前,各大數值預報中心所采用的主流模式擾動技術均為隨機物理擾動方案,(Palmer et al., 2009; Charron et al., 2010; Bouttier et al., 2012; Weisheimer et al., 2014; Zhou et al., 2017)因此,隨著現今隨機物理擾動方案受到越來越多的關注,有必要進行新的嘗試。
中國氣象局上海數值預報模式系統(CMASH9)于2015年底完成升級,無論是對高低空形勢場預報還是降水預報,其預報性能均得到明顯改善(徐同等, 2016),這為中尺度集合預報系統的升級提供了優良的基礎。本文希望以CMA-SH9的初始場作為控制預報,并在此基礎上開展中尺度集合預報試驗:一方面充分地利用全球集合預報的信息來構造區域集合的初始擾動和側邊界擾動,從而整體上提升區域集合預報系統的預報精度;另一方面針對集合離散度偏低的現象,開展隨機物理傾向擾動方案的參數優化試驗,確定適合模式配置的最優參數,最大可能地表征模式的不確定性,從而提高集合系統離散度;并最終通過批量試驗來全面地評估集合預報系統升級前后的預報能力。本文的結構安排如下:第二部分介紹華東區域中尺度集合預報系統的概況以及本文所進行的集合試驗的設計和檢驗所用的資料;第三部分評估為期一個月的梅雨期試驗結果;第四部分簡要給出典型個例的降水預報;最后為小結與討論。
華東區域中尺度集合預報系統(SWARMSENV1,以下簡稱V1)于2010年建成并投入業務使用,系統的主要特點可以概括為:采用增長模繁殖法和多種物理參數化方案的組合,構建21個集合預報成員,預報范圍如圖1中虛線區域所示,模式水平格點數為159×159,水平分辨率15 km,垂直方向27層,控制預報的初始場使用ADAS(ARPS Data Analysis System;Brewster, 1996)提供的分析場,側邊界條件為NCEP全球預報系統(Global Forecast System,簡稱GFS)的預報場,側邊界條件每6小時更新一次,每日00:00和12:00(協調世界時,下同)啟動,進行120小時預報,結果每小時輸出一次。

圖1 第一代中尺度集合預報系統(SWARMS-ENV1,簡稱V1,黑虛線)與擴展區域后第二代中尺度集合預報系統(SWARMS-ENV2,簡稱V2)的預報范圍Fig. 1 Horizontal domain of SWARMS-ENV1 (V1) model (black and dashed) and the expanded domain of SWARMS-ENV2 model (V2)
升級后的華東區域中尺度集合預報系統(SWARMS-ENV2,以下簡稱V2),其預報范圍如圖1所示,控制預報的初始場同中國氣象局上海數值預報模式系統(CMA-SH9),側邊界通過降尺度NCEP全球集合預報系統(Global Ensemble Forecast System,簡稱GEFS)的控制預報獲取,模式水平格點數為760(緯向)×600(經向),水平分辨率為9 km,垂直方向51層。模式選用Thompson雙參數云微物方案、RRTMG長短波輻射參數化以及YSU邊界層參數化方案(Zhang et al., 2021)。模式通過ADAS客觀分析系統和復雜云分析技術實現對觀測資料的同化,目前ADAS同化的觀測資料主要包括常規探空觀測和地面自動氣象站觀測,后者包括常規地面觀測(SYNOP)、船舶觀測(SHIP)、機場地面報(METAR)、浮標(BUOY)、飛機觀測(AMDAR)等;同時模式利用復雜云分析技術對新一代天氣雷達(China new generation weather radar,簡稱CINRAD;李柏等, 2013)的SA、SB、SC波段雷達的反射率進行同化。表1給出升級前后華東區域中尺度集合系統的基礎配置情況。

表1 華東區域中尺度集合預報系統Table 1 The setup of regional ensemble forecast system
采用動力降尺度方法來獲取集合預報的初始擾動場,是一種直接且簡單有效的方法(Bowler and Mylne, 2009; Montani et al., 2011; Kühnlein et al.,2014),當今一些中尺度集合預報系統(如COSMOLEPS、MOGREPS)也均有所采用,其模式分辨率從9~25 km不等,甚至有研究直接將其用于更高分辨率的對流尺度模式中(Peralta, 2012)。GEFS采用集合卡爾曼濾波(EnKF)方法(Zhou et al.,2017)來表征大氣初始時刻預報的不確定性,同時引入隨機物理傾向擾動來表征模式的不確定性,生成21個集合成員。V2的集合初始擾動生成分為三個步驟:第一步,通過動力降尺度方法直接將GEFS全球集合預報系統的初值場和預報場插值到區域模式的分辨率和范圍,從而形成區域模式積分所需的初始場和側邊界條件。第二步,計算降尺度后各集合成員(Vien)與控制預報(Vc)的差,從而形成各變量的擾動場(Pien),如公式(1)所示,其中擾動變量包括:風場、氣壓場、溫度場和濕度場;第三步,將CMA-SH9同化后的分析場(Va)作為V2的控制預報,在其基礎上,將(1)式得到的擾動場與其進行融合,從而形成新的集合初始擾動場(VPien)。在這個過程中,由于初始擾動和側邊界條件均來自GEFS,也從一個側面避免了兩者之間的不協調、激發虛假波動等問題(Caron, 2013)。

其中,Vi表示集合成員,Vien表示直接動力降尺度得到的各成員的物理量場,Vc為GEFS全球集合控制預報降尺度后的初始場,Pien是各物理量的擾動場,Va為CMA-SH9同化后的分析場(同時也是V2控制預報的初值場),VPien為融合以后新的集合初始場,ien=(1, 2, ···,M)為集合成員序號,M為集合成員數(M=20)。
模式物理過程的傾向項用于表征不能被數值模式解析的次網格物理過程的總體效應,這類過程包含輻射、微物理、深對流、淺對流和邊界層過程。Buizza et al.(1999)首次提出將隨機擾動加入模式物理過程的傾向項中來體現次網格物理過程的不確定性,即隨機物理傾向擾動方案(Stochastically Perturbed Parameterization Tendencies, 簡 稱SPPT),Berner et al.(2015)在 前 人 的 基 礎 上(Palmer et al., 2009),將該 方案 引 進 至WRF模式中,并在實際業務預報中取得了較好的效果(Sanchez et al., 2016; Kevin et al., 2020)。

其中,Xphys表示溫度、緯向風、經向風和濕度等參數的傾向,r(x,y,t)是一個與時間與空間相關的隨機擾動場,x、y和z分別表示經度、緯度和時間。每個格點上的隨機數滿足均值為0,方差為σ2的高斯分布,且|r|≤1。將隨機擾動場r(x,y,t)通過二維傅里葉展開,得到:



式中,

通過上述一系列的數學變換,可以看到,SPPT方案中有三個參數會影響到隨機擾動場的形態,即格點方差(σ2下文記作A)、隨機擾動場的去相關時間(τ,下文記作T)和隨機擾動場的去相關空間(k,下文記作L)。已有學者對SPPT方案中的各參數在不同天氣尺度背景下對預報變量所起的作用進行研究(Bouttier et al., 2012; 袁月等,2016; 閔錦忠等, 2018; 徐致真等, 2019),但研究成果很大程度上依賴于所研究的動力系統,至今仍沒有明確的結論,因此仍然需要根據具體的模式配置和關注的預報對象進行大量的適應性試驗。
本文選取兩個典型個例,一是2019年11月23~25日強降溫個例,其影響系統的水平尺度相對較大,約有上百千米;二是2020年6月15~17日強降水個例,其影響系統為水平尺度200 km內的中尺度渦;這兩類天氣發生的季節不同,影響系統的特征尺度也存在差異,上述三個參數對預報的影響如何?參數值的選取是否具有一定的通用性?它們之間怎樣的配置可以最大程度地表征V2模式誤差的不確定性?為了回答上述問題,設計表2的敏感性試驗,其中參考試驗REF的參數取默認值,A、T和L為單一要素的敏感性試驗,PHY為同時調整三參數的試驗,試驗中初始場和側邊界條件均不做擾動,取兩倍的方差作為臨界振幅值;需要說明的是,由于計算資源的限制,表2中各試驗的集合成員數均為9。
圖2給出表2各組試驗離群值(Outlier,數據中有一個或幾個數值與其他數值相比差異較大)的時序圖,這里選取850 hPa溫度場,850 hPa緯向風場和2 m溫度場進行分析,試驗中成員數取N=9,則理想的離群值即為0.2 [計算公式為2/(N+1)],越接近理想值則說明系統的可信度越高??梢钥吹綄τ诓煌竟?,不同尺度的天氣個例,三個敏感參數的表現一致,說明這些參數具有較好的代表性和通用性。它們之間對預報的相對作用各不相同,對格點方差(A)進行改變后,各預報變量均出現了較大的變化,增加方差會系統性的降低離群值,反之,則增加了離群值,說明方差的增加使得集合系統的離散度隨之增加,從而使得成員間的差異性增大,反映出更多預報的不確定性。隨機擾動場的去相關空間(L)和隨機擾動場的去相關時間(T)的改變,對預報的影響較小,與參考預報的結果相差不大,其影響遠遠小于方差改變帶來的影響;但仔細分析也會發現,在夏季個例中,當增加L和延長T時,也會微弱地降低離群值,在一定程度上改進預報的可信度;三個參數對預報的影響大小依次為:A>L>T。當PHY試驗根據模式自身的配置,合理調整SPPT方案中參數的閾值,并將其進行合理地組合后,在整個預報階段,系統的離群值與理想的離群值最為接近,說明增強模式中隨機物理過程的作用,更能有效地提高集合系統整體的可信度和預報能力。

表2 隨機物理傾向擾動方案(SPPT)的優化試驗Table 2 Sensitive experiment of stochastic parameters
同時,上述變量集合平均的均方根誤差隨時間的變化(圖略)曲線也反映出:在整個預報時段,各組試驗集合平均的預報誤差均小于控制預報;其中對格點方差進行調整,各變量的預報誤差在預報初期就有較明顯下調,且隨著預報時效的延長,集合平均相對于控制預報改進的幅度更為顯著;相對而言,改變擾動的空間尺度和時間尺度,兩組誤差曲線的走勢較為接近,集合平均對控制預報的改進幅度較小。從變量上看,850 hPa緯向風的誤差減少最為明顯,其次是850 hPa溫度和2 m溫度。
連 續 分 級 概 率 評 分(Continuous Ranked Probability Score,簡稱CRPS)可以量化預報變量的累計概率分布函數(CDF)與觀測值Heaviside函數之間的差異(Hersbach, 2000),可用于評估集合預報與確定性預報的預報準確率,CRPS越小表示預報準確率越高,理想情況下CRPS等于零,CRPS計算公式為

CRPS的時序圖如圖3所示,參數間的調整會引起CRPS不同程度的變化??偟膩碚f:對不同的變量,減小方差A,會增加CRPS,反之則會減小CRPS,改變A所引起CRPS的變化幅度最為明顯;改變擾動場的去相關空間L和去相關時間T,在不同的預報時刻,兩組試驗的CRPS曲線在參考預報附近上下波動,其變化幅度均較小。當合理地將參數進行配置后,CRPS值會明顯降低,這與圖2的結論一致。注意到不同變量的CRPS也有差別:850 hPa溫度的CRPS變化區間為0.2~0.7,850 hPa緯向風的變化范圍在0.5~1.2,2 m溫度的CRPS在1.4~2.1范圍內波動,這反映出模式對各變量的預報準確度也存在著差異。同時注意到:冬夏個例之間,SPPT各參數間的影響趨勢相似,但從預報的準確度上看,變量之間卻存在差異:對于850 hPa的溫度和緯向風冬季個例整體CRPS變化區間小于夏季個例,反映出模式對冬季個例中低層的預報準確度更高;而2 m溫度的預報,夏季的CRPS評分低于冬季,說明系統對夏季2 m溫度的預報技巧更高。

圖2 2019年11月23~25日冬季個例(左列)和2020年6月15~17日夏季個例(右列)的各組敏感試驗(a、b)850 hPa溫度、(c、d)850 hPa緯向風速和(e、f)2 m溫度離群值隨時間的變化Fig. 2 Time series of the outlier of sensitive experiments for (a, b) 850-hPa temperature, (c, d) 850-hPa zonal wind, and (e, f) 2-m temperature for the winter case from 23 to 25 November 2019 (left column) and for the summer case from 15 to 17 June 2020 (right column)

圖3 同圖2,為連續分級概率評分CRPS隨時間變化Fig. 3 Same as Fig.2, but for CRPS (Continuous Ranked Probability Score)
從上述典型個例的試驗及評估結果可見,SPPT方案中參數的選取具有一定的通用性,當根據模式自身的配置來合理調整參數的閾值,可以強化隨機過程的影響,對預報起到正效果;為此將試驗得到的最優方案引入到V2中,以最大程度地表征V2模式誤差的不確定性。
本文降水預報檢驗使用圖1中SWARMS-ENV1范圍內的全國加密自動站資料,該區域內有效站點數超過20000個;同時,地面和高空變量的檢驗使用同化后的格點分析場資料。需要說明的是,文中V1與V2的比較部分,為了比較的公正性,即將V2的變量值插值到V1的區域進行,其中水平插值方法為雙線性插值,垂直插值方法為線性插值,檢驗統一為V1區域。
梅雨是我國汛期重要的天氣氣候系統,2020年夏季江淮流域經歷了一次典型的梅雨季,梅雨呈現出入梅早、出梅晚、梅雨期長、雨區范圍廣、累計雨量大、強降水過程多的特點(劉蕓蕓和丁一匯, 2020),一些學者從觀測事實出發,對這次超強梅雨的形成原因做了探討分析(陳濤等, 2020; 張芳華等, 2020)?;谏鲜龅湫蛡€例的試驗結果,選取此次梅雨季作為研究對象,試驗時間為2020年6月7日至7月7日,通過對比分析V1和V2的強降水預報情況,從而加深對系統現有預報能力的認識,也為后續對V2的進一步改進提供科學依據。
3.1.1 TS/Bias評分檢驗
圖4給出系統升級前后一個月的梅雨試驗的降水TS(Treat Score)評分,圖中藍色為V1的結果,紅色為V2的結果。整體而言,TS評分隨著預報時效的延長呈下降趨勢,對于不同預報時效各量級的降水預報,V2較V1均有大幅度改善。具體來說,對于有無降水的預報,V2在2天之內的預報改善顯著,TS評分整體能維持在0.6以上,但之后的預報技巧不及V1,略微下降至0.5左右;但降水一旦發生,V2對降水落區和強度的描述則更為準確,表現為在各時次各量級的TS評分均有所提高。

圖4 2020年6月7日至7月7日(a)0~24 h、(b)24~48 h、(c)48~72 h、(d)72~96 h和(e)96~120 h累計降水的TS評分箱線圖(橫坐標為降水量級,藍色為V1,紅色為V2)Fig. 4 Boxplot of Treat Score for 24-h accumulated precipitation from June 7 to July 7, 2020: (a) 0–24 h; (b) 24–48 h; (c) 48–72 h; (d) 72–96 h;(e) 96–120 h. The abscissa is the precipitation level, blue is V1, and red is V2
與此同時,從預報偏差的對比結果看(圖5),兩個系統的Bias評分均大于1,說明均存在著對各降水量級過度預報的趨勢,V1在預報時效96 h之內對大雨及以下量級的預報偏差變化幅度較小,基本維持在1.5上下,對暴雨量級的預報,預報偏差明顯增加;V2的偏差在中雨以下量級與V1相當,但對于更大量級的降水,偏差則尤為突出。空報率則從另一個側面來評估模式預報的準確性,它衡量的是預報將發生的事件中有多少比例在實況中并沒有發生,計算發現,V2的空報率相比于V1,在有無降水和小雨量級的預報中,各時次的空報率下降明顯;中到大雨的量級,V2的空報率大于V1(圖略)。

圖5 同圖4,但為Bias評分Fig. 5 Same as Fig. 4, but for Bias score
3.1.2 BSS評分檢驗
BSS(Brier Skill Score;Brier, 1950)評 分(?∞,1]之間,其值越大越好,評分為1即表示完美的概率預報,計算公式為

其中,BS為BS評分(Brier Score), BSref為參考預報的BS評分,這里選取試驗期間1個月的平均觀測概率作為參考預報,pi為預報概率,oi為觀測概率。
圖6給出系統升級前后不同預報時效、各降水量級的BSS,圖中藍色為V1結果,紅色為V2結果。由圖6可見,BSS各時次走勢相近,整體而言,相同的預報時效,隨著降水量級的增加,評分逐漸降低;同時相同的降水量級,隨著預報時效的延長,評分也呈下降趨勢。其中,V1對大雨(<25.0 mm)及以下量級的BSS為正值,說明相對于參考預報,V1對于大雨及以下量級的預報有正技巧;但隨著降水強度的進一步加大和預報時效的延長,BSS有負值出現,說明預報技巧有所下降,其中V1對于50.0 mm以上的強降水,除24 h外,各預報時次均缺乏預報能力。反之,V2的BSS曲線對不同的降水量級在各預報時效均為正值,說明相對于參考預報,整體上V2的概率預報更有參考性;同時V2的BSS普遍高于V1,反映出V2的預報準確率較V1均有不同程度的改進。此外,隨著降水量級的增加,兩組BSS曲線間的差別也逐漸擴大,反映出V2對強降水的概率預報準確率和可信度較V1改善幅度更顯著。

圖6 2020年6月7日至7月7日24 h累計降水的BSS(Brier Skill Score)評分。橫坐標為降水量級,藍色為V1,紅色為V2;圖中f120、f96、f72、f48、f24表示預報時效分別為120 h、96 h、72 h、48 h以及24 hFig. 6 BSS (Brier Skill Score) for 24-h accumulated precipitation from June 7 to July 7, 2020. The abscissa is the precipitation level, blue is V1, and red is V2; f120, f96, f72, f48, f24 mean 120-h, 96-h, 72-h, 48-h, and 24-h forecast
3.1.3 ROC曲線
相對作用特征(Relative Operating Characteristic,簡稱ROC)的原理是將信號探測理論應用到數值天氣預報的二分類要素預報的檢驗中,ROC曲線是對概率預報系統的分級概率分別計算命中率與假警率,用以判斷系統的預報準確率(Harvey et al.,1992),在ROC曲線中,曲線位于對角線左上方則可認為系統是具有預報能力(Mason and Mimmack,2002),圖中對角線可視為技巧線。由于主要關注集合預報系統在3天以后的降水預報,這里給出新舊兩個系統120 h預報時效對不同降水量級的ROC曲線(圖7),在其他預報時段結果類似(圖略)。由圖可見,無論是升級之前還是升級之后的系統,其曲線均位于對角線上方,反映出系統具備了一定的預報能力;同時,ROC曲線與對角線所包含的面積,可用ROC面積表示,這也是衡量系統預報準確率的另一種方式,從圖中可以看到,隨著降水量級的增加,ROC 面積呈現逐漸減小的趨勢。具體到各個降水量級,兩個系統對各個分級概率的命中率和假警率變化趨勢一致,即隨著概率臨界值的增加,命中率和假警率也隨之增加;對有無降水的預報(圖7a),V1的ROC面積大于V2,反映出V1對有無降水的預報準確率更高;當降水量級增加到中雨(圖7b),情況則相反,V2的ROC面積大于V1,相比于有無降水的情況,相同概率臨界值的假警率普遍大幅降低;大雨量級的ROC評分與中雨類似(圖7c),V2的得分高于V1,且兩者的差別更為顯現,說明對于較大量級的降水預報,V2的預報準確率更高,這一結果與3.1.2節的結果一致。

圖7 2020年6月7日至7月7日新舊系統120小時預報時效(a)0.1 mm、(b)10.0 mm和(c)25.0 mm不同降水量級24 h累計降水的相對作用特征(ROC)曲線(藍色為V1,紅色為V2)Fig. 7 ROC (Relative Operating Characteristic) diagram for 24-h accumulated precipitation of (a) 0.1 mm, (b) 10.0 mm, and (c) 25.0 mm for 120-h forecast period from June 7 to July 7, 2020. Blue is V1, and red is V2
3.2.1 均方根誤差—離散度關系
常用集合平均的均方根誤差與集合離散度的關系來探討集合系統的可信度。對于一個完美的集合系統而言,集合離散度可以反應出隨流型變化的預報的不確定性,因此,集合離散度與誤差隨時間應有相同的振幅和增長率。許多集合系統的發散度都偏低,即表現為預報的不確定性遠大于離散度,從而導致預報過度自信(Buizza et al., 2005),圖8給出系統升級前后對不同預報變量的集合離散度與均方根誤差的變化曲線,兩者越接近則說明集合系統的可信度越高??傮w上看,V2系統各個變量大部分時次的預報誤差均較V1有大幅降低,同時離散度穩步提高,即兩者之間的差值在縮??;而相對而言,V1系統對各變量的預報,一方面預報誤差較大,另一方面離散度也維持在低位,很難隨著預報時效的延長而得到發展,致使兩者的差值較大。具體到每個變量,改善最為明顯的是850 hPa緯向風,其次是700 hPa相對濕度和10 m緯向風。同時從均方根誤差(RMSE)的曲線上可見,V1系統對850 hPa的溫度和緯向風的預報存在波動的現象,即有日變化的抖動,這種現象在V2系統中得到緩解,反映出預報更趨于穩定。
3.2.2 Talagrand分布
Talagrand圖表是評估集合預報系統常用的工具(Talagrand et al., 1997; Hamill and Colucci, 1997),用于檢查觀測落在排序后的集合成員預報的相對區間的頻數。一個可信的集合預報系統,能較好地表征預報的不確定性,從統計意義上說,觀測落在集合成員間的頻數是相同的,Talagrand圖表則表現為相對平坦的分布。圖9給出集合系統對各預報變量120小時的Talagrand分布,根據21個集合成員,可以計算得到觀測頻率的最優值,即1/22(0.045),當各區間的數值越接近這個最優頻率,說明系統成員間的等效性一致,整體性能越好。整體上看,V1的各變量均呈現出明顯的U型分布,反應出系統的離散度不足,特別是位勢高度場,整個垂直層自上而下表現一致,各層的最大頻率均超過0.4,其中500 hPa位勢高度場的最大頻率接近0.438;對比各預報變量,發現V2對系統的改進最為顯著的是700 hPa相對濕度、850 hPa緯向風和10 m緯向風,從圖表中可以看到,各區間的頻率分布平坦,與最優頻率接近,這一結果與圖8的結果一致;對其他變量,V2的分布雖依然呈現出U型分布,但整體分布形態有所緩解,頻率大值區較V1均有下降,說明系統離散度不足的問題有一定程度的改善。

圖8 2020年6月7日至7月7日新舊系統預報的(a)500 hPa位勢高度、(b)700 hPa相對濕度、(c)850 hPa溫度、(d)850 hPa緯向風、(e)2 m溫度和(f)10 m緯向風集合平均均方根誤差(RMSE)與集合離散度(SPD)隨時間變化Fig. 8 Time series of the RMSE (root mean square error) and the ensemble mean and the ensemble spread (SPD) from June 7 to July 7, 2020: (a) 500-hPa geopotential height; (b) 700-hPa relative humidity; (c) 850-hPa temperature; (d) 850-hPa zonal wind ; (e) 2-m temperature; (f) 10-m zonal wind.blue is V1, and red is V2

圖9 2020年6月7日至7月7日新舊系統預報的120 h的(a)500 hPa位勢高度、(b)700 hPa相對濕度、(c)850 hPa溫度、(d)850 hPa緯向風、(e)2 m溫度和(f)10 m緯向風的Talagrand分布Fig. 9 Talagrand diagram for (a) 500-hPa geopotential height; (b) 700-hPa relative humidity; (c) 850-hPa temperature; (d) 850-hPa zonal wind; (e) 2-m temperature and (f) 10-m zonal wind for 96–120-h forecast period from June 7 to July 7, 2020. Blue is V1, and red is V2
3.2.3 CRPS評分
進一步從概率預報的角度來檢驗系統升級前后的預報能力,圖10給出了各變量CRPS隨時間的變化曲線。由圖可見,系統升級后,整體的CRPS均呈現出明顯的下降趨勢,說明系統的整體預報能力有所提升。對不同的變量,預報能力各異,其改進的幅度也存在差別。具體而言,CRPS值變化幅度最大的是500 hPa的位勢高度場(圖10a),隨著預報時效的延長,V1的CRPS呈單調遞增的趨勢,變化區間為0.5~2.4,V2除前24 h降低,其它時次的變化趨勢與V1相似,但CRPS的絕對數值上有大約0.5的降幅。此外,改進幅度顯著的還有850 hPa的溫度和緯向風,36 h溫度的CRPS值從1.4降低至0.6,120 h緯向風的CRPS值從1.3降低至0.65,改進幅度均在50%以上。此外,對于溫度的預報,無論是大氣中低層850 hPa(圖10c)還是地面2 m的溫度(圖10e),V1的CRPS呈現波動的趨勢,V2為相對平滑的曲線,這與其他變量一致,說明V2預報的連續性和一致性更好。CRPS的絕對數值大小,也反映出系統對各變量的預報準確性,V2對中低層緯向風的CRPS各時次均在0.5附近,700 hPa相對濕度和850 hPa溫度的CRPS也控制在0.4~1.0范圍內,說明系統對上述變量的預報能力優于500 hPa位勢高度場和2 m溫度,這也與前文的結論一致。

圖10 同圖8,為CRPSFig. 10 Same as Fig.8, but for CRPS
基于全國自動站資料繪制2020年6月15日00:00至16日00:00(協調世界時,下同)24 h累計降水量(圖11a),關注安徽省中部和南部、江蘇省南部及上海這一范圍的強降水,各站累計雨量普遍在100~150 mm;從天氣分析可知(圖略),這次過程的環流背景為典型的江淮梅雨配置:歐亞大陸的中高緯地區,呈現兩槽一脊的形勢;地面天氣圖上,長江沿岸和四川盆地為靜止鋒,其中中國東部地區的靜止鋒與中低空切變線位置較重合,給長江下游沿岸帶來持續性的暴雨。為了解華東區域中尺度集合預報系統在中后期對強降水的預報能力,分析6月13日00:00起報,系統72 h大于50 mm的降水概率預報(圖11b–c)。從預報的雨帶位置上看,V1的強雨帶主體位于長江以北,降水中心概率約50%~70%,但相比實況的強降水落區,預報略微偏北,以致安徽中部的強雨帶出現斷裂,且安徽南部地區出現漏報;V2的強雨帶整體組織性較好,從空間分布上看,從河南南部、安徽省中南部至上海一線均呈現出連續的降水,可以看到其中有兩個強降水中心,其一位于江蘇省西南部,出現暴雨的概率>70%;另一個位于安徽省中南部、豫鄂交界地區,出現暴雨的概率更高(局部地區達到80%以上),而且與實況的強降水中心更為吻合。

圖11 (a)2020年6月15日00:00至16日00:00 24 h累計降水量(單位:mm)分布;2020年6月13日00:00起報(b)V1、(c)V2系統預報大于50 mm的降水概率分布Fig. 11 (a) Distributions of 24-h accumulated precipitation (units: mm) from 0000 UTC 15 to 0000 UTC 16 June 2020, and the probability more than 50 mm of (b) V1 and (c) V2 for 96–120-h forecast period
本文通過考慮區域模式預報中不確定性的各種來源,分別引入初始場誤差、側邊界誤差和模式誤差來構建新一代的華東區域中尺度集合預報系統(SWARMS-ENV2),并從提高集合系統離散度的角度出發,對SPPT方案的參數進行優化;將新舊系統開展2020年為期一個月的梅雨期降水試驗,得到如下結論:
(1)通過對SPPT方案中參數的敏感性試驗證實了所調優的參數具備一定的通用性。對預報的影響大小依次為:格點方差、隨機擾動場的去相關空間和隨機擾動場的去相關時間。根據模式的自身配置,合理調整三個參數的閾值,從而強化物理過程的隨機效應,通過對大氣中低層的風場、濕度場的影響,可以有效地提高集合系統整體的可信度和預報能力。
(2)梅雨期降水試驗的評估結果表明:升級后的華東區域中尺度集合預報系統在各時次各量級的降水TS評分均有所提升,但仍然存在著降水強度偏大的問題。
(3)綜合各類降水概率預報的評估結果可見:系統升級后對中到大雨預報的準確率和可信度提升明顯,對強降水事件的描述更準確。
(4)形勢場的檢驗結果表明,SWARMSENV2各變量的分布表現出不同的特征:系統對大氣中低層風場、濕度場和2 m溫度的預報效果有明顯改進,但對形勢場的預報仍存在一定的預報偏差。相比SWARMS-ENV1,系統升級后,其整體性能明顯提升,其優勢可概括為:系統預報誤差的降低,離散度的增加,即系統整體的預報可信度增加;從用戶的角度而言,對一些關鍵過程,預報的可提示性增加,產品的可用度提高。