潘留杰 薛春芳 梁綿 高星星 祁春娟 劉嘉慧敏 王建鵬
(1 陜西省氣象臺,西安 710014;2 秦嶺和黃土高原生態(tài)氣象環(huán)境重點實驗室災(zāi)害性天氣研究與應(yīng)用中心,西安 710044;3 陜西省氣象局,西安 710014)
降水不僅是公眾最為關(guān)心的氣象要素,同時也是政府、工業(yè)、農(nóng)業(yè)、水文等部門和氣象地質(zhì)災(zāi)害預(yù)警各領(lǐng)域的關(guān)注重點[1]。數(shù)值模式是降水預(yù)報的基礎(chǔ),然而,所有的數(shù)值天氣預(yù)報模式都是對真實大氣狀態(tài)的抽象表示[2],受初始場、邊界條件、模式框架結(jié)構(gòu)、物理過程和參數(shù)化的影響,從而不可避免的產(chǎn)生各種誤差,就降水預(yù)報來說,除去隨機性誤差外,還有強度、位置、形態(tài)以及時間等各種系統(tǒng)性誤差。因此,模式輸出的降水產(chǎn)品,在很大程度上還不能直接提供給用戶或者公眾使用。
數(shù)值模式釋用或者說數(shù)值模式統(tǒng)計后處理[3](Model Output Statical)將模式直接輸出的要素預(yù)報和觀測資料聯(lián)系起來,在保留模式原始預(yù)報技巧的基礎(chǔ)上,修正模式中的預(yù)報偏差和離散性誤差,降尺度輸出適合用戶需求的預(yù)報產(chǎn)品,是多年來世界各國廣泛使用的數(shù)值預(yù)報后處理方法。事實上,數(shù)值模式釋用包括模式產(chǎn)品檢驗和客觀訂正兩部分,盡管檢驗對模式開發(fā)者來說,其目的和意義更多的在于模式框架或參數(shù)化方案的調(diào)整,但客觀檢驗是產(chǎn)品使用者監(jiān)控模式預(yù)報性能,理解預(yù)報誤差,找出提高預(yù)報質(zhì)量的訂正方法的前置工作和有效途徑,對期望通過統(tǒng)計后處理,提高預(yù)報表現(xiàn)的用戶來說,檢驗和訂正方法密不可分。降水是氣象要素檢驗中最為重要的部分,其檢驗的復(fù)雜度隨著模式網(wǎng)格分辨率的提高快速上升,這一方面是由于時空尺度越精細,降水在時空上的個體表現(xiàn)差異更加突出[4],另一方面,數(shù)值模式本身的參數(shù)化方案或物理過程對小尺度刻畫不完善,可能導(dǎo)致更多的相位或隨機誤差[5],客觀上增加了降水檢驗的難度。針對模式網(wǎng)格降水的時空分辨率和產(chǎn)品差異化等不同特性,主要發(fā)展了三種檢驗技術(shù):一是針對粗網(wǎng)格數(shù)值預(yù)報模式的傳統(tǒng)檢驗方法或者稱為經(jīng)典檢驗方法[6];二是降水空間檢驗技術(shù),由于傳統(tǒng)檢驗方法不能對降水系統(tǒng)的位置、形態(tài)的預(yù)報表現(xiàn)進行判定,在降水位置細微偏離的情況下,可能出現(xiàn)雙重懲罰的現(xiàn)象,因此,隨著高分辨率細網(wǎng)格模式的快速發(fā)展,基于空間位置、降水空間形態(tài)以及時間偏差特征的空間檢驗方法快速發(fā)展;三是集合預(yù)報檢驗技術(shù),集合預(yù)報給出不同初始擾動條件下的多個預(yù)報結(jié)論,其預(yù)報結(jié)果不唯一,因此可靠性、辨識度或稱之為解析度是集合預(yù)報的主要評估指標。此外,針對極端降水事件,還發(fā)展起來了基于預(yù)報和觀測降水依賴性的極端天氣評分EDS(Eхtreme Dependency Score)、EDI(Eхtreme Dependency Indeх)和SEDS(Symmetric Eхtreme Dependency Score)等極端天氣事件的檢驗評分方法。
從數(shù)值模式原始輸出產(chǎn)品出發(fā)到最終發(fā)布的降水客觀預(yù)報產(chǎn)品,降水的統(tǒng)計后處理或者說客觀訂正對預(yù)報質(zhì)量至關(guān)重要。生成客觀降水預(yù)報產(chǎn)品的原始模式產(chǎn)品可以是來自于單模式的統(tǒng)計后處理,也可以是全球模式、區(qū)域模式和預(yù)報員主觀訂正降水產(chǎn)品的集成,還可以是集合預(yù)報產(chǎn)品的融合統(tǒng)計[7]。針對單模式的統(tǒng)計后處理,發(fā)展了基于預(yù)報因子和觀測降水的回歸模型的訂正方法[8]、依據(jù)預(yù)報要素和模式輸出物理量統(tǒng)計關(guān)系的強降水配料法預(yù)報[9]、利用觀測和預(yù)報的頻率分布特征的降水頻率匹配訂正技術(shù)[10]、人工神經(jīng)網(wǎng)格降水[11]和降水偏差訂正[12]等一系列技術(shù)方法。在多模式集成方面[13],有多模式集合平均、消除偏差集合平均、加權(quán)消除偏差集合和多模式超級集合等多種方法;也有研究[14]在嶺回歸、隨機森林、深度學(xué)習(xí)等機器學(xué)習(xí)基礎(chǔ)上建立多模式集合預(yù)報后處理模型改進預(yù)報質(zhì)量。
上述的降水預(yù)報檢驗和降水統(tǒng)計后處理技術(shù),大多數(shù)是基于氣象站點觀測資料建立起來的檢驗和訂正方法,這些方法的檢驗結(jié)果和預(yù)報產(chǎn)品的表現(xiàn)形式也多為站點形式。事實上,當(dāng)實況格點再分析滿足用戶需求時,這些方法中的大多數(shù)也適合于網(wǎng)格降水預(yù)報的檢驗和訂正。在實況格點再分析不能有效獲取的情況下,將站點誤差在預(yù)報場上合理分配,也是一種有效的釋用方法。本文的主要目的是回顧近年來針對網(wǎng)格預(yù)報檢驗訂正技術(shù)發(fā)展起來的一些新的方法和新應(yīng)用,文章也展望了網(wǎng)格降水預(yù)報檢驗訂正技術(shù)的可能發(fā)展方向。
經(jīng)典檢驗方法是基于二元列聯(lián)表建立的點對點的檢驗,也稱之為傳統(tǒng)檢驗方法。降水作為離散型變量,可以簡單將降水分為肯定或否定預(yù)報的二元事件,也可作為多分類預(yù)報進行檢驗。
早在1884年,Donaldson[15]提出兩種性能指標,一種是臨界成功指數(shù)CSI(Critical Success Indeх),被用來衡量預(yù)測的準確性,特別是在罕見事件或不可預(yù)測、不可觀測頻率的情況下的稀有事件;第二種是由Schaefer[16]根據(jù)歷史優(yōu)先原則命名的Gilbert評分(Gilber Skill Score)。到1965年,Brounlee等[17]通過兩變量的列聯(lián)表計算命中率POD,虛警率FAR,誤警率FOM等。1987年,F(xiàn)lueck[18]在Hanssen-Kuipers評分的基礎(chǔ)上再次提出了真實技巧評分TSS(True Skill Statistic)。1990年,Doswell[19]針對小概率事件的TSS預(yù)報評分常趨于零的極端情況,修改 TSS評分為HSS評分,隨后在此基礎(chǔ)上發(fā)展了預(yù)報偏差Bias[20]、OR[21]指數(shù)、預(yù)報準確率 ACC等多個檢驗指標,并發(fā)展出了預(yù)報性能評分綜合圖(圖1)。

圖1 降水預(yù)報性能傳統(tǒng)評分綜合示意圖[24]Fig. 1 Rainfall prediction skill score distribution[24]
除了二分類預(yù)報事件以外,利用 2×K的列聯(lián)表可以用來檢驗多分類事件的確定性預(yù)報,也可以用來檢驗多分類事件中發(fā)生概率的準確性。2010年,Rodwell等[22]基于2×K列聯(lián)表設(shè)計概率空間的穩(wěn)定公平誤差(SEEPS)評分,用于識別降水量模式預(yù)報誤差,適應(yīng)短期內(nèi)降水量的概率分布檢驗。
經(jīng)典檢驗方法的主要缺陷在于以點對點的方式進行對比,盡管其檢驗結(jié)果最為精確,然而點對點的檢驗物理意義不清晰,在識別高分辨率模式預(yù)報性能的小尺度變化方面,經(jīng)典檢驗方法無能為力[23]。空間診斷檢驗方法是伴隨著高分辨率模式而產(chǎn)生的,按其對變量空間結(jié)構(gòu)的描述方式,可以分為濾波和位移法兩大類,在具體的檢驗方式上又可以細分為鄰域法和尺度分離法,以及基于屬性特征的方法和變形場法。
鄰域法是在觀測樣本稀疏條件下檢驗高分辨率網(wǎng)格模式的一種折衷方法。圖2為鄰域法的概念示意圖[24]。鄰域法的預(yù)報評分一般會隨著鄰域尺寸的增大及較小尺度被有效濾除而提高,對于達到可接受的水平尺度,將其看做“尺度技巧”[25]。FSS(Fractions Skill Score)是鄰域法的主要檢驗指標[26],具體方法為利用閾值對有降雨的網(wǎng)格定義,比較預(yù)報和觀測降雨網(wǎng)格降水匹配情況,得到分數(shù)技巧評分(FSS):

圖2 鄰域法示意圖[24]Fig. 2 The diagram of neighborhood section method

式中:Pf和Po分別為選定半徑網(wǎng)格內(nèi)觀測事件發(fā)生的概率和預(yù)報事件的頻率,N為域內(nèi)鄰域的數(shù)量。
有研究[27]表明當(dāng)樣本量較大時TS評分檢驗結(jié)果與FSS評分類似,但針對小概率事件,TS評分不能表現(xiàn)真實的預(yù)報技巧,F(xiàn)SS評分考察鄰域半徑內(nèi)的降水預(yù)報表現(xiàn),隨著鄰域半徑的增大,表現(xiàn)出穩(wěn)定的變化趨勢,在評估不同模式對小概率事件的預(yù)報能力方面具有優(yōu)勢,不足之處在于模糊了空間范圍,降低了評估精度。
尺度分離法可評估由于空間尺度不同導(dǎo)致的誤差問題,按照降水的尺度特性進行尺度分離。1997年,Briggs等[28]使用二維小波分解衡量尺度依賴的預(yù)報誤差,之后Casati等[29]綜合運用降水強度和尺度,提出了“強度-尺度檢驗方法”,強度-尺度檢驗利用強度閾值將預(yù)報場和觀測場轉(zhuǎn)為1和0的二進制場,再使用Haar小波進行二維分解,從而得到降水強度在不同尺度上的預(yù)報評分SSL:

式中:L為空間尺度,MSEL為在尺度L上預(yù)報相對于觀測的均方根誤差,fobs為觀測場中第L個尺度上預(yù)報相對于觀測的預(yù)報偏差,B為預(yù)報相對觀測的尺度偏移量。
基于特征的方法是最直觀的空間檢驗方法,可以診斷預(yù)報特征屬性如位置、大小、平均強度等誤差。Ebert等[24]提出的CRA(Contiguous Rain Area)方法能夠?qū)⑻卣髯R別為指定閉合閾值范圍內(nèi),符合最小相連區(qū)域的尺度標準。Wernli等[30]提出通過計算三個無量綱誤差衡量指標S(結(jié)構(gòu)誤差)、A(振幅誤差)、L(位置誤差)來表征預(yù)報質(zhì)量,此方法進一步證實高分辨模式對降雨結(jié)構(gòu)預(yù)測的有效性。Davis等[31]提出了通過卷積識別出預(yù)報場和觀測場中降水對象的診斷評估方法(MODE),近年來廣泛應(yīng)用于模式降水預(yù)報性能的個例分析(圖3)[32]、不同空間檢驗方法適用性的對比[33]、強對流降水對象的識別和檢驗[34]以及MODE方法相對傳統(tǒng)檢驗的優(yōu)缺點。最近在空間對象檢驗的基礎(chǔ)上,還發(fā)展出了三維空間時域?qū)ο笞粉櫃z驗方法,評估模式降水的時間偏差(圖4)[35]。

圖3 MODE檢驗個例[32](a,b)個例預(yù)報和觀測降水;(c,d)預(yù)報和觀測場提取的獨立對象;(e,f)預(yù)報和觀測場中的預(yù)報組合匹配對象Fig 3 MODE Test Cases(a) and (b) forecast and observed precipitation, (c) and (d) independent objects extracted from forecast and observation,(e) and (f) forecast combination matching objects in forecast and observation

圖4 時間三維卷積檢驗概念示意圖[35](a)時間生命周期15 h的降水對象演變;(b)卷積對象橢球體Fig. 4 Conceptual scheme of Time 3D convolution test(a) Evolution of precipitation with a time life cycle of 15 h;(b) Ellipsoid of convolution object
變形場方法是通過擬合預(yù)報場到觀測場的空間降水強度、位置等變化幅度對預(yù)報場進行檢驗的方法。2009年,Gilleland等[36]將變形場法定義為關(guān)注范圍內(nèi)預(yù)報場的整體位置誤差。Keil等[37]通過反向處理方法將預(yù)報場變形為觀測場,再利用位移-振幅評分變形得到振幅誤差和位移誤差,此外還有圖像變形技術(shù)[38]、優(yōu)化似然函數(shù)變形度方法[39]。
集合預(yù)報通過為初始場加入擾動誤差,增加成員預(yù)報來把握預(yù)報結(jié)論的不確定性,從而提高對降水的預(yù)報能力。集合預(yù)報評估中最通用的方法是計算Brier評分,它反映的是預(yù)報概率與通過給定閾值將觀測劃分為0或1兩種情況下的平方差。Brier評分的主要不足在于盡管它能反映概率預(yù)報系統(tǒng)的優(yōu)劣,但在實際業(yè)務(wù)中很難提供簡明的判別標準。1973年,Murphy[40]將Brier評分分解為可靠性、分辨能力、不確定項三部分,從而使其物理意義更加清晰。在實際應(yīng)用中,首先是發(fā)展了反映預(yù)報概率相對于觀測頻率的可靠性圖[41];其次是出現(xiàn)了區(qū)分預(yù)報概率和空報率的ROC分析圖[42],ROC分析是信號探測原理在預(yù)報檢驗評估中的應(yīng)用,它通過計算預(yù)報的命中率和空報率來區(qū)分預(yù)報系統(tǒng)對事件發(fā)生或者不發(fā)生的分辨能力,從而使用戶能夠定量把握命中率和空報率所占比重。其他還有分級概率評分RPS[43]、無知評分IS[44]、連續(xù)分級概率評分CRPS[45]等。
研究適合極端降水的檢驗方法,對于提高高影響災(zāi)害天氣預(yù)報水平至關(guān)重要,目前這一領(lǐng)域仍處于起步階段,面臨諸多挑戰(zhàn)。以往的經(jīng)典傳統(tǒng)檢驗評分隨著極端事件稀有性的增加會趨向衰減為一個極小值,有學(xué)者專家提出解決方法,在計算估計預(yù)報性能衰減率的基礎(chǔ)上,重新校正極端降水預(yù)報計算極端依賴指數(shù)EDI[46],具體如下:

式中,H、F為分別為預(yù)報命中率和空報率。EDI閾值為[-1,1],0為區(qū)分隨機預(yù)報好與壞的分界點,與基準率無關(guān),較為合理,相比Stephenson等[47]提出的極端依賴評分EDS更加客觀。
網(wǎng)格降水客觀釋用技術(shù)主要包括單模式訂正和多模式集成[48]以及數(shù)據(jù)預(yù)處理的降尺度技術(shù)[49]。針對集合預(yù)報還有特定的概率預(yù)報釋用,主要目的是對集合預(yù)報進行后處理,用來提高預(yù)報可靠性和概率預(yù)報的技巧[50]。此外,近年來在降水訂正中,機器學(xué)習(xí)和人工智能也得到了一些發(fā)展應(yīng)用,文章也做了一些簡單的歸納和總結(jié)。
MOS方法是1972年Glathn等[51]提出的。經(jīng)典MOS后處理大體上可歸納為兩種,一種是基于數(shù)值模式輸出的各種產(chǎn)品建立統(tǒng)計模型,得到訂正降水量,即經(jīng)典MOS的間接后處理;另一種是直接訂正模式輸出降水,提高預(yù)報準確率,即經(jīng)典MOS的直接后處理[52]。配料法不是簡單的回歸分析,它根據(jù)不同變量之間的物理聯(lián)系,建立預(yù)報方程。該方法是Doswell等[53]1996年提出的一種致洪暴雨預(yù)報方法,在冬季降水預(yù)報研究[54]、地形降雨預(yù)報[55]、雷暴和龍卷分析預(yù)報[56]都有廣泛應(yīng)用。有研究認為構(gòu)建配料法的要素對預(yù)報效果有關(guān)鍵影響[57]。國內(nèi)天氣預(yù)報對配料法也做了深入研究,張小玲等[58]使用顯著配料要素進行暴雨預(yù)報,并在國家級降水預(yù)報業(yè)務(wù)中應(yīng)用。來小芳等[59]基于配料法設(shè)計趨勢的強降水指數(shù),并在長江下游地區(qū)暴雨預(yù)報中應(yīng)用。張萍萍等[60]提出流型辨識法與配料法相結(jié)合的暴雨預(yù)報方法。唐曉文等[61]以中尺度數(shù)值模式MM5的預(yù)報場作為原始資料計算配料綜合指數(shù)與強降水之間的關(guān)系,進而輸出降水預(yù)報。劉勇等[62]利用ECMWF高分辨率數(shù)值模式產(chǎn)品,選取相關(guān)要素作為配料因子對陜西省暴雨進行預(yù)報,結(jié)果表明配料法能夠減小模式的暴雨預(yù)報偏差。其他研究還包括配料法在梅雨鋒暴雨預(yù)報中的應(yīng)用[63]、東北冷渦暴雨“配料法”的預(yù)報模型[64]、區(qū)域暴雨配料法研究應(yīng)用[65]等,在實際暴雨預(yù)報中取得了較好效果。
頻率匹配方法、邏輯回歸方法、最優(yōu)TS(ETS)評分訂正法等是經(jīng)典MOS直接后處理的典型方法。頻率匹配方法的出發(fā)點是使預(yù)報降水頻率與觀測降水頻率達到一致,該方法類似于分段訂正函數(shù),對模式預(yù)報偏差顯著偏大的降水有較好的預(yù)報效果。一般時效較長的預(yù)報降水量偏差大于時效較短的預(yù)報,所以該方法對時效較長降水預(yù)報的改進效果更加顯著,應(yīng)用表明對模式小量級降水和暴雨預(yù)報的訂正效果顯著。在原理上,該方法只能對模式原有降水預(yù)報區(qū)域的強度進行調(diào)整,并不能憑空增加降水區(qū)域,對強降水的位置預(yù)報無訂正能力。目前在T213降水預(yù)報訂正[66]、AREM模式降水預(yù)報訂正試驗[67]、AREM模式集合成員降水量概率匹配訂正[68]等方面應(yīng)用廣泛。這些研究確定的訂正系數(shù)在整個研究區(qū)域內(nèi)是相同的,因此合理的區(qū)域劃分是頻率訂正的關(guān)鍵問題,針對這一缺點,對格點本身進行頻率匹配是研究的一個方向[69]。此外,一些工作還應(yīng)用卡爾曼濾波動態(tài)訓(xùn)練[70]、分位數(shù)映射的方法進行頻率匹配訂正[71],在保持模式降水空間分布的同時提高了降水的預(yù)報技巧。
邏輯回歸方法是針對二分類相應(yīng)變量建立的一種概率回歸模型,可以將定量降水預(yù)報看成不同量級上降水“有”和“無”的分類預(yù)報問題。該方法模型設(shè)計相對簡單,在雷電、短時強降水、概率降水預(yù)報、路面結(jié)冰風(fēng)險預(yù)警、地質(zhì)災(zāi)害概率預(yù)報等業(yè)務(wù)中都有應(yīng)用。但在降水預(yù)報中多用于短時強降水的“有、無”判斷或是概率降水預(yù)報[72],開展分等級定量降水試驗的較少。針對邏輯回歸模型過擬合問題,主成分分析[73]、二元邏輯回歸法和綜合多指標疊加法[74]對降水預(yù)報有明顯改進。但邏輯回歸中仍然存在多元線性回歸的缺點,當(dāng)變量之間高度線性相關(guān)時回歸系數(shù)不穩(wěn)定,且可能存在模型和實際業(yè)務(wù)預(yù)報效果不一致的情況。
訓(xùn)練期對提高預(yù)報質(zhì)量至關(guān)重要。理想狀態(tài)預(yù)報和觀測完全匹配,預(yù)報偏差為一,事實上由于位置預(yù)報偏離,預(yù)報偏差為一的情況下并不能得到最高的預(yù)報評分。一些研究[75]基于TS(ETS)評分最大化的方法來訂正模式降水預(yù)報。典型的做法如下:

式中:預(yù)報值和訂正值分別標記為x和y,降水閾值為Ok(k為1,2,…,10),F(xiàn)k為預(yù)報降水量和觀測降水量的對應(yīng)訂正值。x<F1時,y為0,從而消除小量級降水;y與x比值為訂正系數(shù)。該方法和頻率匹配[70]計算訂正系數(shù)的思路整體類似,不同點在于獲取訂正系數(shù)的判別指標。
與單模式確定性預(yù)報不同,集合預(yù)報統(tǒng)計后處理通過分析預(yù)報成員統(tǒng)計量及其概率預(yù)報與觀測的對應(yīng)關(guān)系,來獲取模式最佳預(yù)報結(jié)果。圖5給出了集合預(yù)報后處理概念示意圖[76]。代刊等[77]針對集合模式定量降水預(yù)報進行了系統(tǒng)的總結(jié)和回顧,后處理方法歸納為:不基于統(tǒng)計模型的非參數(shù)化后處理方法、基于概率分布統(tǒng)計模型的參數(shù)化后處理方法、考慮變量結(jié)構(gòu)的后處理方法。

圖5 集合預(yù)報后處理流程[76]Fig. 5 Post-processing outline of ensemble forecast
非參數(shù)化方法即不預(yù)先設(shè)定統(tǒng)計模型的降水訂正方法,主要通過大量的樣本統(tǒng)計訓(xùn)練來改善降水預(yù)報表現(xiàn)。該方法詳細可以分為三類:集合定量降水預(yù)報訂正、集合定量降水集成以及空間分析等方法[78]來改善降水的預(yù)報表現(xiàn)。事實上,非參數(shù)化方法中的大多數(shù)與單模式確定性降水預(yù)報訂正方法類似,在定量降水訂正方面,傳統(tǒng)的頻率匹配法、偏差訂正在集合預(yù)報降水訂正中都有廣泛的應(yīng)用。對集合預(yù)報自身來說,由于擁有多個成員,基于多成員優(yōu)勢發(fā)展了分位值映射、降水分級、直方圖排序、概率可靠性曲線以及成員相似分析等多種訂正方法。
集合定量降水集成通常是針對自身成員開展的預(yù)報訂正。在確定性單模式降水預(yù)報中,利用不同的模式預(yù)報而不擾動成員開展集成研究也有廣泛應(yīng)用。廣義上來看,集合預(yù)報定量降水集成方法可以看做是多模式集成的一個特例,概率匹配平均法、多模式相似集成法、最優(yōu)百分位法和集合偽偏差校正法是典型的集合定量降水預(yù)報集成方法。其中,概率匹配平均法在某種程度上平滑掉小尺度預(yù)報信息[79],對預(yù)報來說是一把“雙刃劍”,可能會提高預(yù)報評分,但真實的預(yù)報效果,需要更加精細的評定。多模式相似集成法是定量降水集成的主要方法,它依據(jù)歷史上成員之間分布和量級的相似性對比分析,但大多數(shù)集成結(jié)果都存在小雨的預(yù)報面積偏大,強降水極值偏低的情況[80]。最優(yōu)百分位法針對不同等級降水,利用歷史樣本確定最優(yōu)百分位值進行集成,有效提高各等級降水預(yù)報評分[81]。隨著高分辨率模式的發(fā)展,鄰域法、對象概率預(yù)報法在降水預(yù)報訂正中普遍應(yīng)用。但這些方法不特定針對于集合預(yù)報,確定性降水預(yù)報中也有廣泛應(yīng)用。總體來說鄰域法主要是在空間尺度上改善預(yù)報表現(xiàn)[82],在某種程度上是樣本過少的一種替代,通過鄰域法改善預(yù)報表現(xiàn)也是評價標準不同的具體體現(xiàn),真實的預(yù)報能力仍然需要檢驗。
參數(shù)化后處理方法假定模式成員的預(yù)報降水滿足某種概率分布,基于概率分布進行統(tǒng)計訂正,概率分布或參數(shù)模型直接影響參數(shù)化后處理方法的預(yù)報質(zhì)量,主要優(yōu)點在于已有參數(shù)模型不需要進行大樣本訓(xùn)練。集合模式統(tǒng)計輸出法[83]和貝葉斯模型平均[84]是參數(shù)化后處理的典型方法。相對于貝葉斯模型平均,集合模式輸出統(tǒng)計方法相對簡單,非均勻回歸方法、邏輯回歸方法和分位數(shù)回歸方法是集合模式輸出統(tǒng)計方法的代表。
動態(tài)交叉取優(yōu)[85]和多產(chǎn)品融合降水(圖6)預(yù)報釋用[86]是在海量模式產(chǎn)品基礎(chǔ)上發(fā)展的類似大數(shù)據(jù)降水訂正釋用方法。網(wǎng)格降水后處理中常用的人工智能機器學(xué)習(xí)算法有神經(jīng)網(wǎng)絡(luò)、支持向量機方法和Logistics判別方法等。Yuan等[87]將人工神經(jīng)網(wǎng)絡(luò)(ANN)應(yīng)用于NCEP區(qū)域譜模式集合預(yù)報系統(tǒng),改善了BS評分,提高了預(yù)報技巧。農(nóng)吉夫等[88]基于主成分徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)建立了降水預(yù)報模型。黃健敏等[89]和吳凡等[90]建立了Logistics回歸的區(qū)域地質(zhì)災(zāi)害和鐵路水害預(yù)報模型。

圖6 多產(chǎn)品融合降水預(yù)報釋用方法概念示意圖[86](a~c)分別為模式預(yù)報;(d)、(e)為低閾值消空和高閾值限定后結(jié)果;(f)為融合預(yù)報結(jié)果Fig. 6 Conceptual scheme of multi-product fusion precipitation forecast and interpretation method [86](a and c) are model forecast; (d) and (e) are the results of low threshold elimination and high threshold restriction; (f)is the fusion forecast results
SVM方法能夠處理非線性特征的要素預(yù)報[91]。一些研究[92]在多模式集成的基礎(chǔ)上,采用相關(guān)加權(quán)、多元線性回歸以及SVM回歸方法,結(jié)果發(fā)現(xiàn)SVM回歸方法的多模式集成預(yù)報得到的均方根誤差比多模式集合平均小,有正預(yù)報效果,但均方根誤差并不能全面表現(xiàn)模式的降水預(yù)報能力,通常情況下,模式降水預(yù)報的標準差小于觀測,即降水的量級分布相對集中,SVM的效果需要進一步分析。孫俊奎等[93]基于概率神經(jīng)網(wǎng)絡(luò)(PNN)、SVM和Logistics判別的3種機器學(xué)習(xí)算法建立了3 h間隔的累計降水量預(yù)報模型,并分別采用遺傳算法優(yōu)化預(yù)報模型和修正的Logistics判別方法構(gòu)建了3種降水量預(yù)報模型,經(jīng)過對比檢驗綜合了3種預(yù)報模型的優(yōu)點,在時間上實現(xiàn)發(fā)布了逐3 h分辨率的降水量短期預(yù)報。黃威等[94]基于多模式降水預(yù)報資料,采用SVM回歸方法構(gòu)建降水預(yù)報模型,發(fā)現(xiàn)在中期預(yù)報時效大雨和暴雨量級上SVM多模式集成預(yù)報方法效果最優(yōu)。
機器學(xué)習(xí)K最近鄰(KNN)模型的主要思想是在特征空間中,如果一個樣本周圍的k個最近樣本的大多數(shù)屬于某一個類別,則該樣本也屬于這個類別,這一思想對不同量級降水的預(yù)報有應(yīng)用意義,特別是在晴雨和暴雨預(yù)報特征清晰的分類中,有明顯的正向效果。已有工作中,王玉丹等[95]通過KNN模型,建立了環(huán)境、氣象因子和日降水量的關(guān)系,訂正了青藏高原的CMORPH日降水?dāng)?shù)據(jù)集,結(jié)果表明,采用KNN模型訂正后的CMORPH降水?dāng)?shù)據(jù)優(yōu)于原始數(shù)據(jù)和采用概率密度函數(shù)匹配法訂正的CMORPH數(shù)據(jù);陳浩等[96]選擇了5種機器學(xué)習(xí)模型,即KNN、多元自回歸樣條方法(MARS) 、SVM、多項對數(shù)線性模型( MLM) 和ANN,訂正再分析降水?dāng)?shù)據(jù)集,結(jié)果表明,KNN 的訂正精度最高。
降水是網(wǎng)格天氣預(yù)報中最為關(guān)鍵和重要的要素,文章系統(tǒng)總結(jié)了降水預(yù)報中的檢驗技術(shù)和統(tǒng)計后處理訂正方法。在降水預(yù)報檢驗方面可以歸納為經(jīng)典檢驗、空間檢驗、集合預(yù)報檢驗三類。經(jīng)典檢驗通過二分法列聯(lián)表計算各種預(yù)報評分來判別模式預(yù)報性能的優(yōu)劣,是點對點的對比分析,主要優(yōu)點在于定量化、易于比較;不足之處一是部分評分指標物理意義不清晰,難以理解和應(yīng)用,二是經(jīng)典檢驗不能從系統(tǒng)的角度判定預(yù)報場的預(yù)報表現(xiàn)。相比經(jīng)典檢驗,空間檢驗是伴隨高分辨率模式發(fā)展起來的檢驗方法,可以看做是經(jīng)典檢驗方法的拓展和延伸,它能夠從多個視角提供模式性能優(yōu)劣的比較和判定,大多數(shù)空間檢驗方法在給出自身獨特檢驗指標的同時,也給出經(jīng)典檢驗評分。降水空間檢驗有尺度檢驗、屬性檢驗、變形場等多種檢驗形式。空間檢驗方法能夠模擬預(yù)報員的視角給出天氣預(yù)報系統(tǒng)的快慢、位置偏差、形態(tài)預(yù)報偏差等降水的多方面預(yù)報表現(xiàn)。不足之處在于一些檢驗結(jié)果難以轉(zhuǎn)化為實際的定量指標從而改進降水場的預(yù)報表現(xiàn)。與確定性預(yù)報相比,降水的集合預(yù)報檢驗除了可以在每個預(yù)報成員、集合平均、集合預(yù)報統(tǒng)計量上應(yīng)用經(jīng)典檢驗方法和空間檢驗方法之外,還有針對自身特征的獨特檢驗方法,主要包括集合成員的離散度和概率分布函數(shù)以及Brier評分、可靠性圖、ROC分析等概率預(yù)報的檢驗方法。
降水產(chǎn)品檢驗其目的對模式開發(fā)者來說是認識模式框架、物理過程、參數(shù)化方案的不足,進而加以改進,但對大多數(shù)模式產(chǎn)品釋用者來說,通過檢驗可以認識到模式產(chǎn)品的系統(tǒng)性偏差,尋找適合的訂正方法,進而提高預(yù)報質(zhì)量,因此模式檢驗和釋用訂正密不可分。降水統(tǒng)計訂正釋用方法主要歸納為三個方面:
1)MOS方法的本質(zhì)是建立在多元線性回歸基礎(chǔ)上的統(tǒng)計方法。針對降水單模式確定性預(yù)報來說,有直接后處理和間接后處理兩種技術(shù),直接后處理技術(shù)中最有代表性的為降水頻率匹配,其他還有降水偏差訂正、位置訂正等。配料法則是間接后處理技術(shù)中的典型方法。MOS方法不僅可以用在確定性預(yù)報中,也可以用在集合預(yù)報中。與單模式統(tǒng)計后處理不同,多模式集成則是期望吸收多家模式的優(yōu)點,提高降水預(yù)報能力,近年來一些新方法快速發(fā)展,主要包括動態(tài)交叉最優(yōu)要素預(yù)報、多產(chǎn)品融合降水、最優(yōu)TS評分、邏輯回歸等,一些工作還在單模式統(tǒng)計后處理后進行二次集成,總體來說,這些方法屬于MOS方法的延伸或者拓展。從業(yè)務(wù)適用性來說,直接后處理方法易于實現(xiàn),諸如降水頻率匹配、多產(chǎn)品降水融合、動態(tài)交叉最優(yōu)要素預(yù)報等,方法物理意義清晰,技術(shù)實現(xiàn)難度較低,訂正正效果明顯,易于推廣應(yīng)用。特別是降水頻率匹配方法在國內(nèi)部分省份逐漸開展應(yīng)用,對改善網(wǎng)格降水預(yù)報質(zhì)量非常有意義。相對而言,間接后處理技術(shù)(譬如配料法)推廣應(yīng)用比較困難,這一方面是由于選定的物理量能夠在多大程度上表現(xiàn)降水的特征難以確定,導(dǎo)致不容易獲得有針對性的計算指標;另一方面不同物理量在不同的地區(qū)、不同的時段有明顯的差異,一個地區(qū)的可用指標不能直接應(yīng)用到另一個區(qū)域。
2)相對于確定性預(yù)報來說,集合預(yù)報用更多的成員預(yù)報來考慮模式預(yù)報的不確定性,事實上,針對集合預(yù)報單成員或者多成員集成后的確定性預(yù)報來說,MOS統(tǒng)計訂正方法都可以應(yīng)用,不同的是集合預(yù)報針對多成員轉(zhuǎn)換成概率預(yù)報的過程以及對概率預(yù)報結(jié)果的統(tǒng)計訂正。目前在集合預(yù)報的基礎(chǔ)上開展的網(wǎng)格預(yù)報降水訂正相對少一些,這一方面是由于集合預(yù)報成員存在優(yōu)選的過程,通過集合預(yù)報進行網(wǎng)格降水訂正更加復(fù)雜,另一方面相對于確定性預(yù)報,集合預(yù)報系統(tǒng)的時空分辨率整體偏低,利用粗分辨率集合預(yù)報降水進行降尺度,進而開展網(wǎng)格降水預(yù)報訂正,不如在高分辨率模式降水預(yù)報上開展訂正工作直接。
3)釋用訂正技術(shù)很難處理模式固有的缺陷,多模式集成或集合預(yù)報能夠吸收其他模式的優(yōu)點,但同時也混淆了模式的誤差分布,可以在一定程度上提高預(yù)報評分,但是也有增大預(yù)報員主觀判別預(yù)報降水缺陷的難度。大數(shù)據(jù)人工智能和機器學(xué)習(xí)為降水訂正釋用提供新的思路和方向。氣象工作者基于大數(shù)據(jù)人工智能開展了一些有益的探索試驗,主要包括:神經(jīng)網(wǎng)絡(luò)方法、支持向量機和邏輯回歸方法,其釋用訂正效果相對模式輸出產(chǎn)品有不同程度提高,但從改進總量上來看,相對MOS釋用沒有躍變性的改進。現(xiàn)階段,成熟有效和能夠廣泛推廣應(yīng)用的人工智能網(wǎng)格降水訂正算法還不多見,基于大數(shù)據(jù)人工智能提高網(wǎng)格降水的預(yù)報準確率還需要進行深入的探索和研究。
Advances in Meteorological Science and Technology2022年3期