李強宇, 楚岱蔚, 朱曉晨*
(1.南京信息工程大學應用氣象學院, 南京 210044; 2.浙江省杭州市余杭區氣象局, 杭州 311100)
降水資料是陸地生態系統建模及氣候資源評定中重要的參數[1]。選用高精度、準確的降水產品對區域水資源管理具有重要的意義。衛星降水產品具有性能較少受地面條件限制,觀測范圍廣、數據來源多等特點[2]。中外衛星降水產品種類繁多,但是不同衛星遙感降水產品數據在長三角地區具有不同的適用性,在進一步應用于水文及氣象研究之前,需要對這些產品反演結果進行驗證與質量評估。
目前,中外已經開發出了多種降水產品。其按照主要原理主要有:以熱帶降水任務衛星(tropical rainfall measurement mission,TRMM)與全球降水計劃數據集(global precipitation measurement, GPM)為代表的主動微波遙感產品,依靠星載雷達進行對空掃描[3];以氣候預測中心校正產品(climate prediction center morphing technique,CMORPH)為代表的被動微波遙感產品,使用不同物體比輻射特征不同的特性推斷降水分布[4];以中國自動站與CMORPH降水產品融合數據集(China merged precipitation analysis, CMPA)為代表的融合降水產品,通過融合衛星測雨數據和地面觀測數據對降水進行校正[5]。Guo等[6]以中國月降水量分析產品(China monthly precipitation analysis product, CPAP)降水數據為基底系統評價2種GPM產品在中國區域的質量,認為GPM產品在西北地區存在對微量降水的過度檢測現象,且在冬季質量出現下降。Dinku等[7]對非洲與南美洲2個的復雜地形山地區域中的CMORPH與TRMM降水產品的質量進行評價,提出2種衛星產品存在對降水量的低估且與地面參考數據的相關系數較低。田鳳云[8]等利用水文雨量站時段降水觀測資料對黃土高原地區3個典型流域內CMPA產品進行質量評價,得出CMPA產品對降水估測較站點降水觀測更低,且隨著降水量級提升,精度出現下降。目前中國以及流域范圍的衛星遙感降水應用研究已經取得一定進展,而在長三角區域尺度開展的研究較少,且大多數為單一產品的研究或2種產品間的對比[9-11]。長三角地區內存在多種地形,且降水分布受地形、氣候等因素影響,遙感降水產品在不同區域的精度存在差異,研究確定常用的幾種降水產品的適用性對區域內水資源管理等具有重要意義。
基于長三角地區2014年以及2018年的62個氣象站點數據,應用7種指標,對中外應用較為廣泛的4套降水產品:CMPA、GPM、CMORPH以及TRMM進行質量評估,從年、季、月的時間尺度和空間尺度對2種產品的降水觀測精度進行對比研究上述衛星降水產品在長三角地區的適用性。通過評估,能夠了解衛星降水反演的質量特征和局限性,選擇適合區域內應用的降水產品,為構建高精度、精細化的降水空間分布提供支撐。
長江三角洲(圖1)地處115°E~123°E,29°N~32°N,西部瀕臨黃海與東海,面積約21.2萬km2,為中國六大城市群之一——長三角城市群所在地[12]。
目前長三角城市群內包括江蘇省、上海市、浙江省和安徽省。長三角地區內以淮河為界,南部為亞熱帶季風氣候,以北屬暖溫帶半濕潤季風氣候。區域內全年雨熱同期,水旱災害十分頻繁,部分城市“水質型”缺水嚴重。長三角地區地形以平原,山丘與水域為主,主要地形區為長江三角洲平原、黃淮平原、皖南丘陵以及浙南山地等。

圖1 長三角地區行政區劃及地形分布圖Fig.1 Administrative divisions of the Yangtze River Delta
降水產品數據: CMPA,是由中國國家氣象信息中心利用以概率密度匹配+最優插值(PDF+OI)為基礎的兩步數據融合算法,對上述算法在1 h及0.1°分辨率下的核心參數進行修訂和調整,融合地面站點觀測數據的逐小時觀測數據與CMORPH衛星降水產品得到,在中國區域的精度高于國際同類產品[8]; GPM/IMEGR是1個衛星群,其核心觀測平臺加強了對固態粒子及微量降水的觀測能力[12]; CMORPH由美國NOAA氣候預測中心整合全球多衛星數據被動遙感數據生產; TRMM是由美國與日本共同研發的世界上首顆定量測量熱帶、亞熱帶降雨的衛星[13]。
研究中對相關數據(nc格式、grd格式等)使用對應的數據處理軟件提取,按照地面站點所采用的降水觀測時間段(北京時間20:00為日界)進行按日累加,即為日值合成。根據需要將所有數據的空間分辨率經過雙線性插值重采樣到0.25°。利用 Arcgis 軟件批量提取并收集匯總不同衛星遙感日降水數據與對應地面站點位置相對應的日降水值;其中降水過程判斷閾值根據常用氣象標準設定為0.1、10、25 mm/d,此為常用的有降水、中雨及大雨的降水標準。特別的,TRMM3 h數據中昨日世界時 12:00 到當日世界時12:00前后各1.5 h數據冗余,觀測時段不能和其他數據的世界時12:00數據完全對應,做出一個假設:在每日世界時12:00前后多測的1.5 h內降水是均勻分布的,故可以對其首尾數據進行平均值剔除。降水產品參數如表1所示。
將降水數據采用中緯度地區氣候劃分方式,進行季節進行相關計算(其中3—5月為春季,6—8月為夏季,9—11月為秋季,12月—次年2月為冬季)。為保障降水產品數據完整性,僅選擇觀測時段內,連續24個時次內均存在正確反演結果的數據,故CMPA產品在2018年10月數據缺失較多。作為評估的參考數據,使用2014年全年以及2018年全年研究區內地面站點日降水數據,排除海島上站點后共有62個站點,數據來源為中國氣象數據網開發的中國地面氣候資料日值數據集(V3.0),經 MATLAB平臺提取與處理合成。通過矢量邊界提取研究區內數字高程數據,數據來源為地理空間數據云網站,基于Arcgis平臺投影變換至Albers 投影。

表1 4套衛星數據主要參數
使用統計指標與過程分類指標評估遙感降水產品的精度,分別使用皮爾遜相關系數(pearson correlation coefficient,COR)、相對偏差(relative bias,RBIA)、均方根誤差(root-mean-square error,RMSE)、錯報率(false alarm ratio,FAR)、探測率(probability of detection,POD)、成功比率(critical success index,CSI)和精度(accuracy,ACC)作為指標。對于每種衛星降水產品,首先進行站點尺度上的誤差計算,再按照整個研究時段內的均值分別統計質量指標在各站點的空間分布情況及均值在不同研究時段內的分布。評估指標如下。
2.1.1 相對偏差
相對偏差用于評價衛星降水產品與站點測值的平均偏離程度,其能夠消除不同站點降水數值的影響以在同一水平上進行誤差比較,范圍為(-∞,+∞),最優值為0;低相對偏差代表降水產品反演更精確;相對偏差與降水數值大小無關[14]。

(1)
式(1)中:Pi及Si分別為衛星產品數據值和站點觀測值;i為研究期內每日;n為研究期內結束日。
2.1.2 皮爾遜相關系數
皮爾遜相關系數是測量降水產品數據和地面站觀測值之間線性相關程度的指標,范圍為(-∞,+∞),最優值為1;較高(>0.8)的相關系數表示降水產品與站點觀測值的關聯程度高[15]。

(2)
2.1.3 均方根誤差
均方根誤差反映降水產品數據與站點觀測數據之間偏差整體水平以及降水產品數據的離散水平,范圍為[0,+∞),最優值為0;均方根誤差與統計變量值有關,較低的均方根誤差代表降水的極端偏差值較小[16]。

(3)
降水的日變化監測對精細化的降水管理及災害監測具有較為重要的意義[3]。使用以下4種無量綱過程分類指標對降水過程生消的辨別能力以及對不同量級日降水的捕捉能力進行評價。降水過程分解判斷使用如表2所示。

表2 降水過程判定列聯表
2.1.4 探測率
反映降水產品數據對降水過程正確判斷日數的比例,最優值為1;高探測率代表降水產品對真實降雨事件探測比例較高[9]。

(4)
2.1.5 錯報率
反映使用降水產品數據對降水過程錯誤的監測比例,最優值為0;低錯報率代表降水產品報虛假降雨幾率較低[9]。

(5)
2.1.6 成功比率
反映使用降水產品數據對降水成功探測在有雨日數中的比例,最優值為1;高成功比率代表降水產品報成功率較高且錯誤較少[9]。

(6)
2.1.7 精度
反映降水產品數據對降水過程正確日數在全部情況中的比例,最優值為1;高精確度代表降水產品整體對降水過程的發生或者發生的判斷成功率較高[17]。

(7)
以上4種降水過程分類指標的取值范圍均在[0,1],符號定義根據表2確定。
年降水量能夠反映地區氣候特征,是重要的陸地生態系統建模參數。統計4種降水產品和地面站點在研究時段內年的年降水量并進行質量分析得出圖2(a)~圖2(d)、圖3(a)~圖3(d)及表3。
研究區域內氣象站點降水實測數據為自變量,其對應的降水產品反演值為因變量做一元線性回歸分析結果如圖2所示。由圖中1∶1直線與擬合虛線交點可看出,CMORPH與CMPA對低于1 200 mm的降水存在高估,對更高的降水存在低估,GPM對降水存在一定高估,TRMM降水反演普遍低于站點實測。CMPA降水反演值與站點實測降水量存在較好的一致性,體現為擬合直線與參考線接近。

圖2 站點與產品反演年降水散點圖Fig.2 Site and product inversion annual precipitation scatter plot

表3 降水產品年降水的統計評估表
對研究期內降水量做算術日平均,得到的日平均降水量的空間分布如圖3所示。
從圖3中可以看出,CMORPH、CMPA和TRMM 反演的長三角區域降水的空間分布趨勢結果相似,均為南多北少,GPM反演降水南北差距較低,從降水量數值上來看,各產品存在差別,對于研究區內北部地區,降水量反演結果接近,安徽南部及浙江大部分地區出現較大差異。TRMM降水量最高,其次為CMPA及CMORPH,GPM結果最低,反應在地形復雜地區各產品對降水量估測存在差異。
利用各產品年降水量值與站點反演值,計算不同年份站點實測降雨量與站點所在像格點降水值的質量參數,得到2014年及2018年長三角地區觀測站與降水產品降水資料的統計評估參數的變化趨勢。分析表3,2014年,CMPA各指標均優于其他產品,2018年CMORPH產品質量較高;CMPA的COR為最高,均達到0.8以上,CMORPH與TRMM較好,GPM為最差;CMORPH的RBIA絕對值較低(<0.1),CMPA與GPM較好,TRMM為最差;CMPA的均方根誤差綜合較低,CMORPH、GPM其次,而TRMM為最差。
長三角區域大多數地區雨熱同期,不同季度的降水差異分明,需要分析各季節內降水產品誤差特征。基于各站點的3種統計數據指標,在季節尺度上求均值,如圖4及表4所示。
由圖4可以看出,從相關系數來看,CMPA最優(>0.8),GPM與CMORPH比較接近,TRMM為最差;相對偏差,各產品冬季出現質量下降,CMPA質量最優,CMORPH比較接近,但有少數極端異常值,TRMM與GPM質量較差;均方根誤差,CMPA各季節間均為最優,CMORPH與TRMM較好,GPM為最差。
由表4所示,CMPA產品好于CMORPH與GPM,同時3種統計指標在各季節均保持較穩定;春、秋季監測指標質量較好,冬、夏季監測指標下降,冬季下降較大;GPM產品均方根誤差較大,即極端誤差較大;CMORPH產品對降水估計值較精確且均方根誤差較小,降水相關性較低;CMPA產品除冬季域波動較大以外對降水反演的準確度均較高;TRMM夏季表現有一定改善。

圖3 衛星產品反演日均降水分布圖Fig.3 Satellite product inversion of daily average precipitation distribution map

圖4 降水產品季節統計指標箱線圖Fig.4 Box graph of mean seasonal statistical indicators of precipitation product

表4 降水產品季節統計指標均值比較表
根據2014年及2018年的CMORPH、GPM、CMPA、TRMM和實測站點的月降水量,整理降水產品各站點不統計指標均值,將不同產品質量指標與對應月份的時間序列繪制為圖5所示的折線圖。分析圖5(a)、圖5(b)可知,在月尺度下各站點精度評估呈現相似趨勢,3—10月質量較穩定,其他月份波動增大,其中2018年10月由于CMPA產品記錄日期較少,誤差增大。均方根誤差,其中CMPA表現最好,TRMM與CMORPH比較接近,GPM誤差最大。根據圖5(c)、圖5(d),相對偏差于冬季出現較大偏差,除CMPA各產品大部分為出現較高的估計。

圖5 降水產品月統計指標對比Fig.5 Comparison of monthly statistical indicators of precipitation products
統計各月降雪產品過程分類精度指標,繪制為極坐標圖。由圖6可知,從不同月份來看,汛期及冬季精度出現較大改善,CMPA表現最好,GPM與CMORPH較差,GPM為最差;關鍵成功指數,冬季以及6—8月,除CMPA外各產品屬于過程分類較低時段(<0.8),CMPA在各月基本均保持較高水平(>0.8),CMORPH與GPM表現接近,TRMM為最低;探測率,CMPA在大部分月份表現最好(>0.9),GPM較優且全年質量穩定,CMORPH與TRMM較差;錯報率,CMPA表現最好,CMORPH與TRMM較接近,GPM最差。
為驗證各產品在長三角區域內精度空間分布,對于各衛星降水產品,結合衛星遙感降水反演區域的降水量及站點年降水量值,在各站點計算年精度指標,對比分析降水產品質量指標在長三角區域的分布特征。
分析圖7可得,CMPA產品相關系數表現較好。對相對偏差而言,TRMM,CMORPH與CMPA大部分站點呈現對降水的較低估計。GPM產品在2年間對降水在大部分地區出現較高的估計。均方根誤差,大部分站點均呈現由沿海以及南部山地較高,而平原地區較低,反映出衛星降水產品在平原均一地形下極端誤差普遍較小。
基于圖8中對于降水過程探測質量空間分布特征,對于探測率,CMPA表現最好(>0.8),GPM次之,其他產品性能接近;精度,普遍出現沿海較高(>0.8),而內陸較差(>0.7),其中山地丘陵地區最低(>0.6);關鍵成功指數,在南部山地地區CMORPH與CMPA優勢較高;錯報率,以大約北緯30°為界,以北地區錯報率較低,南部地區錯報率更高,其中山地丘陵地區整體表現仍然較差,整體以CMPA與GPM質量較好。在不同地形區間內,不同衛星產品的降水的估測精度呈現較大差異。除CMPA產品外,CMORPH與GPM產品表現均較高;在整體精度較低的山地丘陵地區,CMPA產品相關性最好,但偏差較GPM產品大,原因是與GPM產品時間分辨率更高,對短期降水探測能力更高[18]。

圖6 降水產品月過程分類評估對比Fig.6 Evaluation of classification index of monthly data of precipitation products

圖7 降水產品統計指標空間分布Fig.7 Spatial distribution of precipitation product statistical indicators

圖8 降水產品過程分類指標空間分布Fig.8 Spatial distribution of precipitation product process classification indicators
計算不同閾值下衛星降水產品對降水過程檢測能力指標,如表5。分析可知,隨著降水判斷閾值增大,大部分產品的指標出現改善,反映各降水產品對較大的降水捕捉能力較高;較大閾值下對降水的判斷精度均達到最高(>0.95)水平;TRMM產品對不同閾值變化的響應較大,較低閾值下精度指標較低,閾值提升會引起質量改善;相比于其他產品在高閾值下出現的指標改善情況,CMORPH對較大降水閾值出現了一定的負效應。在不同年份比較,GPM產品對降水錯報率較低,反映其能夠較好地檢測出降水事件。CMORPH與CMPA質量差異較大,2018年質量更高。
較低降水閾值(0.1 mm/d)下,除CMPA外各產品精度指標均比較接近(0.8左右),但GPM產品出現較高的錯報率與探測率均較高的現象,針對GPM對小雨錯報率與誤報率。中雨降水閾值下,大部分產品除精度以外的指標質量均出現下降。較高閾值下,各產品的精度達到最大,其他指標有較大下降,反映在有雨過程中做出的判斷出現了較大的誤差,但對無雨過程的判斷準確性則較大提升;TRMM產品隨著降水閾值的提升,精度有一定提升而其他指標下降不明顯,反映其可以較好監測連續較大降水。相比于TRMM,GPM在微小降水的觀測上質量均較高。

表5 不同閾值降水過程檢測指標對比
上述降雨量、降雨事件精度評估結果表明,中國自動站與CMORPH降水產品融合的逐時降水量網格數據集在長三角區域的應用表現良好,可以作為雨量站點的補充來提供降水數據。4種降水產品的性能評估結果反映了不同產品在長三角區域的共同誤差特點,即衛星降水產品的質量受地形、季節及降雨強度等因素的影響,在不同地區會表現出明顯的精度差異[19]。楊震宇等[20]、陳茜等[21]分別在長江流域及江蘇省內關于GPM的研究均指出,GPM對降水量存在全年間的普遍低估現象;Prakash等[22]在TRMM與GPM的對比研究中指出, GPM對小雨事件具有更好的檢測能力[22],與本文中部分結果相一致。在浙江省、安徽省的山地丘陵地區,各產品質量均出現下降,這與不同區域的氣候及地理特征有關:在地形復雜的地區,高程與氣象因子的關系對遙感降水產品的質量存在一定的影響,導致產品精度與高程及地表狀況存在一定相關性[23];不同高程區間的水汽補給原理存在一定區別而與產品預設模型不同[24];衛星產品的采用的反演模型會影響不同季節的降水反演精度,如TRMM產品為熱帶降水測量設計,且其空間分辨率較低,冬季溫度下降時,質量下降,這與本文結論相同[25];衛星降水產品常年處在動態的改進中,2014年GPM計劃啟動時間較短,其IMERG產品算法處于適應階段,同時段內專為熱帶降水觀測任務設計的TRMM衛星產品的TMPA算法已經更新多個版本,影響GPM在降水量較大的雨季探測率與其他產品的對比[26]。
利用7種指標,對長三角地區4種常用衛星降水產品,從不同時空尺度下降水產品的質量指標等方面分析了4種資料在長三角區域的準確性及反演誤差,主要結論如下。
(1)長三角地區內不同地區降水產品質量區別較大,CMPA與CMORPH產品對山區降水量具有更高的探測準確度;而平原地區GPM產品質量較高;綜合以CMPA產品為最優。
(2)CMPA在各季節對降水反演的質量綜合最高,TRMM產品對夏季降水事件判斷質量較高,GPM對冬季降水量估計精度更高。
(3)不同的日降水過程對降水產品的監測能力存在影響;CMPA產品在各個閾值下均可以進行較準確的日降水過程監測;隨著閾值的增加,TRMM產品質量出現較大的改善,其余產品質量提升較小。
后續將依據現有的結論,應用機器學習等方法,融合多降水產品進行數據生產,在不同區域及時間實現較高精度降水反演,以構建大范圍、高精度的降水監測網絡。