王 靜,高 博,5*,宮輝力,5*,蘇德斌,陳蓓蓓,5,崔要奎
(1.首都師范大學 地面沉降機理與防控教育部重點實驗室,北京 100048;2.成都信息工程大學 中國氣象局大氣探測重點開放實驗室,四川 成都 610225;3.首都師范大學 水資源安全北京實驗室,北京 100048;4.首都師范大學 資源環境與旅游學院,北京 100048;5.河北滄州平原區地下水與地面沉降國家野外科學觀測研究站,河北 滄州 061000;6.北京大學 遙感與地理信息系統研究所,北京 100871)
降水(Precipitation)在全球地表能量交換和物質循環中起著至關重要的作用[1-3]。通過地面雨量計、衛星和雷達測量獲取的降水信息已被構建成許多高質量、高時空分辨率的數據集[4-8]。
眾多學者已對全球降水計劃多衛星降水聯合反演數據集的各時空尺度[9-13]進行分析,發現其優于其他衛星產品。但其時間尺度較短,在海拔高、地勢地貌復雜以及干旱氣候地區[14-17]存在問題。中國逐日網格降水量實時分析系統(CGDPA)數據集通過最佳插值方法將約2 400個氣象數據生成了長時間尺度、高時間分辨率(1 d)的數據集[18],然而其準確性取決于站點采樣誤差、密度和空間代表性[19-20]。中國1 km分辨率逐月降水量(TP1 km)數據集加入了氣溫和降水變量,生產了長時間尺度、高空間分辨率(1 km)的數據集。這3個數據集各有優劣并相互補充。
為了能夠高效、精確地應用多源降水產品,本文首先分析了3個數據集在中國大陸2008—2017年不同時空尺度的適用性;進而選擇精度較高的2個降水數據集通過加權最小二乘法作為數據篩選器構建數據集;最后對構建的降水數據集進行適用性評價,以確定本研究中的構建方案及結果的可靠性。
中國位于歐亞大陸的東南部,國土總面積約960萬km2。復雜的地形與氣候導致了復雜的氣候環境,使得中國大陸成為系統評價衛星降水數據的良好試驗平臺。本文根據海拔高度、年降水量以及山脈分布將中國大陸地區劃分為8個區域[21]:① 東北地區、② 華北地區、③ 長江中下游地區、④ 華南地區、⑤ 西北地區、⑥ 云貴地區、⑦ 新疆地區和⑧ 青藏地區。新疆地區屬于干旱半干旱氣候,全年降水量少;青藏地區地形復雜,海拔高,受高原山地氣候影響;西北地區主要受溫帶大陸性氣候影響;東北和華北地區主要受中緯度季風氣候控制;云貴、長江中下游和華南地區以亞熱帶季風氣候為主。
中國大陸的地面氣象站主要分布在東部低海拔地區;西部地區地形復雜、無人區較多、氣候惡劣,導致西部地區難以架設更多氣象站點。所以氣象站點在中國大陸分布十分不均:東部較為密集,西部較為稀疏。
1.2.1 中國地面氣候資料日值數據集(V3.0)
中國地面氣候資料日值數據集(3.0版)經過氣候極限值和站極值檢驗并使用Kendall自相關檢驗和Mann-Whitney同質性檢驗進行質量控制[22]。每天的降水數據記錄時間為北京時間8:00—次日8:00(比協調世界時(UTC)時間提前8 h),因此UTC時間為00:00—24:00,與衛星數據同步。
1.2.2 GPM衛星降水產品
GPM是熱帶降水測量任務(Tropical Rainfall Measuring Mission,TRMM)的繼任者,主要有3個方面的改進:① 軌道傾角從35°增加到65°,觀測范圍從南北緯50°延伸至南北極圈,覆蓋了部分溫帶大陸氣候區、溫帶海洋氣候區、溫帶季風氣候區以及全部的極地氣候區;② 為了加強對小雨的敏感性,將雷達升級到2個頻率;③ 無源微波傳感器成像儀添加了“高頻”通道(165.5 GHz和183.3 GHz),有助于對微量降水的感知[23]。全球降水計劃多衛星聯合反演(Integrated Multi-satellite Retrievals for GPM,IMERG)是將衛星微波降水估算、微波校準的紅外衛星估算、雨量計分析以及其他潛在的時間和空間降水估算通過校準、合并和插值等一系列步驟生成。NASA根據對數據不同的處理水平和應用需求,提供了不同的降水產品,分別為Early Run,Late Run和Final Run。其中Final Run產品是使用GPCC地面氣象觀測數據,在Late Run的基礎上進行偏差校正生產的。本文只針對IMERG第6版本校正后的Final Run產品進行評估。
1.2.3 中國逐日網格降水量實時分析系統(V1.0)
中國逐日網格降水量實時分析系統(CGDPA)(1.0版)數據集根據中國大陸大約2 400個國家地面氣象站的日降水量數據生產。它是“基于氣候背景場”,采用最優插值方法制作的空間分辨率約為25 km的日降水量柵格數據集[24-26]。
1.2.4 中國1 km分辨率逐月降水量數據集(1901—2017)
國家青藏高原科學數據中心提供的中國1 km分辨率逐月降水量(TP1 km)數據集的時間尺度是1901年1月—2017年12月。它根據CRU發布的全球0.5°氣候數據集和WorldClim發布的全球高分辨率氣候數據集,并利用Delta空間降尺度方案在中國進行了降尺度處理生產[27]。
本文利用3個指標對降水數據進行適用性分析,所用到的評價指標的名稱、公式與最優值如表1所示。

表1 評價指標及最優值Tab.1 Evaluation specification and optimal value

3.1.1 月尺度分析
以氣象站觀測數據為參考,中國大陸8個研究區2008年4月—2017年12月IMERG,CGDPA以及TP1 km降水數據集的評價指標箱型圖如圖1所示。3列評價指標中,左列為相關系數(CC),中間列為相對均方根誤差(RRMSE),最右列為相對偏差(BIAS)。


圖1 中國大陸2008年4月—2017年12月的月尺度評價指標箱型圖Fig.1 Box diagram of monthly scale evaluation specifications in Chinese Mainland from April 2008 to December 2017
結果表明,3個降水數據的指標統計結果在不同區域上存在很大差異。首先,相關系數(CC)在CGDPA與IMERG大部分區域在0.80以上,在TP1 km基本大于0.70,在所有地區均表現出CGDPA>IMERG>TP1 km。相關性最高的地區在華南地區,CGDPA與IMERG的CC基本達到0.9以上,這與華南地區地勢起伏小、降水量大有一定關系[31]。而在新疆地區3種數據的相關性同時降低,且TP1 km數據下降的最為明顯,基本在0.70以下。其次,相對均方根誤差(RRMSE)在GGDPA大部分地區都小于IMERG與TP1 km,表現最好。根據RRMSE的閾值(50%)發現,TP1 km數據僅在長江中下游和華南的部分地區被認為是可靠的,其他2種數據的RRMSE同樣在華南地區表現最好,基本小于40%。表現最差的是新疆地區,其次是青藏地區。這是由于新疆和青藏地區地形地勢較為復雜,地面站點比較稀疏,從而影響了數據的生產以及衛星數據的校正[32]。此外,有研究發現隨著雨量計數量的增加,誤差呈下降趨勢[33]。最后,相對偏差(BIAS)在IMREG與CGDPA各地區大于TP1 km,前二者基本呈現出正偏差,而TP1 km在部分地區呈現負偏差。BIAS在空間分布上與CC和RRMSE的表現基本相同,中國大陸東部地區的BIAS顯示出比西部穩定(-30%~30%),極值集中在西部的新疆和青藏地區,尤其是IMERG表現出顯著高估。這是由于新疆地區的降水量小、蒸發強,傳感器能夠檢測到部分被蒸發還沒有落到地面的降水[34-35],而且由于衛星反演算法問題會將部分沙漠地區識別為下雨的土地[36]。
基于RRMSE,BIAS與CC在不同區域月尺度上的統計結果發現:① 3個數據在中國大陸東部的華南地區表現最好,而在新疆和青藏對降水信息的估計仍然存在問題;② CGDPA均表現出較高的精度(CC>0.90,RRMSE<50%,BIAS介于0~15%),IMERG次之(CC>0.85,RRMSE<60%,BIAS介于0~25%)。
3.1.2 月尺度時間序列分析
2008年4月—2017年12月IMERG,CGDPA以及TP1 km數據集與氣象站觀測數據在中國大陸地區的時間序列降水量變化趨勢如圖2所示。

圖2 中國大陸2008年4月—2017年12月降水量時間序列Fig.2 Time series of precipitation in Chinese Mainland from April 2008 to December 2017
從3個數據集中能直觀地觀察到規律的周期性變化,并且在不同子區域都顯示出非常相似的波動模式,即由每年的1月份降水量逐漸上升,到7月份降水量達到最高值,隨后逐漸下降。將3個數據集逐月降水量值的時間變化在不同區域的觀測值進行比較,可以清楚地顯示出差異。CGDPA與IMERG均能捕捉到降水時空變化模式,在東北、華北、長江中下游、華南和云貴地區十分相近。而TP1 km幾乎在所有區域都偏離了氣象站點觀測數據,降水量偏低或偏高,不能十分準確地獲取降水量信息。但TP1 km,IMERG和CGDPA三個數據似乎都不能準確地反映青藏地區的降水量及變化趨勢。在青藏地區,3個數據集的降水量都與氣象觀測數據存在較大差異。近十年氣象站觀測數據在青藏地區的降水量呈現輕微上升趨勢,而其他3個數據集與其相反,呈現遞減趨勢。如果以站點數據為準,則3個數據集在該地區的降水獲取精度均不可靠。
3.1.3 季節尺度分析
受亞洲季風和青藏高原的影響,中國大陸降水的區域和季節分布差異很大,所以本節在對月尺度分析的基礎上,對季節尺度做進一步的分析。在氣象學上,通常以一年的3月—次年的2月作為一個季節周期,即3—5月為春季,6—8月為夏季,9—11月為秋季,12—次年2月為冬季。以氣象站觀測數據為參考,IMERG,CGDPA和TP1 km降水數據集在中國大陸的8個研究區評價指標箱型圖如圖3所示。最左列為CC,中間列為RRMSE,最右列為BIAS。
法線貼圖技術在普通紋理貼圖技術的基礎上,增加了對法線向量信息的利用。通過物體表面因朝向不同而產生的明暗變化來表現凹凸不平的效果。圖12展示了矩形平面在一點光源照射下,利用法線貼圖技術實現的效果。


圖3 中國大陸2008年4月—2017年12月季節尺度評價指標箱型圖Fig.3 Box diagram of seasonal scale evaluation specifications in Chinese Mainland from April 2008 to December 2017
結果表明,IMERG,CGDPA和TP1 km降水數據集的評價指標在8個區域表現基本一致,但在季節上變化明顯。8個區域的相關性基本是夏季表現較差,其余3季相對較好,且CGDPA>IMERG>TP1 km。在新疆地區3個數據集的相關性同時降低,特別是TP1 km數據集在夏季CC<0.50。TP1 km數據集在大部分地區顯示RRMSE>50%,所以季節尺度上TP1 km在中國大陸的可靠性不穩定。在新疆地區和青藏地區的冬季,IMERG與CGDPA的可靠性也較低,這可能是由于青藏高原冬季較為寒冷,降水相態發生變化,并且地表結冰,從而影響降水獲取能力。CGDPA與IMERG在8個區域的BIAS都表現為高估,其中IMERG在新疆地區的BIAS顯著升高,這是IMERG衛星反演降水數據需要解決的主要問題之一。
基于對IMERG,CGDPA以及TP1 km數據集在中國大陸地區的適用性分析發現,CGDPA和IMERG降水數據在大部分地區表現出較好的性能,能夠反映出真實的降水信息,而TP1 km降水數據集與氣象站數據的一致性較低。因此本文采用一個高效的數據篩選器對CGDPA和IMERG降水數據集進行篩選,進而構建一個新的高精度的降水數據集。其中地面氣象觀測數據為真值,IMERG與CGDPA為參考數據集,并統一為相同的時間分辨率(1月/25千米),在此基礎上進行適用性分析。
3.2.1 構建方法

(1)
用矩陣可表示為:
(2)
假定2個降水產品與地面觀測數據之間的誤差均為0均值且相互獨立,這時降水產品誤差的協方差矩陣如下:
(3)

(4)
3.2.2 構建結果分析
以氣象觀測數據為準,2008年4月—2016年12月重建數據集在中國大陸8個地區的月平均降水量評價指標箱型圖如圖4所示,從左至右分別為相關系數(CC)、相對均方根誤差(RRMSE)和相對偏差(BIAS)。結果顯示,重建與IMERG和CGDPA降水量數據集相比,相關性在各地區都有明顯提升,尤其是新疆地區,除云貴地區外CC均在0.90以上。云貴地區相關性略低可能由于該地區不僅降水來源復雜(南亞季風、東亞季風、青藏高原季風和西風)[38-39],而且還受到復雜地形控制的小氣候的影響,降水具有較高的時空變異性[40]。重建數據集的RRMSE在各地區都有所下降,尤其在新疆地區,RRMSE從50%以上下降到40%以下,同時在青藏地區也有所下降,改善了在新疆和青藏部分地區不可靠的問題。根據BIAS的比較結果來看,通過加權最小二乘法重建的數據集降低了各地區的過度偏差,包括正偏差和負偏差。特別是新疆和青藏地區BIAS基本集中在-30%~20%的合理范圍內,證明該數據集重建方法的可靠性。但根據這3個評價指標在月尺度上的空間分布來看,重建后的數據集在新疆地區以及青藏西部地區仍然存在問題。

圖4 中國大陸地區重建數據集2008年4月—2016年12月月尺度評價指標箱型圖Fig.4 Box diagram of monthly scale evaluation specifications for the reconstruction dataset of Chinese Mainland from April 2008 to December 2016
重建后數據集在季節尺度上的箱型圖如圖6所示。重建后的數據集在季節尺度上提升了各地區的相關性,尤其是夏季。幾乎各地區各季節的CC均在0.80以上,其中新疆和青藏地區偏低,但也提升至0.6以上。RRMSE在各地區各季節也有明顯降低(RRMSE<50%),屬于可靠范圍。但是,新疆地區除夏季外以及青藏地區的冬季還是不可靠。BIAS除新疆和青藏的冬季外都在合理范圍。
本文以地面氣象站觀測數據為參考,對2008—2017年中國大陸地區IMERG,CGDPA和TP1 km降水數據集進行了適用性分析,在此基礎上利用加權最小二乘法作為數據篩選器構建了一個新的高精度的降水數據集并進行系統的精度評價,結論如下:
① 在月尺度評價指標的箱型圖上,CGDPA降水數據精度更好,IMERG次之。相同的是三者都在東南地區表現較好,新疆和青藏地區可靠性較差。
② 月尺度降水量時間序列變化趨勢表現出IMERG與CGDPA能夠較好地反映出氣象觀測數據集的降水量并且變化趨勢比較一致。而3種數據集在青藏地區均表現出與真實值降水量相差較大甚至趨勢相反。
③ 對季節尺度進行分析發現,IMERG,CGDPA和TP1 km數據集對降水的獲取能力在4個季節具有顯著差異,春季、秋季和冬季效果較好。3個數據集在新疆地區都表現出相關性顯著降低,RRMSE超過50%,BIAS過高。
④ 利用加權最小二乘法作為數據篩選器對IMERG,CGDPA降水數據進行重新構建以形成新的數據集,通過評價結果發現其在中國大陸各地區、各時間尺度的相關性都得到明顯提高(CC>0.9),RRMSE降低至50%以下的可靠范圍,BIAS也得到控制。雖然在新疆和青藏西部地區的適用性也有提升,但總體精度仍不是十分可靠。
綜上所述,地面觀測降水數據在一定程度上能夠代表真實準確的降水量,但在站點稀疏甚至無站點的地區缺乏代表性。所以在這些地區可以參考適用性較高的地面模擬數據、衛星反演降水數據以及通過加權最小二乘法構建的降水數據集。但本研究構建的降水數據集在時空分辨率上不夠高(1月/25千米),時間尺度不長(2008—2017年),并且在高海拔、地形復雜以及干旱半干旱的青藏、新疆地區仍存在降水估計不準確的問題。因此,在未來研究中需引入更多的參考數據以建立高質量、長時間尺度、高時空分辨率的降水數據集。