李奇臨 曠蘭 魏麟驍 朱浩楠 王娜
(1 重慶市氣象信息與技術保障中心,重慶 401147;2 重慶市綦江區氣象局,重慶 401420; 3 重慶市氣候中心,重慶 401147;4 重慶市渝北區氣象局,重慶 401120)
站點觀測、風云衛星和氣象雷達單一的探測系統都有一定的局限性,多源數據融合技術讓多圈層觀測系統發揮最大化效益,多源數據融合技術也因此逐步由科研技術成果轉化為業務化產品,在天氣氣候監測、氣候變化研究、模式預報檢驗等業務中廣泛應用[1-4]。中國氣象局研發的陸面數據同化系統(CLDAS)已實現多模式集成的業務化運行,其輸出的實況分析產品時空分辨率為5 km/h,包含亞洲區域范圍的降水、氣溫、風等氣象要素[5-6]。CLDAS是經質量控制后的溫、壓、濕、風觀測數據與歐洲中期天氣預報中心(ECMWF)分析背景場通過時空多尺度數據分析同化系統(STMAS)融合,并訂正高度后生成的實況分析產品。2020年4月底,CLDAS升級產品(CLDAS-V2.1)新增了非考核站觀測資料和產品質量標識碼,其質量、時效、穩定性均有提升,各省已在業務應用中。2020年7月,高分辨率多源融合實況分析產品(HRCLDAS)時空分辨率提高到1 km/h,融合了非考核站點資料,并通過服務器移植、編譯器和庫函數的升級,以及程序與流程的優化,其時效和空間分辨率均優于CLDAS系列產品。對比國際同類產品[7-9],包括ECMWF研發的第五代全球大氣再分析數據高精度地面融合產品ERA5-Land、ECMWF再分析產品ERA-interim、美國國家環境預報中心(NCEP)和美國國家大氣研究中心(NCAR)聯合制作的NCEP/NCAR再分析數據集、韓國陸地數據同化系統產品KLDAS、日本氣象廳(JMA)研發的55年全球大氣再分析產品JRA-55等,CLDAS與HRCLDAS產品在空間分辨率、數據準確率方面呈現出一定的優勢。
從以往的氣溫格點實況產品的評估研究[10-16]中可見,CLDAS與HRCLDAS產品在中國東部地區的適用性優于西部地區,低海拔地區的適用性優于高海拔地區,對全國范圍的整體檢驗多,針對區域的特色評估不多,尤其是高溫災害天氣過程中產品準確率的研究較少。重慶地區地形地貌復雜,盛夏期間高溫天氣過程頻繁,本文針對重慶地區2020年8月氣溫顯著偏高月份,對CLDAS與HRCLDAS產品的氣溫格點實況分析產品質量進行對比檢驗,分析產品的誤差時、空特征和準確率,并從海拔高度、高溫區間對兩類產品進行對比檢驗,以期為兩種產品在業務上的合理應用和數據改進提供參考依據,助力精細化網格預報業務建設。
本文針對不同分辨率的國家級氣溫格點實況產品進行對比檢驗,使用的資料均來源于國家氣象信息中心。格點實況產品包括CLDAS-V2.1(5 km/h)和HRCLDAS(1 km/h),地面站點觀測資料包括重慶地區35個國家氣象站和1937個省級自動站的逐小時觀測資料,對以上3種資料分別提取2020年8月期間逐小時的氣溫要素數據,其中地面站點觀測數據經過了氣象資料業務系統(MDOS)三級質量控制流程質控[17-18]。根據質控碼為0(代表數據正確)、數據可用率、設備可用性等計算綜合指標,篩選出1396440個樣本數,選為此次檢驗標準數據的“真值”數據,以確保評估檢驗結果的科學性。重慶地區氣象站點空間分布如圖1所示。

圖1 重慶地區地形與國家氣象站分布 Fig. 1 Topography of Chongqing and spatial distribution of national weather stations in Chongqing
依照中國氣象局發布的《實況分析產品質量評估規范(2019版)》[19]提出的統計評估方法和誤差指標,對小時氣溫格點實況產品進行評估。以經過質量控制的站點觀測資料作為“真值”,采用非獨立樣本檢驗方法,對比檢驗2020年8月1 km與5 km兩種不同分辨率的小時氣溫格點實況分析產品,基于雙線性插值方法,對逐日、逐時的誤差指標、準確率以及不同海拔高度、不同高溫區間的誤差變化特征進行分析。各誤差指標及準確率計算方法如下:

其中,Oi為站點觀測值,Gi為實況產品插值到檢驗站點得到的數值,和分別為站點觀測與格點插值到站點后的平均值,N為參與檢驗的總樣本數(站數),t為設定的判斷閾值,本文設定準確率閾值t為1 ℃和2 ℃。
雙線性插值方法[15]:雙線性插值是有兩個變量的插值函數的線性插值擴展,其核心思想是在兩個方向分別進行線性插值。首先在緯向方向進行線性插值:
然后在經度方向進行線性插值:

T(x,y)是插值后站點變量值。其中T(x1,y1)、T(x2,y1)、T(x1,y2)、T(x2,y2)為對應網格變量值,T(x,y1)、T(x,y2)分別是x1、x2緯度上的線性插值結果。
將2020年8月1—31日1 km與5 km小時氣溫格點實況分析產品分別插值到重慶地區1972個站點,計算可得出產品插值與站點觀測值的偏差序列,再分別統計四個誤差指標逐日值,結果如圖2所示。從圖2a平均值誤差指標可見,1 km與5 km產品數值均以偏小為主,ME區間分別為[?0.29,0.15] ℃和[?0.45,0.1] ℃,其中5 km產品在14—17日、22—23日偏小較明顯。從圖2b平均絕對誤差指標可見,1 km產品在15日和23日處于誤差峰值,5 km產品在16日和23日處于誤差峰值,8月MAE分別為0.63 ℃、1.1 ℃。圖2c表示的均方根誤差與圖2b走勢幾乎一致,1 km與5 km產品RMSE分別為1.04 ℃、1.56 ℃,兩種產品在14—17日、22—25日期間誤差波動均較大。以上三種誤差指標與圖2d相關系數較為對應,1 km產品的相關系數大于5 km產品,兩者均在24日處于最低值。

圖2 2020年8月不同分辨率氣溫格點實況分析產品日序誤差對比圖 (a)平均值誤差(ME),(b)平均絕對誤差(MAE),(c)均方根誤差(RMSE),(d)相關系數(COR) Fig. 2 Comparison chart of daily sequence errors of gridded real-time temperature analysis products with different resolutions in August 2020 (a) ME, (b) MAE, (c) RMSE, (d) COR
進一步研究高溫天氣(≥35 ℃),兩種格點實況分析產品的誤差指標情況,結果如圖3所示。在高溫站次樣本中發現,隨著觀測氣溫的不斷升高,高溫站次樣本數相應降低,而兩種產品的平均值誤差呈負增長趨勢。1 km產品在[35, 38)℃的高溫區間內,平均值誤差小于?1 ℃,5 km產品在高溫天氣下,平均值誤差均超過?1 ℃;1 km產品在40 ℃以上的高溫天氣下,平均值誤差超過?2 ℃;5 km產品在39 ℃以上的高溫天氣下,平均值誤差超過?2 ℃。1 km產品在各高溫區間的平均值誤差始終小于5 km產品。

圖3 不同高溫區間的氣溫格點實況分析產品平均值誤差變化 Fig. 3 Mean error distribution of gridded real-time temperature analysis products in different high temperature intervals
對比1 km和5 km產品誤差在1 ℃、2 ℃以內的準確率(圖4),1 km產品準確率明顯優于5 km產品,14—17日、22—25日期間兩種產品的準確率均下降。根據8月天氣形勢來看, 14—17日處于持續性高溫天氣過程,日平均氣溫在27.4~29.2 ℃,19個區縣最高氣溫超過37 ℃,18日出現強降水過程,日平均氣溫降至24.7 ℃,兩種產品準確率有所提升。5 km產品誤差在1 ℃以內的準確率相對偏低,尤其在16日和23日偏低明顯,1 km產品誤差在1 ℃以內的準確率與5 km產品誤差在2 ℃以內的準確率較一致,誤差在2 ℃以內的1 km產品準確率在各日均高于其余指標,可達82%以上。

圖4 2020年8月不同分辨率氣溫格點實況分析產品誤差≤1 ℃、誤差≤2 ℃準確率日序圖 Fig. 4 Daily sequence diagram of error ≤1 ℃ and error ≤2 ℃ for the gridded real-time temperature analysis products with different resolutions in August 2020
對兩種產品2020年8月逐時誤差指標序列進行分析,如圖5a所示,1 km與5 km產品數值在09—18時數值均明顯偏小,5 km產品在10時ME達到最大值?0.61 ℃。在11—13時,1 km較5 km產品數值偏小更嚴重,ME達到?0.27 ℃以上,5 km產品ME在0.19 ℃以下。對照平均絕對值誤差與均方根誤差指標,如圖5b、5c,1 km產品在11—13時也較其他時次誤差偏大,MAE分別為0.90 ℃、0.76 ℃、0.90 ℃,5 km產品在10時的MAE達到最大值1.5 ℃,兩者在10—17時數值波動較大。
對比1 km和5 km產品誤差分別在1 ℃、2 ℃以內的準確率(圖5d),1 km產品準確率在11時、13時這兩個時次偏低,而5 km產品準確率在10時、14時偏低,5 km產品準確率呈現夜間高于白天的特征。從誤差在1 ℃內的準確率來看,1 km產品明顯高于5 km產品,5 km產品在02—08時準確率略超過60%,其余時刻均小于60%。從誤差在2 ℃內的準確率來看,1 km產品仍然優于5 km產品,1 km產品準確率范圍在87%~97%,5 km產品準確率范圍在75%~87%。

圖5 2020年8月不同分辨率氣溫格點實況分析產品時序誤差對比圖 (a)平均值誤差(ME),(b)平均絕對誤差(MAE),(c)均方根誤差(RMSE),(d)準確率 Fig. 5 Comparison chart of hourly sequence errors of gridded real-time temperature analysis products with different resolutions in August 2020 (a) ME, (b) MAE, (c) RMSE, (d) accuracy
分析重慶地區2020年8月站點觀測平均小時氣溫數據與小時氣溫格點實況分析產品的平均絕對誤差空間分布特征,如圖6所示,5 km產品誤差明顯大于1 km產品,尤其在海拔較高的站點,平均絕對誤差在1~3 ℃的站點較多。統計MAE在不同區間的站點個數(表1)可知,1 km產品平均絕對誤差小于2 ℃的站點達到99%,絕對誤差小于1 ℃的站點達到96%;5 km產品平均絕對誤差小于2 ℃的站點達到96%,絕對誤差小于1℃的站點為80 %。MAE超過6 ℃的站點有1個,為萬盛地區的自動觀測站,1 km產品MAE為6.4 ℃,5 km產品MAE為6.3 ℃。經核查,該站點位于城市中心區域,受城市熱效應影響較大,因此實況分析產品數值偏低。從兩種產品的最大誤差值站次來看,1 km產品誤差更大,且這些誤差大的站點海拔也較高。

表1 不同分辨率氣溫格點實況分析產品平均絕對值誤差在不同區間站點個數統計表 Table 1 Statistical table of number of stations in different interval with Average Error of the temperature gridded real-time analysis products with different resolutions

圖6 2020年8月不同分辨率氣溫格點實況產品平均絕對值誤差空間分布 (a)1 km產品,(b)5 km產品 Fig.6 Spatial distribution of MAE for the gridded real-time temperature analysis products in August 2020 (a) 1 km, (b) 5 km
按照海拔高度劃分,對比分析1 km與5 km氣溫格點實況分析產品在不同海拔平均絕對誤差≤1 ℃的準確率,結果如表2所示,分別給出了兩種產品在海拔高度500 m以下、500~1000 m和1000 m以上MAE≤1 ℃的準確率對比。1000 m海拔高度以下,兩種產品均在25~30 ℃區間的樣本數最多,20 ℃以下的樣本數最少;1000 m海拔高度以上,兩種產品均在20~25 ℃區間的樣本數最多,35 ℃以上的樣本數量最少。隨海拔的升高,總樣本數下降,兩種產品的準確率也下降,但1 km產品準確率始終比5 km產品準確率要高。

表2 不同分辨率氣溫格點實況分析產品在不同海拔高度平均絕對誤差值≤1 ℃的準確率對比 Table 2 Comparison of accuracy between the temperature gridded real-time analysis products with different resolutions with MAE≤1 ℃ at different altitudes
1 km和5 km產品均在觀測值為 [20, 25) ℃區間內準確率最高。1 km產品在海拔1000 m以下的站點,觀測值為[25, 30) ℃區間內準確率次高,在海拔1000 m以上的站點,觀測值小于20 ℃內準確率次高;5 km產品在海拔500 m以下的站點,觀測值為[25, 30) ℃區間內準確率次高,在海拔500 m以上的站點,觀測值小于20 ℃內準確率次高。
通過對2020年8月兩種分辨率氣溫格點實況分析產品CLDAS-V2.1與HRCLDAS的檢驗,結果與全國范圍的評估、國際同類產品對比驗證結果一致,1 km的HRCLDAS產品更加精細,融合實況數據質量顯著提升,主要結論如下:
1)1 km與5 km產品數值均以偏小為主,平均絕對誤差分別為0.63 ℃和1.1 ℃。兩種產品在14—17日、22—25日期間受持續性高溫天氣影響,誤差波動均較大,在此期間內準確率也下降。
2)隨著觀測氣溫的升高,高溫站次樣本數相應降低,而兩種產品的平均值誤差呈負增長,且1 km產品在各高溫區間的平均誤差始終小于5 km產品。
3)逐時來看,兩種產品在09—18時數值均偏小,其中1 km產品在11—13時數值比5 km產品數值偏小更嚴重,其余時次以偏大為主,5 km產品準確率呈現夜間高于白天的特征。
4)從空間特征來看,5 km產品誤差明顯大于1 km產品,1 km產品平均絕對誤差小于2 ℃的站點達到99%,絕對誤差小于1 ℃的站點達到96%;5 km產品平均絕對誤差小于2 ℃的站點達到96%,絕對誤差小于1 ℃的站點為80%。另外,1 km產品的最大誤差值站次較5 km產品更大,這些誤差大的站點海拔均較高。
5)隨海拔的升高,兩種不同分辨率產品的準確率均降低,在不同海拔高度區間對比下,1 km產品準確率始終比5 km產品準確率要高得多,兩者均在氣溫觀測值為[20, 25) ℃區間內準確率最高。
總體來說,2020年8月1 km氣溫格點實況分析產品優于目前業務應用的5 km產品,有效提高了產品的精度,而兩種產品均受高溫天氣及高海拔影響較大,產品所代表的地形高度與觀測實際高度也有一定差異,未來可以結合重慶本地復雜的地形特征,選擇最優的數據融合方案,對氣溫格點實況分析產品做進一步的本地化改進。