李慶雷 遠芳 楊貴 廖捷 胡開喜 姚爽 周自江
(1 國家氣象信息中心,北京 100081;2 內蒙古自治區二連浩特市氣象局,二連浩特 011100)
常規探空觀測資料因其質量穩定可靠、垂直層數多、能夠準確描述大氣三維結構,而成為提供陸地大氣狀態極其重要的信息來源。這使得探空資料在數值預報[1]、天氣分析[2-3]、氣候變化[4]、衛星資料校準[5]等研究中發揮著重要作用[6],尤其是在數值預報系統進行資料同化過程中,探空資料更是成為改進模式初始場質量、提高預報精度所不可或缺的最重要的基本資料[5,7-8]。
隨著探空技術的發展,我國自2011年已經完成由59-701型探空系統向L波段電子探空儀系統的全面更新換代,新一代探空系統的顯著優勢是可以提供秒級別的、高垂直分辨率的探空數據[9]。近年來,高垂直分辨率探空數據被廣泛應用于各項科學研究中,均證實了其獨特的應用價值。例如,楊湘婧等[10]利用垂直高分辨率探空數據建立模型,進行大氣邊界層中近地面層的信息分析。卞建春等[11]利用垂直高分辨率探空數據對北京上空下平流層重力波的特性進行統計分析。Basha等[12]利用高垂直分辨率無線電探空的長期觀測,研究了熱帶站點Gadanki的大氣邊界層高度,指出高垂直分辨率探空資料可以為邊界層高度研究提供較優的資料基礎。此外,高分辨率探空數據還廣泛應用于大氣晴空湍流[13-14]、風切變等研究中[5,13,15]。
此外,數值天氣模擬,資料同化及數值天氣預報均可受益于高分辨率探空數據的獲取和應用[16],探空觀測系統越密,它對分析精確度的貢獻越大,這個事實在水平和垂直方向都成立[17]。例如,郝民等[18]比較秒級探空與傳統探空資料使用對資料同化預報帶來的影響,指出高垂直分辨率探空資料的使用對數值模式分析初值及預報的改進有著積極的意義。姚爽等[7,19]將L波段高分辨率探空數據用在WRF模式中進行變分同化試驗,指出同化分鐘數據可一定程度提升模式初始場品質并有助于改善對流層高空風和大量級降水預報性能。
然而,前人關于L波段秒級數據的同化應用研究[7,18-19]主要基于高垂直分辨率探空資料在時間上的自然稀疏化,如利用時間分辨率較低的分鐘探空數據。稀疏化是高頻資料在同化應用過程中非常重要的一個技術環節[20]。而基于時間分辨率降低的自然稀疏化,如分鐘探空數據,并不能保證每分鐘都恰好是探空垂直廓線中氣象要素的變化拐點,也就不能精準地解析出氣象要素垂直變化的細致特征。在同化應用時,需要將探空廓線上的數據線性插值到模式面上[18],應用自然稀疏化后的分鐘數據就很容易造成較大的誤差。
為解決上述問題,本文提出一套針對中國探空L波段秒級資料的、自適應的稀疏化技術方案,該方案可以實現從秒級探空資料中,提取溫度、濕度、風向、風速等氣象要素的垂直廓線的顯著拐點,并整合各規定等壓面層、對流層頂等重要探空層次,從而形成大約有一兩百層的完整探空廓線。所得廓線的層數與歐美發達國家水平相當,并能更準確描繪各個氣象要素垂直變化的精細結構特征。基于模式背景場(ERA-Interim再分析資料)的觀測資料偏差評估技術,對比分析不同方法得到探空廓線上氣象要素的數據量、偏差(Bias)和均方根誤差(RMSE)等定量指標,對該稀疏化方案的效果進行了系統的檢驗。
本文用到的L波段秒級探空數據來自國家氣象信息中心發布的中國高空L波段秒級觀測基礎數據集(V1.0),該數據經過嚴格的質量控制,如允許值范圍檢查、僵值檢查、垂直一致性檢查、氣候界限值檢查、濾波檢查、單調性檢查、要素間一致性檢查等等。由于秒級數據的質量控制方案不是本文研究重點,不贅述。值得一提的是,本文的稀疏化方案基于質量控制之后的秒級探空數據,以保證稀疏化后得到的數據信息的準確性。
1.2.1稀疏化方法
常規高空氣象觀測業務規范[21]中給出了選取溫度特性層、濕度特性層、風特性層條件和步驟,例如,選取溫度梯度的顯著轉折點,即兩層間的溫度分布與用直線連接的溫度比較,大于1 ℃(第一個對流層頂以下)或大于2 ℃(第一個對流層頂以上)的差值最大的氣層,作為選取的溫度特性層;然后重復該方法直至相鄰兩層間沒有特性層為止。在觀測業務規范中,濕度特性層和風特性層的選擇與上述步驟類似。
本文參考業務觀測規范中特性層的選取條件[21],針對探空高垂直分辨率資料進行稀疏化,根據氣象要素垂直廓線的變化特征,自適應地從低到高逐層挑選出廓線上的顯著轉折點,即溫度特性層、濕度特性層、風特性層、對流層頂等,以期用較少的數據點就能精準描繪氣象要素的垂直變化特征。這里提取各個探空氣象要素特性層的步驟簡要介紹如下:(1)在一條完整的探空廓線上,選擇地面層(探空數據第1秒)為第一個特性層L1;(2)以第1秒和第N秒的數據點做直線,計算實際廓線到此直線的偏移量;(3)當此偏移量大于某一閾值時,即選定該層為第二個特性層L2;(4)然后以L2為基點,繼續向上依次選出各個特性層L3,L4,…,Ln;(5)值得一提的是,不同的氣象要素在不同的探空高度,選取的閾值大小不同,這需要反復試驗確定以滿足不同的同化應用需求。
為便于實際應用的需要,該稀疏化方案還實現了直接從秒級探空數據中提取各個規定等壓面的氣象要素,與上面提取的特性層數據整合在一起,從而形成一條完整的大約有100~200層的探空廓線。
1.2.2稀疏化效果檢驗方法
為了檢驗稀疏化效果,通過比較不同來源的探空觀測數據和ERA-Interim再分析資料之間的偏差(Bias)和均方根誤差(RMSE)來量化檢驗。其中偏差Bias代表一定時段內再分析資料平均值與探空實測資料平均值之差,而均方根誤差

是ERA-Interim再分析數據與探空實測數據偏差的平方和與觀測次數比值的平方根。這些不同來源的探空廓線分別是:基于“中國高空特性層定時值數據集(V1.0)”和“中國高空規定等壓面定時值數據集(V2.1)”整合的探空廓線數據(CMA-Merge),基于本文提出的稀疏化方案得到的探空廓線數據(CMA-Thin),以及美國國家環境預報中心研發的氣候預測系統再分析資料(CFSR)中的探空廓線數據。
已有研究結果表明,盡管由于受到數值預報模式和同化方案等系統性誤差的影響,再分析資料與觀測結果相比可能仍然存在一定的差異[22],但是它們基本能合理反映東亞及其中國區域氣候變化的時空分布特征[23-25]。因此,文中應用ERA-Interim再分析資料作為背景場,通過比較不同數據源與背景場的偏差(Bias)和均方根差(RMSE)來量化分析稀疏化效果。
單次探空廓線稀疏化效果如圖1所示,以53068站(二連浩特,GCOS探空站)2016年1月1日00 UTC時次的L波段探空溫度垂直廓線為例,可以看出,原始的秒級觀測數據有4318層,中國高空特性層定時值數據集(V1.0)給出的溫濕特性層數目是30層,而應用本文設計的基于秒級資料的稀疏化方法得到的溫濕特性層數目是118層。對比三條廓線可以很清楚地看出,通過稀疏化方法得到的溫度廓線,較現有的30層的溫度廓線,通過捕捉更小尺度的溫度拐點,能更準確地描繪溫度的垂直變化特征。值得一提的是,當探空溫度應用于數值模式資料同化過程中時,需要將溫度特性層的溫度值線性插值到特定模式層[18-19],顯然特性層層數多的溫度廓線能夠提供更精準的溫度值。

圖1 利用兩種方法得到的溫度垂直廓線的對比圖(為表示清楚,圖中曲線進行了平移)Fig. 1 Comparison of temperature profiles between two methods (The curve is shifted in the figure for clarity)
為了進一步檢驗稀疏化效果,本文選取2014年全年中國120站00 UTC和12 UTC兩個時次所有的秒級探空廓線數據進行統計分析,得到各個站點平均單次探空廓線提取得到的溫濕特性層數目,其不同取值范圍的站點數分布如表1所示。圖2給出了平均單次廓線中溫濕特性層數目的空間分布圖,其中圖2a統計的是已有的特性層數據集,圖2b則給出本文稀疏化得到的特性層數目的空間分布。首先,通過表1和圖2都顯示,已有的特性層數據集給出的溫濕特性層數目平均值集中在20~30層,而基于秒數據稀疏化得到的溫濕特性層數目平均值絕大多數在60~90層,顯著地增加了特性層的數目。其次,可以看出,盡管兩種方法給出的特性層數目差異很大,但是圖2a和2b給出的特性層數目的空間分布型表現出很好的一致性;如,兩種方法統計得到的特性層數目相對較多的站點都集中分布在海拔較低的中國東南部。最后需要指出,兩圖中用紅色圓圈標記的7個探空站點,是GCOS探空站,由于施放大球,其最大探測高度明顯高于周邊非GCOS探空臺站,用兩種方法得到的特性層數目均多于周邊站點。這些都說明,本文提出的基于L波段秒級探空數據的稀疏化方案對于全國120個探空站都具有很好的普適性。
氣象要素的垂直變化不僅與站點的地理分布有關,而且在不同的季節同樣應該表現出不同變化規律。表2給出了春、夏、秋、冬四個季節,不同溫濕特性層數目取值范圍的站點數分布。如圖3給出了稀疏化得到平均單次廓線中溫濕特性層數目在不同季節的空間分布結果。通過圖表可以看出,四個季節的特性層數目的空間分布型與圖2中給出的全年分布圖基本吻合。值得一提的是,絕大多數的探空站點在冬春季節提取的特性層數目普遍多于夏秋季節,這與夏秋季節整個大氣層的溫度較高導致其能量上下交換比較充分有關。

表1 對比兩種特性層提取方法得到的不同溫濕特性層數目的站點數分布表Table 1 Comparison of the station numbers between two methods

表2 對比不同季節,本文稀疏化方案得到不同溫濕特性層數目的站點數分布表Table 2 The station numbers in 4 seasons resulted from this sparsification scheme

圖2 兩種方法得到平均單次廓線中溫濕特性層數目的空間分布:(a)已有特性層數據集;(b)本文稀疏化Fig. 2 Distribution map of numbers of temperature and humidity significant levels in average single profile: (a) from the significant level datasets; (b) from the sparsification of high-resolution data

圖3 本文稀疏化方案得到平均單次廓線中溫濕特性層數目在不同季節的空間分布:(a)春季;(b)夏季;(c)秋季;(d)冬季Fig. 3 Distribution maps of temperature and humidity significant level numbers in average single profile for: (a) spring; (b)summer; (c) autumn; (d) winter
首先,從時間序列分布上看,圖4對比給出了兩種數據源相對ERA-Interim再分析資料的檢驗效果,可以看出,基于秒級資料稀疏化方案得到的參與對比的探空溫度數據量遠遠大于通過已有探空數據集整合的結果,而相對ERA-Interim再分析資料的溫度偏差(Bias)和均方根誤差(RMSE)的水平相當,并沒有因為數據量的增大而增大;而且無論是T數據量,還是T偏差和T均方根誤差,隨時間變化的走勢都表現出很好的一致性。

圖4 兩種數據源相對ERA-Interim再分析資料的評估結果:(a)數據量;(b)偏差(Bias);(c)均方根誤差(RMSE)Fig. 4 Evaluation results of two data sources compared with ERA-Interim reanalysis data: (a) data size; (b) Bias;(c) RMSE
其次,從檢驗結果的空間分布上看,圖5對比給出了三種數據源的溫度相對ERA-Interim再分析資料檢驗結果的垂直分布圖,其中圖5a代表在不同探空高度處參與對比分析的T數據量,圖5b是溫度偏差(Bias),圖5c是溫度均方根誤差(RMSE)。由圖5a可以看出,由于CFSR中中國站點數目較少,使得在任一探空高度處的數據量均最少;而稀疏化得到的溫度數據量又明顯多于已有數據集整合的數據量。由圖5b可以看出,經稀疏化得到的溫度偏差較其他兩個數據源都更接近于0 ℃,且其垂直變化幅度更小,較其他兩個數據源表現出更好的垂直一致性。由圖5c可以看出,在探空高度925~500 hPa,經稀疏化得到的溫度均方根誤差與整合數據源水平相當;而在探空低層1000~925 hPa和高層500~100 hPa,經稀疏化得到的溫度均方根誤差比整合數據源的要偏大,而這可能與參與統計的數據量較多有關。
總之,無論是從檢驗結果的時間序列分布(圖4),還是其垂直空間分布(圖5),經稀疏化方案得到的數據源都表現出明顯的優勢:其T數據量更大,T_RMSE水平相當,T_Bias更小。值得一提的是,不僅僅是溫度T這一氣象要素的稀疏化效果表現出上述統計特征,其他氣象要素如濕度Rh、風速V等可以得到類似的結論,此處不贅述。
本文基于L波段探空秒級資料設計的稀疏化方案,能夠顯著增加用于同化應用的探空廓線特性層數目,通過對120個探空站點2014年所有的秒級探空做稀疏化處理,得到的特性層數目的空間分布與通過特性層數據集得到的空間分布具有很好的一致性,而且其層數空間分布表現出明顯的季節變化特征,這體現了本文的稀疏化方案的可行性與普適性。
基于ERA-Interim再分析資料做背景場,稀疏化后的探空數據較已有探空層數偏少的整合數據的偏差評估效果更好,通過Bias和RMSE的時間序列圖以及垂直空間分布圖可以清楚地對比三種方法得到探空數據的差異。隨著數值預報模式的發展尤其是模式垂直分辨率的提高,必將促使更多層的探空數據進入同化應用。本文提出的稀疏化方案為高垂直分辨率探空資料的有效同化應用提供了保證。
此外,該稀疏化方案改進了提取特性層的算法,顯著增加特性層層數,可以更好地應用于氣候變化等研究中[6,26-27]。在接下來的研究中,可以結合不同的數值預報模式,如GRAPES等,針對特定的天氣過程進行個例分析,將稀疏化后的探空數據用于數值預報同化中,可以更好地體現該稀疏化方案的實際應用效果。
[1]Ingleby B, Edwards D. Changes to radiosonde reports and their processing for numerical weather prediction. Atmospheric Science Letters, 2015, 16(1): 44-49.
[2]李巖瑛, 張強, 薛新玲, 等. 民勤大氣邊界層特征與沙塵天氣的氣候學關系研究. 中國沙漠, 2011, 31(3): 757-764.
[3]唐家萍, 譚桂容, 譚暢. 基于L波段雷達探空資料的重慶市區低空逆溫特征分析. 氣象科技, 2012, 40(5): 789-793.
[4]Bodeker G E, Bojinski S, Cimini D, et al. Reference upper-air observations for climate: From concept to reality. Bulletin of the American Meteorological Society, 2016, 97(1): 123-135.

圖5 三種數據源(整合數據源CMA-Merge,稀疏化數據源CMA-Thin,CFSR)相對于ERA-Interim再分析資料的評估結果的垂直分布圖:(a)數據量;(b)偏差(Bias);(c)均方根誤差(RMSE)Fig. 5 Vertical distribution of evaluation results of the ERA-Interim reanalysis data from three data sources (the CMAMerge, CMA-Thin and the CFSR): (a) Data size; (b) Bias; (c) RMSE
[5]Ingleby B, Pauley P, Kats A, et al. Progress toward highresolution, real-time radiosonde reports. Bulletin of the American Meteorological Society, 2016, 97(11): 2149-2161.
[6]阮新, 朱艷峰, 鞠曉慧. 融合特性層觀測資料推算探空站海拔高度的方法. 高原氣象, 2011, 30(2): 532-537.
[7]姚爽. L 波段探空數據分析及在區域模式中的同化應用試驗. 中國氣象科學研究院碩士畢業論文, 2014.
[8]Durre I, Yin X. Enhanced radiosonde data for studies of vertical structure. Bulletin of the American Meteorological Society, 2008,89(9): 1257-1262.
[9]李偉, 劉鳳琴, 徐磊, 等. L波段高空氣象探測系統軟件. 氣象科技,2008, 36(2): 237-239.
[10]楊湘婧, 徐祥德, 陳宏堯, 等. L波段探空高分辨率廓線中近地層信息分析及相關模型. 氣象, 2011, 37(12): 1504-1510.
[11]卞建春, 陳洪濱, 呂達仁. 用垂直高分辨率探空資料分析北京上空下平流層重力波的統計特性. 中國科學 D 輯: 地球科學, 2004,24(8): 748-756.
[12]Basha G, Ratnam M V. Identification of atmospheric boundary layer height over a tropical station using high-resolution radiosonde refractivity profiles: Comparison with GPS radio occultation measurements. Journal of Geophysical Research Atmospheres,2009, 114(11): 713-721.
[13]Love P T, Geller M A. Research using high (and higher) resolution radiosonde data. Eos Transactions American Geophysical Union,2012, 93(35): 337-338.
[14]Clayson C A, Kantha L. On Turbulence and mixing in the free atmosphere inferred from high-resolution soundings. Journal of Atmospheric and Oceanic Technology, 2008, 25(6): 833-852.
[15]Leena P P, Venkat Ratnam M, Krishna Murthy B V, et al.Detection of high frequency gravity waves using high resolution radiosonde observations. Journal of Atmospheric and Solar-Terrestrial Physics, 2012, 77(3): 254-259.
[16]Hamilton K, Vincent R A. High-resolution radiosonde data offer new prospects for research. Eos, Transactions American Geophysical Union, 1995, 76(49): 497-497.
[17]Kalnay E. 大氣模式、資料同化和可預報性. 北京: 氣象出版社,2005.
[18]郝民, 田偉紅, 龔建東. L波段秒級探空資料在GRAPES同化系統中的應用研究. 氣象, 2014, 40(2): 158-165.
[19]姚爽, 陳敏, 王建捷. L波段分鐘數據在WRF模式中的變分同化應用試驗. 氣象, 2015, 41(6): 695-706.
[20]Data usage and quality control for ERA-40,ERA-interim and the operational ECMWF data assimilation system. ERA report series, 2011.
[21]中國氣象局. 常規高空氣象觀測業務規范. 北京: 氣象出版社, 2010.
[22]趙天保, 符淙斌, 柯宗建, 等. 全球大氣再分析資料的研究現狀與進展. 地球科學進展, 2010, 25(3): 242-254.
[23]趙天保, 符淙斌. 應用探空觀測資料評估幾類再分析資料在中國區域的適用性. 大氣科學, 2009, 33(3): 634-648.
[24]支星, 徐海明, 三種再分析資料的高空溫度與中國探空溫度資料的對比分析. 高原氣象, 2013, 32(1): 97-109.
[25]趙佳瑩, 徐海明. 中國區域位勢高度場探空與再分析資料的對比分析. 氣象科學, 2014, 34(2): 128-138.
[26]阮新, 熊安元, 胡開喜, 等. 中國歷史探空資料部分等壓面位勢高度訂正. 應用氣象學報, 2015(03): 257-267.
[27]郭艷君, 張思齊, 顏京輝, 等. 中國探空觀測與多套再分析資料氣溫序列的對比研究. 氣象學報, 2016, 74(2): 271-284.
Advances in Meteorological Science and Technology2018年1期