韓瑞 劉娜 任芝花 沈文海
(國家氣象信息中心,北京 100081)
太陽是個巨大的熾熱的氣體球,從太陽發出的輻射能為3.94×1026W,雖然投射到大氣頂部的太陽輻射只有48%到達地面,但正是這部分能量引起了大氣和海洋環流以及推動了地球上包括地表的所有過程的基本原因[1]。所以,輻射過程對于地球生物系統及人類的生存和發展起著決定性作用。因此輻射觀測資料是研究天氣變化、氣候變遷最基本的氣象資料之一。
我國的輻射觀測站分為一級站、二級站與三級站,按照氣象輻射觀測規范,目前三個級別的輻射站主要觀測項目為太陽總輻射。太陽總輻射是指太陽直接輻射和天空散射輻射到達水平面上的總量[1];太陽直接輻射是指太陽以平行光線的形式直接投射到地面上的輻射;散射輻射是指太陽輻射經過大氣散射或云的反射,從天空2π立體角以短波形式向下,到達地面的那部分輻射。
我國的輻射站較少,且臺站又是離散分布的,所以這種將觀測臺站的數據通過空間內插的方法分配到每個網格中,形成的格點數據可以在一定程度上解決空間分布不均的問題。同時,這類數據對于天氣分析、氣候變化以及數值模擬研究具有十分重要意義,特別是作為生態過程模型、水文模型、大氣環流式和陸面過程的重要參數,有著廣闊的應用前景。國家氣象信息中心首次將格點化技術應用于國家級的輻射數據,也為今后的更高精度、多源融合的輻射資料奠定基礎。
本文基于2013年最新整編的一套數據完整性和質量均提升的氣象輻射基礎資料,利用薄盤樣條法(TPS),結合三維地理空間信息進行空間插值,建立了中國太陽總輻射5°×5°格點數據集(V1.0),數據集包含了1961年1月以來的中國太陽總輻射日曝輻量、月曝輻量水平分辨率5°×5°的格點數據。在此基礎上從交叉驗證和誤差分析角度對日值格點數據質量進行評估分析。
建立太陽總輻射格點數據集的過程中,用于空間插值的基礎資料來源包括兩個部分。
1)中國國家級地面氣象輻射站資料。該資料是1961年1月以來的全國國家級臺站的輻射觀測資料,該資料來源于各省、市、自治區氣候資料處理部門逐月上報的《氣象輻射記錄月報表》信息化資料,由國家氣象信息中心基礎資料專項收集、整理,并經過嚴格的檢查和審核。自建站以來,全國許多臺站經過了業務改革、臺站遷移、更迭等歷史變遷,從1957年5月的3個站至1961年1月臺站總數超過70站,20世紀70年代末期臺站數達到80站左右,1993年前后,由于儀器換型,臺站數有些波動;2005年之后穩定維持在99站(圖1)。截至2015年12月全國累計共有99個國家級臺站,其空間分布及中國陸地5°×5°的數字高程模型數據如圖1網格所示,我國地區的輻射臺站分布呈現出東多西少,平原臺站多,山地、高原、沙漠等特殊地形地區分不少的特點。例如:長三角地區單一網格最多臺站分布有8個;而在西藏高原地區網格內沒有臺站分布。

圖1 1957年5月—2015年12月年中國地面輻射臺站站點數變化曲線及空間分布Fig. 1 Variation of station numbers from May 1957 to December 2015, and the distribution of station numbers at grid boxes (5°×5°) in China mainland for 2015
2)高程數據。與溫度相同,太陽總輻射的空間分布受海拔的影響顯著,格點化過程充分考慮海拔因子。根據錢永蘭等[2]通過對1 km、5 km和10 km三種不同DEM分辨率的插值結果進行分析,認為:隨著DEM分辨率的提高,插值誤差會減小,在地形起伏較大的地區更為明顯所以為了減小誤差;實際研究中站點海拔高度與對應網格的DEM存在差異,趙煜飛等[3]完成了站點實測值與對應網格值的比較,認為臺站的空間密度和地形對插值誤差的影響較大。由于我國輻射臺站數量有限,所以本文利用GTOPO30數據(分辨率為1 km×1 km)重采樣生成中國陸地5°×5°的數字高程模型(DEM)數據,通過使用高分辨率的DEM數據,以盡量減小由于地形和臺站數量帶來的誤差。
現階段研究中,已提出了大量的插值方法,包括反距離加權法、樣條函數法、普通克里格方法、貝葉斯插值法、薄盤光滑樣條法、多元線性回歸方法等,這些方法中以Hutchinson[4-5]提出的薄盤樣條法應用最為廣泛。
TPS法是將空間分布作為觀測數據的函數而不需要其先驗知識和物理過程,從而提高數據準確度。TPS方法除了普通的樣條自變量外,引入線性協變量子模型,事實上薄盤樣條函數可以理解為廣義的標準多變量線性回歸模型,只不過其參數是用一個合適的非參數化光滑函數代替。由廣義交叉驗證(GCV)的最小化來確定數據保真度與曲面的粗糙度之間起的平衡作用。GCV的計算可采用“one point move”方法,依次移去一個樣點,用剩余樣點在一定的光滑參數下進行曲面擬合得到該點的估測值,再計算觀測值與估測值的方差。
ANUSPLIN軟件[6]是使用TPS法對多變量數據進行空間內插的工具,根據適合的插值模型方案定義自變量,同時還可以按一定時間順序批量化的處理數據,且其能對插值結果能夠提供多種評估參數,包括:數據平均值、方差、光滑參數(RHO)、廣義交叉驗證、均方根誤差(RMSE)、平均偏差(MBE)、相對偏差(RBE)等指標。由于ANUSPLIN軟件有如上所述的優點,故選取此軟件完成對1961—2015年中國輻射99站的格點化處理工作。
為了檢驗插值方法和插值模型對輻射場的插值效果,采用GCV方法進行評估,首先假設每個站點的觀測值未知,用周圍站點的值來估算,然后根據所有站點實際觀測值與估算值的誤差大小評判插值方法的優劣。GCV 的平方根(RTGCV)由觀測數據誤差和預測數據誤差兩部分組成,而MSE 的平方根(RMSE)是剔除觀測數據誤差后的預測誤差估計,相當于插值過程的真實誤差。另外,數據本身的誤差也會造成GCV偏大。
采用MBE、RBE、RMSE、RTGCV等作為評估插值效果的指標,值越小,表面插值效果越好。具體計算公式[7]如下:

式中,Pi和Oi分別表示第i點上經過插值后的值和臺站原始觀測值,N為統計樣本數。
對1961—2015年的全國參與格點化的每個站點做交叉驗證,根據所有站點RTGCV評判插值模型的優劣。圖2給出了RTGCV的逐月變化曲線??梢钥吹剑?961年1月以來,RTGCV波動具有一定的規律,在1.94~6.24 MJ?m-2?d-1范圍內變化,且具有顯著的周期特征,其周期為1 a。

圖2 1961年1月—2015年12月總輻射值RTGCV的逐月變化Fig. 2 Monthly RTGCV from January 1961 to December 2015
為了更加清晰呈現RTGCV的周期變化,圖3給出了2011年1月—2015年12月總輻射量的RTGCV隨時間演變情況??梢钥闯?,2011年1月—2015年12月總輻射量的RTGCV主要在2.16~5.14 MJ?m-2?d-1波動。同時,總輻射量的RTGCV變化存在一定的季節變化,呈一個非穩定序列特征。即RTGCV夏季最大,春秋次之,冬季最小。其中,這主要是由不同季節的太陽輻射不同導致的,夏季太陽輻射強度較大,太陽輻射絕對量大,RTGCV則偏大。

圖3 2011年1月—2015年12月總輻射值RTGCV的逐月變化Fig. 3 Monthly RTGCV from January 2011 to December 2015
2.2.1平均偏差、相對偏差
為反映插值格點數據的平均誤差,本研究統計了1961年以來的累年平均分析值與觀測值的平均偏差空間分布(圖4)。總體上,全國平均偏差為0.0009 MJ?m-2?d-1,主要集中在±0.5 MJ?m-2?d-1之間,相對偏差主要分布在±5%之間。太陽總輻射插值平均偏差部分地區較大,主要分布在我國的四川盆地、青藏高原、東南沿海以及黑龍江北部等地區。此外,統計分析了1961年以來太陽總輻射日值的分析值與觀測值的平均偏差、相對偏差的頻率(圖4)??梢钥闯觯骄睢⑾鄬ζ畹念l率基本呈正偏態分布,且90%以上的平均偏差集中在±0.5 MJ?m-2?d-1之間,77%的相對偏差分布于±5%之間,92%分布于±10%之間。
2.2.2均方根誤差
圖5給出了1961—2015年總輻射值的均方根誤差隨時間的演變情況。從RMSE的逐月變化曲線,可以看出,均方根誤差呈現出周期性的變化,為了更加清晰呈現均方根誤差的周期變化,給出了2011年1月—2015年12月RSME的逐月變化,均方根誤差在夏季達到最大,冬季最小,基本在0.44~1.75 MJ?m-2?d-1。自1961年以來沒有明顯的年代際突變。1993年前后數據有很大波動,這與輻射業務相關調整有關。

圖4 1961—2015年總輻射插值與觀測值平均偏差空間分布(a)、平均偏差(b)、相對偏差(c)分布頻率Fig. 4 (a) Distribution map of the MBE, (b) frequency distribution of the MBE and (c) of the RBE from 1961 to 2015
重點討論基于該網格數據集中國太陽總輻射長時間序列的季節空間分布趨勢。用中國太陽總輻射多年(1994—2015年)值插值后的網格數據作為多年平均值,分析了22年來中國太陽總輻射的季節變化特征。這里認為四季劃分是春季為3—5月,夏季為6—8月,秋季為9—11月,冬季為12月—次年2月。為了更加準確的反映中國太陽總輻射,本節選取了1994年1月—2015年12月間的數據進行統計,該段時間的太陽總輻射臺站數穩定在97個站以上且數據不間斷;之前的年份,無論是臺站數量,或是數據連續性都不能滿足本節的數據統計需求。

圖5 太陽總輻射插值均方根誤差時序變化:(a)1961—2015年;(b)2011—2015年Fig. 5 Monthly RMSE: (a) for 1961 - 2015 and (b) for 2011 - 2015
從插值后的格點化中國太陽總輻射的季節空間分布圖(圖6)可知,插值后的格點化太陽總輻射數據空間分布和站點觀測資料的氣候態空間分布一致。格點化太陽輻射數據能夠描述出東部地區低、西北地區高的總體特征,同時也反映了因地形因素引起的四川盆地太陽總輻射低值區,以及西北地區天山南北麓的準噶爾盆地太陽總輻射低值區和塔里木盆地、柴達木盆地的太陽總輻射高值區特征,但也平滑了這些地區太陽總輻射極值。綜上,說明該數據集能夠比較細致、準確地描述中國太陽總輻射的主要空間分布特征。
本文通過選取中國1961—2015年總輻射觀測數據,采用TPS插值方法,得到1格點數據,并通過平均偏差、平均絕對誤差、均方根誤差(RMSE)、GCV等評估指標分析輻射格點數據的誤差分布及其季節差異,認為該格點數據產品的插值精度較高;主要結論如下:

圖6 1994—2015年中國太陽總輻射的季節空間分布圖(MJ?m-2?d-1)(a)春季;(b)夏季;(c)秋季;(d)冬季Fig. 6 Distribution map of grid mean in total solar radiation for spring (a), summer (b), autumn (c), winter (d)
1)在廣義交叉驗證中,RTGCV波動具有一定的規律,在1.94~6.24 MJ?m-2?d-1范圍內變化,且具有顯著的周期特征,其周期為1 a??傒椛淞康腞TGCV變化存在一定的季節變化,呈一個非穩定序列特征。即RTGCV夏季最大,春秋次之,冬季最小。這主要是由不同季節的太陽輻射不同導致的,夏季太陽輻射強度較大,太陽輻射絕對量大,RTGCV則偏大。同時也由此證明所用的插值模型合理,插值效果較好。
2)1961—2015年累年平均的總輻射的分析值(插值結果)相對于觀測值的平均偏差主要集中在±0.5 MJ?m-2?d-1之間,R格點分析值相對于實測值的平均偏差為0.0009 MJ?m-2?d-1,均方根誤差為0.9710 MJ?m-2?d-1。平均偏差、相對偏差的頻率基本呈正偏態分布,且90%以上的平均偏差集中在±0.5 MJ?m-2?d-1之間,77%的相對偏差分布于±5%之間,92%分布于±10%之間。且自1961年以來沒有明顯的年代際突變。1993年前后數據有很大波動,這與輻射業務相關調整有關。
3)1994—2015年中國太陽總輻射插值后格點化的數據,其空間分布和站點觀測資料的氣候態空間分布一致。格點化太陽輻射數據能夠描述出東部地區低、西北地區高的總體特征,說明該數據集能夠比較細致、準確地描述中國太陽總輻射的主要空間分布特征。
[1]中國氣象局. 氣象輻射觀測方法. 北京: 氣象出版社, 1996.
[2]錢永蘭, 呂厚荃, 張艷紅. 基于ANUSPLIN軟件的逐日氣象要素插值方法應用與評估. 氣象與環境學報, 2010, 26(2): 7-15.
[3]趙煜飛, 朱江, 許艷. 近50a中國降水格點數據集的建立及質量評估. 氣象科學, 2014, 34(4): 414-420.
[4]Hutchinson M F. Interpolation of rainfall data with thin plate smoothing splines - Part I: Two dimensional smoothing of data with short range correlation. Journal of Geographic Information and Decision Analysis, 1998, 2: 139-151.
[5]Hutchinson M F. Interpolation of rainfall data with thin plate smoothing splines - Part II: Analysis of topographic dependence. Journal of Geographic Information and Decision Analysis, 1998, 2: 152-167.
[6]Hutchinson M F. ANUSPLIN version4.3 user guide. Canberra: The Australia National University, Center for Resource and Environment Studies, 2004.
[7]趙煜飛, 朱亞妮. 中國地面均一化相對濕度月值格點數據集的建立. 氣象, 2017, 43(3): 333-340.
Advances in Meteorological Science and Technology2018年1期