冉超 翟宇梅 王力維
摘 要:文章利用經驗正交函數(EOF)和逐步線性回歸相結合的統計降尺度方法建立大尺度信息與長江中下游地區25個氣象站1月及7月,月平均氣溫之間的統計關系共計36個統計降尺度模型,其中聯合預報因子變量場采用空間聯合的經驗正交函數分解法。結果表明:(1)長江中下游地區25個站點建立的模型通過獨立檢驗,均取得了較好的Pc得分。(2)對于1月的模擬性能都高于7月,這可能與當地處于亞熱帶季風區,夏季較冬季多雨氣溫變化較大有關。(3)分析得分較高方案發現海拔較高站點模擬效果優勢明顯且采用聯合預報因子變量場的效果更好。
關鍵詞:統計降尺度;聯合EOF分解;長江中下游;短期氣溫預測
引言
雖然隨著數值預報的發展,天氣預報對氣溫已有很好的預報,肖明靜等[1]對2010年6月至2011年5月WRF-RUC和T639模式預報的24h2m溫度預報產品進行分析與訂正, 閾值2度的預報準確率均達到80%以上,但是短期氣候預測效果依然不盡如人意。例如08年發生南方冰凍雨雪災害,雖然天氣預報當時已經可以很好的預報出未來幾天的天氣變化,但是卻沒能提供良好的短期氣候預測,依舊造成非常大的影響和損失。目前,常用的短期氣候預測方法有天氣氣候學、統計氣候學和動力氣候學方法。天氣氣候學和統計氣候學方法難以從根本上解釋氣候形成的物理機制,雖歷史擬合率可能較好,但預報準確率有限且不穩定,同樣大氣環流模式(GCMs)是進行氣候預測最行之有效的方法之一[2-4],然而由于它的空間分辨率一般是上百公里,雖然對大尺度信息的模擬與預測是不錯的,卻不能達到局地或區域氣候預測空間尺度的精度[5]??梢詮浹a大氣環流模式的這種不足目前有兩種方法[6],一是發展更高精度的氣候模式,另外一種即是采用降尺度方法。第一種方法計算代價巨大耗時,結果卻未必理想,“性價比”不高。相形之下,降尺度可以在已有模式的基礎上通過動力或者統計的方法來提高局地氣候預測的精度,是更可性的方法。
從90年代初變開始了統計降尺度的研究,這是一門較新的科學,經歷初期集中在歐洲等地的研究和應用后,近年來國內也開始對統計降尺度展開研究。無論是線性方法、非線性方法以及動力-統計降尺度[7-9],很多學者都將落腳點放在降尺度方法本身,而對預報因子變量、預報區域選取和對不同區域的適用性問題關注較少。本文采用PCA與逐步回歸相結合的統計降尺度方法,通過改變初始輸入的預報因子變量區域、預報因子變量場和輸入回歸方程中主成分的個數,建立了不同模型,再通過對長江中下游各臺站氣溫多個統計降尺度模擬結果進行研究比對,選擇最優預報方程,從而提高該地區氣溫預測精度。值得注意的是由于統計降尺度多種不確定性,未來方向[10]將是不斷提高氣候模式的預測能力,將模式良好的輸出信息作為預報因子才能提高區域降尺度的發展,同時用不同的氣候模式驅動不同的降尺度模型即超級集合以期得到更好的關于未來短期或長期等的氣候預測,同時將降尺度的方法應用在各種復雜多樣的區域氣候下,尤其氣候累計觀測資料較少的地區,可以用不同統計降尺度方法進行對比試驗,來提高資料稀少地區的區域氣候預測能力。
1 資料選取
對統計降尺度的研究可知[11-13],在建立統計降尺度模型時,需要觀測的預報因子變量及觀測的預報量兩種數據進行建模,前者代表大尺度信息,后者代表區域尺度。中國地域遼闊,不同教材對各區域有不同的劃分,為了便于統計降尺度方法的研究與應用,Liu Y等[14]對中國南方地區進行重新劃分,本文在此基礎上,選取了長江中下游地區共計25個站點1961-2010年1月和7月的月平均溫度資料。圖1為長江中下游地區25個測站分布圖,圖中長江中下游地區包括湖南、湖北、江蘇、浙江、安徽五省,由圖1可以看出25個站點分布較均勻。由表1可知,站點地形海拔較為均勻,除個別站點外,海拔都低于100m。
預報因子來自于同時期NCEP/NCAR分辨率為2.5°*2.5°的月平均資料,包括17個等壓面(1000,925,850,700,600,500,400,300,
250,150,200,100,70,50,30,20,10(hPa))上的溫度(t),位勢高度(hPa),全風速,u分量風速,v分量風速,以及垂直風速(w)等共計102個預報因子。首先對預報因子做距平化處理,然后對預報因子進行初選,即102個因子分別與25個站點做全球相關場分析,選出溫度場中相關性最好的850hPa溫度場、高度場中相關性最好500hPa位勢高度場(1月是1000hPa)和海平面氣壓場,選取了站點與區域為(110°~125°E;20°~40°N)的T850溫度場平均相關系數進行說明(圖2)。一些研究中表明[15],在使用統計降尺度方法對地面溫度進行預測時,采用大尺度溫度場作為預報因子變量比大氣環流作為預報因子變量效果好,同時研究還認為溫度因子和環流因子的聯合預報因子變量比單個變量作為預報因子變量更能得到真實的結果。所以本文采用850 hPa大尺度溫度場、500 hPa位勢高度場、海平面氣壓場與850 hPa大尺度溫度的聯合場(SLP+T850),以及500hPa高度場和850 hPa溫度的聯合場(H500+T850)作為預報因子變量場,其中1月選取的大尺度位勢高度場為1000hPa。除了預報因子變量外,其預報因子具體取值區域和代入統計模型的主成份(PCs)個數對統計降尺度的模擬結果也有很強的敏感性。因此本文在全球相關場分析的基礎上還選擇了三個預報因子變量的取值區域和三種PCs輸入個數,對25站1月和7月分別建立了共計36種統計降尺度模型(詳見表2)。
2 方法介紹
2.1 主成份分析
在建立統計降尺度模型之前,首先對資料需要進行主成份分析,來減少系統維數,提取主要特征,主成分分析(PCA)在氣象資料分析中有著廣泛使用。
圖2 站點與該區域T850溫度場的平均相關系數
它目的是降低資料的自由度和維數,也就是用少數幾個新變量序列反映原多個變量的變化信息[16]。為了從資料中分離出有用的大尺度信息減少計算量,需要先對NCEP再分析資料進行主成分分析。
單個變量場(如T850)作為預報因子變量場進行分析可以寫成如下形式: 其中其中m為格點數,n為樣本數,
代表主分量的矩陣。其中n=1為第一主分量,n=2為第二主分量,依次類推。主成分具體運算過程可以參考文獻[17]。對于兩個變量的聯合場(如T850+H500)與單量場類似,需要把兩個變量場在空間上聯合為一個新變量場,需要注意的是其空間格點數為兩個場空間格點數的總和,然后進入EOF分解步驟。因為T850和H500兩個變量場取自同區域的相同格點,所以場其特征向量為兩者空間格點數總和,而繪制EOFs空間模態時應該把兩個變量繪于相同網格上,以便考察兩個變量在空間上的耦合情況,同樣的聯合EOF分解得到的PCs代表了聯合場隨時間變化的共同特征。以1月,預報因子變量為T850+SLP和T850+H1000,取值區域為(110°~125°E;20°~40°N)來對比說明單變量預報因子場和雙預報因子聯合場的EOF分解結果。如果是單個溫度場T850分解的第一EOF模態只能表示溫度場的變化趨勢。圖3a表示了聯合場T850+SLP的EOF分解結果,其中包含了兩種等值線,實線代表SLP的等值線,虛線代表T850的等值線,兩者繪于同區域,可以看出氣候變量空間模態的耦合特征,第一EOF反應了與單因子T850類似的溫度變化模態,同時還伴隨海平面氣壓的增加(減少)變化趨勢,所以表征了溫度和海平面氣壓之間的物理聯系,同理,圖3b也同時反映了該場溫度變化,及其隨位勢高度的增加(減少),表征了溫度和位勢高度場之間的物理聯系,使得預報因子物理意義更加明顯。
2.2 逐步回歸
在建立多元線性回歸模型時,有時自變量會非常多。逐步回歸可以按照一定的顯著性條件選出重要因素達到既能減少自變量個數,又能保證回歸效果的目的。其主要的分析思路為:首先對多元線性回歸進行因子篩選;最后給出在一定顯著性水平下,各因子均為顯著回歸方程中的回歸系數。以公式 說明,其中以
代表1月份,第n站的氣溫序列, 代表k個主分量組成的矩陣,因為代入統計模型的主成份(PCs)個數對統計降尺度的模擬結果一定影響,所以本文分別選取了k為10、15、20來進行建模。 為多元線形回歸模型的系數,?著為殘差部分,是不能被多元回歸方程解釋的部分。對k個主分量利用逐步回歸方法,進行逐步篩選,得到對氣溫統計模式顯著的主分量。篩選得到的通過顯著性檢驗(本文取α=0.25)的PC主分量,再建立多元線形模型,估計出多元線形回歸的系數。在本文中由于受資料時間長短的限制,對長江中下游地區1月及7月份氣溫使用前40年(1961-2000年)的資料建模,而后10年(2001-2010年)的資料進行模型獨立檢驗,采用距平符號一致率Pc來進行評分。
3 統計降尺度模式的評估
圖4顯示了1月及7月36個預報因子變量選擇方案的獨立檢驗符號一致率Pc的平均得分分布圖。分析圖4可以看出,相對與7月,1月的各方案模擬效果更優,直觀上說明冬季氣溫可預報性更高。同時可以看出預報因子變量及其區域的選擇,以及輸入的PCs個數對模擬的效果有著明顯影響。輸入的PCs上來說,平均得分較高的是選擇10個PCs作為輸入,其模擬結果優于較大的輸入個數。而從預報變量取值區域上看較小的區域3結果優于其它區域,這與預報因子初選有著密切關系,在建立模型前進行了大尺度資料102個因子全球相關場的對比,從實驗的結果證明相關性越高的區域最終模型得分也較高,進一步說明不同區域預報因子的適用性不同,預報因子區域的確定也為進一步研究長江中下游地區氣候變量打下了基礎。
預報因子實驗方案還考慮了預報因子的物理意義所以選用了雙因子和單因子進行比較,以區域3和輸入10個PCs為例,發現同樣對于1月或是7月,T850+SLP和T850+H1000優于單因子T850、H1000的模擬性能說明聯合場的預報因子考慮了兩個場的物理意義其適用價值高于單預報因子場。總體上看36個預報因子變量方案Pc得分都高于0.5,然后從圖4的曲線變化可以明顯看到36個預報因子變量方案平均得分變化較大,存在差異性,進一步證明,預報因子變量的選擇對統計降尺度模型的直接影響及對結果的敏感性。
圖5是25個測站的36個預報因子變量方案符號一致率得分的箱線圖,x軸是預報因子變量方案,y軸是Pc得分,由圖5a,1月的Pc得分可以看出箱體的中位數位置基本較高,中心趨勢除個別站點外均高于0.6,而4、12和25號站點模擬性能較集中且分散程度也較小,其中最高得分0.9也出現在4號和25號站,說明這些站點對統計降尺度結果都有較好的模擬性能,這和其海拔較高有一定關系??傮w上看各站點地理位置基本分布較集中,長江中下游地區屬于亞熱帶季風氣候,干濕兩季較明顯,所以冬季氣溫變化溫和,預報因子變量模擬方案較夏季更好,分散程度也較小。由圖5b,7月的箱線圖分布可以看出其中位數波動隨站點變化較大,預報因子變量方案Pc得分差異也較大,這和預報因子取值區域和輸入的PC個數有關,而站點12和25號站中位數依舊較高,模擬性能較集中,進一步說明海拔較高的站點對統計降尺度結果模擬性能更好。雖然7月份與1月份模擬結果相比Pc得分存在一定差異,但總體上看25個站點幾乎都有得分為0.8左右的預報方案并且所有范圍均超過0.5,這對進一步研究長江中下游地區統計降尺度方法適用性提供了前提基礎。
圖5 1月(a)和7月(b)36個預報因子變量模擬的25個
臺站氣溫的統計降尺度獨立檢驗Pc得分箱線圖分布
4 結束語
(1)首次較詳盡的對長江中下游地區各站點的氣溫觀測資料和NCEP再分析資料的T850、H1000、T850+H1000和T850+SLP(7月為H500)建立的36種統計降尺度模型,通過獨立檢驗Pc得分可以看出,1月的模型得分均高于7月,并且無論1月或是7月,都有得分0.8左右的預報方案,并且36個預報變量方案模擬結果Pc得分均超過了0.5,這為進一步研究該區域統計降尺度方法提供了參考性和前提保障。
(2)對25個站點36種預報因子變量方案,篩選出Pc得分較高的預報方案進一步分析發現對于EOF與逐步回歸相結合的統計降尺度方法,PC輸入個數為10,預報因子取值區域較小的區域3模擬的平均得分最高,而對于聯合的預報因子變量其模擬性能比單個預報因子變量模擬性能更佳,說明物理意義更明確的預報因子選擇價值更大,同時無論1月還是7月較高得分方案均集中出現在海拔較高的站點,說明海拔較高的站點對統計降尺度模擬性能更好。
(3)通過25個站點多個統計降尺度模型的箱線圖分布可以看出,1月中位數位置較高分散程度也比7月份小,這跟長江中下游地區的氣候特點可能有關。同時分析7月各站點Pc得分分散程度可以看出建模時輸入PC的個數、預報因子區域的選擇對模擬性能有很大影響,進一步說明預報因子變量方案的選擇對統計降尺度模型建立的重要性,不同區域要具體分析。
參考文獻
[1]肖明靜,隋明,范蘇丹,等. 三種數值模式溫度預報產品在山東應用的誤差分析與訂正[J].干旱氣象,2012,30(3): 472-477.
[2]Schlesinger M E, Mitchell J F B. Climate model simulations of the equilibrium climatic response to increased carbon dioxide[J]. Reviews of Geophysics, 1987,25(4): 760-798.
[3]Stouffer R J,Manabe S, Bryan K. Interhemispheric asymmetry in climate response to a gradual increase of atmospheric CO 2[J]. Nature,1989,342(6250): 660-662.
[4]Mearn L O,Bogardi I, Giorgi F,et.al. Comparison of climate change scenarios generated froom regional climate model experiments and statistical downscaling. JournalGeophysicsResearch1999,104(D6):6603-6621.
[5]Cubasch U, Von Storch H, Waszkewitz J, et al. Estimates of climate change in Southern Europe derived from dynamical climate model output[J]. Climate Research, 1996, 7(2): 129-149.
[6]范麗軍,符淙斌,陳德亮. 統計降尺度法對未來區域氣候變化情景預估的研究進展[J]. 地球科學進展,2005,20(3): 320-329.
[7]柯宗建,張培群,董文杰,等. 最優子集回歸方法在季節氣候預測中的應用[J].大氣科學,2009, 33(5): 994-1002.
[8]何慧,金龍,覃志年. 基于 BP 神經網絡模型的廣西月降水量降尺度預報[J].熱帶氣象學報,2007, 23(1): 72-77.
[9]嚴小冬, 吳戰平, 馬振鋒, 等. Downscaling 法在貴州冬季氣溫和降水預測中的應用[J]. 高原氣象,2008,27(1): 169-175.
[10]任麗娜,翟宇梅,王力維. 多模式集合在統計降尺度應用上的研究進展[J].科學技術與工程,2011,11(29): 7185-7194,7201.
[11]趙芳芳,徐宗學. 黃河源區未來地面氣溫變化的統計降尺度分析[J].高原氣象,2008,27(1): 153-161.
[12]曾曉青,王式功,劉還珠,等. 統計降尺度方法在青海省冬季最低溫度預測中的應用[J].高原氣象, 2009,28(6): 1471-1477.
[13]陳麗娟,李維京,張培群,等. 降尺度技術在月降水預報中的應用[J]. 應用氣象學報,2003,14(6): 648-655.
[14]Liu Ying, Fan Ke, WANG Hui-Jun. Statistical Downscaling Prediction of Summer Precipitation in Southeastern China[J]. Atmospheric and Oceanic Science Letters, 2011,4(3): 173-180.
[15] Huth R. Statistical downscaling of daily temperature in central Europe[J]. Journal of Climate, 2002, 15(13): 1731-1742.
[16]吳洪寶,吳蕾.氣候變率診斷和預測方法[M].北京:氣象出版社,2005: 33-34.
[17]施能.氣象統計預報[M].北京:氣象出版社,2009:91-96.
作者簡介:冉超(1989-),男, 四川成都, 研究生在讀, 研究方向:短期氣候預測。