王 根,劉曉蓓,楊 寅,孔芹芹
(1.安徽省氣象信息中心,安徽合肥230031;2.國(guó)家氣象中心,北京100081)
數(shù)值天氣預(yù)報(bào)(Numerical Weather Prediction,NWP)已成為當(dāng)今世界天氣預(yù)報(bào)中的重要手段。在數(shù)值預(yù)報(bào)中影響預(yù)報(bào)準(zhǔn)確性的主要因素有2個(gè):NWP模式本身的準(zhǔn)確程度;用作預(yù)報(bào)模式積分的初始條件的好壞。資料同化則為數(shù)值天氣預(yù)報(bào)模式提供精確的初始條件提供了可能[1]。
隨著遙感探測(cè)技術(shù)的發(fā)展,衛(wèi)星資料彌補(bǔ)了海洋和人煙稀少地區(qū)資料不足的缺陷,對(duì)全球預(yù)報(bào)準(zhǔn)確性地提高起到了至關(guān)重要的作用[1]。紅外探測(cè)器主要覆蓋CO2和H2O光譜區(qū)域。CO2和H2O吸收帶分別提供大氣溫度和濕度信息,而溫度、濕度是模式變量用于數(shù)值模式進(jìn)行預(yù)報(bào),表明紅外探測(cè)器資料在數(shù)值預(yù)報(bào)中應(yīng)用具有重要的意義[2-3]。
以前間接使用衛(wèi)星數(shù)據(jù),首先把衛(wèi)星觀測(cè)到的通道亮溫進(jìn)行反演得到模式可以使用的溫度、濕度信息,稱(chēng)為“衛(wèi)星到模式”的反演途徑。由于反演是一對(duì)多的問(wèn)題,有學(xué)者提出使用正則化思想,主要增加約束條件解決一對(duì)多的不確定性。隨著技術(shù)的發(fā)展,變分同化可以直接使用衛(wèi)星通道亮溫,用正演方法避免反演不確定性[1,4]。
變分同化基礎(chǔ)是統(tǒng)計(jì)中的估計(jì)理論。常用的方法有最小方差估計(jì)、最大似然估計(jì)和貝葉斯理論,最小二乘擬合事實(shí)上是高斯誤差分布假定下的最大似然估計(jì)[5-6]。變分同化基本思想是將資料同化歸結(jié)為一個(gè)二次泛函極小化問(wèn)題,對(duì)其求極小化得到所需要的解。變分同化要求誤差滿足高斯分布,目的是應(yīng)用最小二乘理論,最小二乘法要求誤差相互獨(dú)立、以零為數(shù)學(xué)期望具有相同方差且滿足高斯分布。當(dāng)實(shí)際觀測(cè)值包含離群點(diǎn)時(shí),誤差不服從高斯分布具有“拖尾現(xiàn)象”。最小二乘法對(duì)偏離高斯分布的假定十分敏感,這種偏斜可能會(huì)對(duì)變分同化系統(tǒng)的穩(wěn)健性產(chǎn)生致命的影響[7-8]。根據(jù)最小二乘法的數(shù)學(xué)理論,最終結(jié)果是離群值和正常值之間的妥協(xié)與真實(shí)解相差較遠(yuǎn),導(dǎo)致估計(jì)出的參數(shù)不準(zhǔn)確,所以在進(jìn)行資料變分同化時(shí)需要首先運(yùn)用合適算法識(shí)別出數(shù)據(jù)中的離群點(diǎn)并加以處理(稱(chēng)為變分同化前的質(zhì)量控制部分)[7-8]。
資料的質(zhì)量控制算法是變分同化關(guān)鍵的步驟,也是國(guó)內(nèi)外學(xué)者研究的熱點(diǎn)。陶士偉等[9]對(duì)北京地區(qū)地面自動(dòng)站的資料基于極值檢查、要素間一致性檢查、時(shí)間一致性檢查等多種檢查方法進(jìn)行了相應(yīng)資料的質(zhì)量控制算法研究。郝民等[10]在中國(guó)區(qū)域GRAPES(Globe and Regional Assimilation and Prediction System)三維變分同化系統(tǒng)中對(duì)常規(guī)觀測(cè)資料(包括船舶、探空、地面及飛機(jī)等資料)進(jìn)行了變分質(zhì)量控制,改進(jìn)了該系統(tǒng)分析與降水預(yù)報(bào)結(jié)果。Qin et al[11]基于變分同化中觀測(cè)誤差和背景誤差均要求滿足高斯分布的假定,利用2008年1月1°×1°的NCEP(National Centers for Environmental Prediction)資料提出了基于經(jīng)驗(yàn)正交分解質(zhì)量控制法對(duì)地面2m觀測(cè)溫度進(jìn)行了質(zhì)量檢查與處理,取得了較好的結(jié)果。
對(duì)于衛(wèi)星資料而言,一般是基于通道亮溫偏差進(jìn)行質(zhì)量控制算法研究,所謂亮溫偏差是衛(wèi)星通道觀測(cè)亮溫(O)與模擬亮溫(B)之差,定義為O-B[12]。模擬亮溫通過(guò)把背景場(chǎng)(文中采用NCEP分析場(chǎng)資料)輸入到快速輻射傳輸模式,文中采用歐洲中心European Centre for Medium-Range Weather Forecasts(ECMWF)的Radiative Transfer for TIROS-N Operational Vertical Sounder(RTTOV)[13]計(jì)算得到。目前變分同化系統(tǒng)中多采用閾值檢查法進(jìn)行資料的質(zhì)量控制,將不滿足的觀測(cè)資料剔除[14],對(duì)于衛(wèi)星資料而言,式中yoi、ybi分別為通道i的實(shí)際觀測(cè)亮溫與背景場(chǎng)模擬亮溫,k為倍數(shù),σo為標(biāo)準(zhǔn)差。算法的缺點(diǎn)是樣本中的離群點(diǎn)(尤其是偏差較大的離群點(diǎn))會(huì)影響統(tǒng)計(jì)結(jié)果。Zou et al[15]提出基于雙權(quán)重質(zhì)量控制進(jìn)行GPS掩星資料的處理取得了較好的結(jié)果。雙權(quán)重法現(xiàn)被用于一系列資料的質(zhì)量控制研究中(如,F(xiàn)Y-3A微波濕度計(jì)資料[12])。文中將雙權(quán)重質(zhì)量控制算法用于FY3B/IRAS資料,剔除受地表發(fā)射率、云影響和誤差較大的離群資料。
采用質(zhì)量控制算法的目的是找出資料中的離群點(diǎn),即離開(kāi)均值“距離”較大的資料[12]。實(shí)際執(zhí)行質(zhì)量控制算法過(guò)程中,離群點(diǎn)值的定義(超過(guò)多大的值稱(chēng)為離群點(diǎn))對(duì)最終結(jié)果會(huì)產(chǎn)生一定的影響。一般先統(tǒng)計(jì)所要研究的觀測(cè)資料以及模擬與觀測(cè)資料之間的偏差得到資料的分布結(jié)構(gòu)和統(tǒng)計(jì)特征,再根據(jù)數(shù)理統(tǒng)計(jì)理論并結(jié)合經(jīng)驗(yàn)確定離群值。也可以基于穩(wěn)健統(tǒng)計(jì)思想,穩(wěn)健統(tǒng)計(jì)具有兩個(gè)優(yōu)點(diǎn):(1)當(dāng)數(shù)據(jù)分布結(jié)構(gòu)未知或雖然已知不滿足高斯分布時(shí),穩(wěn)健統(tǒng)計(jì)能夠較好地描述所研究的問(wèn)題;(2)當(dāng)樣本數(shù)據(jù)中存在離群點(diǎn)時(shí),穩(wěn)健統(tǒng)計(jì)不會(huì)偏離實(shí)際解太遠(yuǎn),也即是穩(wěn)健統(tǒng)計(jì)對(duì)離群點(diǎn)不太敏感[7-8]。基于穩(wěn)健性較強(qiáng)的雙權(quán)重質(zhì)量控制法進(jìn)行FY3B/IRAS資料的應(yīng)用研究,利用雙權(quán)重平均值和標(biāo)準(zhǔn)差可以減小離群點(diǎn)對(duì)統(tǒng)計(jì)結(jié)果的影響。
IRAS資料(xi,i=1,2,…,n)中的離群點(diǎn)可以通過(guò)雙權(quán)重法進(jìn)行識(shí)別。其中,xi是通道亮溫偏差O-B。雙權(quán)重平均值和雙權(quán)重標(biāo)準(zhǔn)差BSTD計(jì)算公式[12,15]:

其中,M是中位數(shù),wi是權(quán)重函數(shù),Xi是樣本值(即通道亮溫偏差yoi-ybi)。權(quán)重函數(shù)wi定義為

式中,MAD是偏差中位數(shù),即的中位數(shù)。若|wi|>1,則取wi=1。
離群資料可以根據(jù)Z值的評(píng)分確定:

中國(guó)第二代極軌氣象衛(wèi)星風(fēng)云三號(hào)B星(Feng Yun-3B)于2010年11月5日發(fā)射升空。文中研究其攜帶的紅外分光計(jì)(Infrared Atmospheric Sounder,IRAS),只考慮IRAS前20個(gè)通道。關(guān)于通道探測(cè)的氣體和探測(cè)最大貢獻(xiàn)層見(jiàn)參考文獻(xiàn)[16]。觀測(cè)資料為全球L1c格式的IRAS觀測(cè)資料(時(shí)間從2012年12月26日00時(shí)至2013年1月4日18時(shí)共10天)。L1c格式數(shù)據(jù)來(lái)源于國(guó)家衛(wèi)星氣象中心數(shù)據(jù)室。把NCEP分析場(chǎng)00時(shí)、06時(shí)、12時(shí)和18時(shí)的資料作為背景場(chǎng)采用RTTOV進(jìn)行IRAS通道亮溫模擬。
全球/區(qū)域同化和預(yù)報(bào)系統(tǒng)GRAPES是中國(guó)科學(xué)家在充分吸收國(guó)外數(shù)值天氣預(yù)報(bào)和相關(guān)學(xué)科最新研究成果的基礎(chǔ)上,自主設(shè)計(jì)的新一代數(shù)值同化和預(yù)報(bào)模式[17]。GRAPES模式共有4個(gè)模塊:標(biāo)準(zhǔn)初始化模塊、資料同化模塊(3DVar)、預(yù)報(bào)模塊和后處理模塊。當(dāng)前GRAPES-3DVar變分同化系統(tǒng)可以同化探空、云跡風(fēng)、GPS水汽反演資料和衛(wèi)星通道亮溫等資料。GRAPES-3DVar采用ECMWF的快速輻射傳輸模式RTTOV進(jìn)行衛(wèi)星通道亮溫模擬。
基于雙權(quán)重質(zhì)量控制法(Quality Control,QC)對(duì)IRAS通道亮溫偏差(O-B)進(jìn)行處理。雙權(quán)重平均值和標(biāo)準(zhǔn)差能夠減小離群點(diǎn)對(duì)統(tǒng)計(jì)結(jié)果地影響。具體執(zhí)行過(guò)程中分兩步進(jìn)行:
Step1:粗檢查。粗檢查即極值檢查,要求IRAS通道觀測(cè)亮溫和相應(yīng)的模擬亮溫取值在150K~350K,剔除此范圍外的資料。
Step2:離群點(diǎn)檢查。離群資料通常是根據(jù)該資料離開(kāi)樣本均值的距離結(jié)合標(biāo)準(zhǔn)差進(jìn)行度量。樣本數(shù)據(jù)(xi,i=1,2,…,n)中的離群點(diǎn)可以通過(guò)雙權(quán)重法進(jìn)行識(shí)別。其中xi是IRAS通道亮溫偏差O-B。
基于雙權(quán)重法進(jìn)行IRAS資料質(zhì)量控制研究,先采用2012年12月26日00時(shí)和06時(shí)資料為例做簡(jiǎn)單說(shuō)明。
2.2.1 IRAS通道觀測(cè)和模擬亮溫
限于篇幅,文中只給出通道4的情況。圖1分別給出通道4的觀測(cè)亮溫(Obs)、模擬亮溫(Sim)、亮溫偏差(Bias)和基于雙權(quán)重質(zhì)量控制法得到的Z-score。需要說(shuō)明的是文中把Z-score大于4的值都標(biāo)記為4。

圖1 IRAS通道4在2012年12月26日00和06時(shí)觀測(cè)亮溫(Obs)、模擬亮溫(Sim)、亮溫偏差(Bias)和Z-score值分布
從圖1可以看出,亮溫偏差主要集中在-34K~14K,模擬出的結(jié)果整體效果較好,但少數(shù)地區(qū)(如,極區(qū))偏差較大。從Z-score圖可以看出,Z-score得分與偏差分布具有較好的一致性。對(duì)IRAS通道亮溫在粗檢查的基礎(chǔ)上,需要進(jìn)一步剔除亮溫偏差超過(guò)20K的通道視場(chǎng)點(diǎn)亮溫資料[7]。
下面根據(jù)通道亮溫偏差(O-B)基于雙權(quán)重質(zhì)量控制法進(jìn)行FY3B/IRAS資料處理研究(離群點(diǎn)識(shí)別)。
2.2.2 IRAS 資料離群點(diǎn)識(shí)別
計(jì)算2012年12月26日00時(shí)和06時(shí)通道4亮溫偏差Z-score值。通過(guò)計(jì)算Z-score值對(duì)O-B進(jìn)行雙權(quán)重質(zhì)量控制得出不同Z-score值離群點(diǎn)和通過(guò)雙權(quán)重質(zhì)量控制法的離散點(diǎn)分布。灰色點(diǎn)代表未通過(guò)雙權(quán)重質(zhì)量控制的離群點(diǎn),黑點(diǎn)代表通過(guò)雙權(quán)重質(zhì)量控制的點(diǎn)。

圖2 通道4不同Z-score離群點(diǎn)散點(diǎn)圖
區(qū)別常規(guī)閾值法只對(duì)亮溫偏差做簡(jiǎn)單的閾值判斷,雙權(quán)重法從所用的樣本出發(fā),減小離群點(diǎn)對(duì)最終結(jié)果的影響,具有穩(wěn)健性并且能夠保留一些具有“天氣現(xiàn)象”的資料。通過(guò)雙權(quán)重質(zhì)量控制法能夠剔除一些異常資料,Z-score值越大通過(guò)雙權(quán)重質(zhì)量控制的點(diǎn)越多,圖中對(duì)應(yīng)的黑色區(qū)域越大。對(duì)于Z-score值的給定,需要進(jìn)一步研究如何取值使質(zhì)量控制后的效果更好。對(duì)Z-score值的給定既要考慮離群資料對(duì)偏差和標(biāo)準(zhǔn)差的影響,又要考慮離群資料占總觀測(cè)資料的比例(要盡可能多地保留觀測(cè)資料)。
對(duì)IRAS前20個(gè)通道離群點(diǎn)占總觀測(cè)資料百分比進(jìn)行統(tǒng)計(jì)。考慮到FY3B/IRAS前20個(gè)通道中雖然通道權(quán)重函數(shù)不同,但很多通道探測(cè)目的相同。限于篇幅,圖3只給出通道4雙權(quán)重質(zhì)量控制(QC)前/后40個(gè)時(shí)次(2012年12月26日00時(shí)到2013年1月4日18時(shí))通道偏差(O-B)均值、標(biāo)準(zhǔn)差以及離群資料百分比在不同Z-score值(Z-score<1.5、Z-score<2.0和 Z-score<3.0)隨時(shí)間(Dec26-Jan4)變化圖。
從圖3可以看出,Z-score<1.5時(shí)通道亮溫偏差均值和標(biāo)準(zhǔn)差比雙權(quán)重質(zhì)量控制前減小的幅度大,但剔除的離群資料百分比較大。

圖3 IRAS通道4亮溫偏差(O-B)不同Z-score下的均值、標(biāo)準(zhǔn)差和離群資料百分比
通過(guò)統(tǒng)計(jì)通道亮溫偏差QC前/后的均值和標(biāo)準(zhǔn)差隨時(shí)間變化,有些通道亮溫存在正偏差,而有些通道亮溫存在負(fù)偏差,所有通道O-B的均值和標(biāo)準(zhǔn)差隨時(shí)間變化很穩(wěn)定(其他通道情況圖略)。說(shuō)明通過(guò)雙權(quán)重法剔除離群資料可行,能夠應(yīng)用到GRAPES-3DVar變分同化系統(tǒng)中作為衛(wèi)星資料初步的質(zhì)量控制。
圖4給出 Z-score<2.0時(shí)2012年12月26日到2013年1月4日共10天IRAS通道O-B均值、標(biāo)準(zhǔn)差[18]柱狀圖。
經(jīng)過(guò)雙權(quán)重質(zhì)量控制后去除的離群點(diǎn)都是偏差較大的點(diǎn)(有正偏差和負(fù)偏差)。偏差的存在有多種原因,如云和降水的影響、地表發(fā)射率不精確、資料中掃描角較大的視野點(diǎn)(需要考慮通道亮溫偏差訂正)等。文中只是驗(yàn)證基于雙權(quán)重質(zhì)量控制法進(jìn)行FY3B/IRAS資料質(zhì)量控制的可行性,初步剔除IRAS通道亮溫偏差比較大的離群資料。在實(shí)際業(yè)務(wù)變分同化中FY3B/IRAS資料進(jìn)GRAPES-3DVar同化需要進(jìn)行嚴(yán)格的質(zhì)量控制。

圖4 IRAS通道亮溫雙權(quán)重質(zhì)量控制前/后,滿足Z-score<2.0)亮溫偏差均值和標(biāo)準(zhǔn)差

圖5 FY3B/IRAS雙權(quán)重質(zhì)量控制前/后通道1、6、11、20亮溫偏差均值和標(biāo)準(zhǔn)差散點(diǎn)分布圖
2.2.3 耦合雙權(quán)重法的FY3B/IRAS資料質(zhì)量控制應(yīng)用研究
目前GRAPES-3DVar系統(tǒng)中沒(méi)有同化FY3B/IRAS資料的完整模塊。首先,需要把開(kāi)發(fā)的同化IRAS資料模塊嵌入到GRAPES-3Dvar變分同化系統(tǒng)中;其次,進(jìn)行同化FY3B/IRAS資料測(cè)試。同化時(shí)間從2012年12月24日18時(shí)到2013年1月22日00時(shí),背景場(chǎng)來(lái)自NCEP的分析場(chǎng)。為了簡(jiǎn)化只同化FY3B/IRAS資料和常規(guī)資料(包括探空、地面、飛機(jī)和船舶資料)。通過(guò)近一個(gè)月的O-B(通道觀測(cè)亮溫與背景場(chǎng)模擬亮溫之差)和O-A(通道觀測(cè)亮溫與GRAPES-3DVar同化后的分析場(chǎng)模擬亮溫之差)各個(gè)時(shí)次(每6小時(shí)為一個(gè)時(shí)次)的偏差均值和標(biāo)準(zhǔn)差統(tǒng)計(jì)得到同化后偏差均值和標(biāo)準(zhǔn)差顯著減小(圖略),說(shuō)明嵌入的模塊接口正確。
2013年7月7日06時(shí) FY3B/IRAS(圖5)資料在 GRAPES-3DVar中雙權(quán)重質(zhì)量控制前(Before QC)/后(After QC)的通道亮溫偏差均值(mean)和標(biāo)準(zhǔn)差(std)。質(zhì)量控制過(guò)程包括雙權(quán)重質(zhì)量控制和偏差訂正(偏差訂正方法具體實(shí)施過(guò)程參考文獻(xiàn)[3])。
前面介紹雙權(quán)重法用于FY3B/IRAS資料的質(zhì)量控制試驗(yàn),目的是初步剔除一些“離群點(diǎn)”,而把雙權(quán)重法的思想耦合到GRAPES-3DVar中是經(jīng)過(guò)了嚴(yán)格的質(zhì)量控制算法處理。經(jīng)過(guò)質(zhì)量控制后的模式模擬值與觀測(cè)值已經(jīng)比較接近,通道亮溫偏差均值絕對(duì)值和相應(yīng)標(biāo)準(zhǔn)差減小,說(shuō)明質(zhì)量控制方法是可行的。從上面的離散點(diǎn)圖更能說(shuō)明GRAPES-3DVar系統(tǒng)的性能。
利用雙權(quán)重質(zhì)量控制法進(jìn)行了風(fēng)云三號(hào)B星紅外分光計(jì)IRAS資料的應(yīng)用研究。通過(guò)監(jiān)測(cè)偏差O-B檢驗(yàn)FY3B/IRAS觀測(cè)資料的質(zhì)量,達(dá)到對(duì)FY3B/IRAS資料的質(zhì)量控制。IRAS前20個(gè)通道資料基于雙權(quán)重質(zhì)量控制后通道偏差標(biāo)準(zhǔn)差整體顯著減小,且隨時(shí)間波動(dòng)幅度比雙權(quán)重質(zhì)量控制前更穩(wěn)定。通過(guò)把雙權(quán)重法耦合到GRAPES模式進(jìn)行IRAS資料的質(zhì)量控制應(yīng)用研究,得到此方法用于IRAS資料的質(zhì)量控制是可行性的。通道亮溫偏差絕對(duì)值接近于0,滿足后期變分同化的理論要求。
[1] 王根.主成分累計(jì)影響系數(shù)法一種用于高光譜資料的通道選擇新技術(shù)[D].南京:南京信息工程大學(xué),2011.
[2] 戴鐵.利用風(fēng)云三號(hào)氣象衛(wèi)星紅外分光計(jì)反演大氣CO2濃度的理論研究[D].南京:南京信息工程大學(xué),2008.
[3] 王根,陸其峰,劉輝,等.FY-3B紅外分光計(jì)亮溫觀測(cè)模擬偏差訂正的初步研究[J].紅外,2014,35(1):18-23.
[4] 張華.輻射率資料的直接同化方法及應(yīng)用研究[D].蘭州:蘭州大學(xué),2004.
[5] 鄒曉蕾.資料同化理論和應(yīng)用[M].北京:氣象出版社,2009.
[6] Eugenia Kalnay.大氣模式、資料同化和可預(yù)報(bào)性[M].蒲朝霞,楊福全,鄧北勝,等譯.北京:氣象出版社,2005.
[7] Wang G,Zhang J W.Generalised variational assimilation of cloud-affected brightness temperature using simulated hyper-spectral atmospheric infrared sounder data[J].Advances in Space Research,2014,54(1):49-58.
[8] Zhang J W,Wang G,Yang Y,et al.Study on Hyper-spectral Atmospheric Infrared Sounder Assimilation[J].International Journal of Hybrid Information Technology,2013,6(1):123-128.
[9] 陶士偉,仲躋芹,徐枝芳,等.地面自動(dòng)站資料質(zhì)量控制方案及應(yīng)用[J].高原氣象,2009,28(5):1202-1209.
[10] 郝民,張華,陶士偉,等.變分質(zhì)量控制在GRAPES-3DVAR中的應(yīng)用研究[J].高原氣象,2013,32(1):122-132.
[11] Qin Z K,Zou X,Li G,et al.Quality control of surface station temperature data with non-Gaussian observation-minus-back-ground distribution[J].J Geophys Res,2010,115,D16312.
[12] 胡言青,官莉.采用雙權(quán)重算法進(jìn)行FY-3A微波濕度計(jì)資料質(zhì)量控制試驗(yàn)[J].氣象科學(xué),2013,33(1):59-65.
[13] Hocking J,Rayer P,Saunders R,et al.RTTOV v10 Users Guide[M].NWPSAFMO-UD-023,EUMETSAT,Darmstadt,Germany,2010.
[14] 董超華,李俊,張鵬,等.衛(wèi)星高光譜紅外大氣遙感原理和應(yīng)用[M].北京:科學(xué)出版社,2013.
[15] Zou X,Zeng Zhen.A quality control procedure for GPS radio occultation data[J].J.Geophys.Res.,2006.
[16] Qi C L,Chen Y,Liu H,et al.Calibration and validation of the InfraRed Atmospheric Sounder onboard the FY3B satellite[J].IEEE Transctions on Geoscience and Remote Sensing,2012,50(12):4903-4914.
[17] 薛紀(jì)善,陳德輝.數(shù)值預(yù)報(bào)系統(tǒng)GRAPES的科學(xué)設(shè)計(jì)與應(yīng)用[M].北京:科學(xué)出版社,2008.
[18] 王剛.定量分析與評(píng)價(jià)方法[M].上海:華東師范大學(xué)出版社,2002,9:87-95.
[19] 劉志權(quán),張鳳英,吳雪寶,等.區(qū)域極軌衛(wèi)星ATOVS輻射偏差訂正方法研究[J].氣象學(xué)報(bào),2007,65(1):113-123.