江金昊 劉海磊 王乙竹 張升蘭
(成都信息工程大學電子工程學院,四川 成都 610225)
大氣中的水汽及其變化是天氣和氣候變化的主要驅動力,是影響氣候變化和維持地球生態平衡的關鍵要素[1],其在降水和災害性天氣預報、大氣輻射研究、水循環和全球氣候變化研究等方面具有重要應用[2-3]。此外,大氣中的水汽含量也是影響遙感應用的主要物理量之一,如地表參數精確反演、遙感數據大氣訂正等均需要精確的水汽信息[4-6]。
大氣可降水量(precipitable water vapor,PWV)是表征大氣水汽的一個重要參數,指單位面積空氣柱里含有的水汽總量[7]。目前,有多種技術手段可以進行PWV的探測,根據探測手段可分為無線電探空、地基遙感和衛星遙感[8-10]3類。雖然無線電探空、地基遙感探測精度較好,但這兩類探測方式僅能給出固定點上空的水汽分布情況,通常無法準確、客觀地反映某一地區水平尺度上的水汽含量梯度變化[11-12]。
青藏高原占中國領土面積的四分之一,平均海拔高度4000 m以上,是世界上海拔最高、地形最復雜的高原[13]。青藏高原地氣作用過程,尤其是能量與水分循環過程對亞洲季風、東亞大氣環流及全球氣候變化均有重要影響[14]。因此,高原的水汽分布、來源、輸送等一直都是非常關注的高原氣象科學問題[14-15]。
極軌氣象衛星每天僅可以提供同一地區一至兩次的PWV觀測,加之青藏高原云量偏多使極軌衛星獲取的有效數據非常有限[16]。相比之下,靜止氣象衛星具有觀測區域大、頻次高的優勢,是目前獲取青藏高原高時空分辨率水汽信息的有效手段[17]。因此開展基于靜止氣象衛星的青藏高原高精度水汽探測研究具有重要實際應用價值與現實意義。
目前,靜止氣象衛星沒有近紅外和微波水汽探測通道,因此其PWV反演算法主要是基于熱紅外通道數據展開的。PWV紅外反演算法大致可分為線性分裂窗算法、分裂窗方差協方差比值算法和物理分裂窗算法[18-19],這些算法均是基于水汽在分裂窗區通道吸收差異原理開發的[9]。線性分裂窗算法和分裂窗方差協方差比值算法通常假定分裂窗區通道發射率相同,且鄰近像元需存在一定的溫度差異,這一定程度限制了算法的精度和適用性。物理分裂窗算法由于考慮了輻射傳輸過程,其精度優于線性分裂窗算法[20]。
傳統的分裂窗算法實質是利用水汽在分裂窗區通道吸收差異原理開展的。在干燥環境下(比如PWV<2.0 cm),水汽吸收差異引起的分裂窗區通道亮溫差較小(可小于1.0 K),這可與通道發射率不確定性引起的亮溫差、儀器噪聲和定標誤差相當。算法更容易受到發射率不確定性和觀測誤差的影響,因此低水汽環境下僅利用分裂窗通道估算PWV存在較大的不確定性[19]。青藏高原平均海拔高度超過4000 m,水汽含量相比同緯度地區明顯偏低,再加之高原地形復雜、發射率等輔助數據缺乏,使僅基于分裂窗區通道無法獲取青藏高原可靠的PWV信息[9]。
近年來國際上都在發展新一代靜止氣象衛星,比如日本的Himawari-8/9、美國的GOES-R、中國的 FY-4A/4B和歐洲的MTG-I/S等陸續發射升空[21-22]。新一代衛星搭載的成像輻射儀在時間、空間、光譜分辨率及觀測精度等方面顯著提升,可提供更加豐富的大氣溫度、濕度信息,這為青藏高原高海拔、低水汽環境下的高精度PWV反演提供了良好的機遇。
目前,AGRI/FY-4A和ABI/GOES-R已發布了總水汽含量和分層水汽產品。AGRI和ABI的水汽產品算法相似,都是基于一維變分(1DVAR)方法,利用衛星的多通道觀測進行物理迭代,實現大氣溫度和濕度廓線的反演[7,23]。之后,對反演的大氣廓線進行積分獲得分層和總水汽含量。由于靜止氣象衛星成像儀通道較少,這給大氣溫度和濕度廓線的反演帶來較大不確定性。此外,該方法對大氣廓線初始場的依賴性較強。已有的研究表明AGRI和ABI產品在低水汽情況下的誤差較大,其中AGRI水汽產品在青藏高原的相對誤差可達30%~80%[7]。
Himawari-8搭載的高級成像儀(advanced himawari imagers,AHI)除提供2個紅外分裂窗通道以外,還具備6.2 μm、7.0 μm和7.3 μm附近的水汽通道觀測能力[24-25]。這有助于中高層水汽探測,也有利于提高低水汽環境下的PWV反演精度。目前,Himawari-8衛星并未發布官方PWV產品,使用AHI數據開展青藏高原PWV反演的研究較少。本研究將利用AHI多通道紅外觀測和其他輔助數據,基于神經網絡技術構建一種適用于青藏高原低水汽情況下的PWV反演算法。
1.1.1 Himawari-8數據
Himawari-8是日本氣象廳的新一代靜止氣象衛星,于2014年10月7日發射,2015年7月7日正式業務化運行,位于140.7°E的赤道上空,覆蓋范圍為60°N~60°S,80°E~160°W。其搭載的成像儀AHI共有16個光譜通道,包括3個可見光通道,3個近紅外通道和10個紅外通道[22]。每10 min可進行一次全圓盤掃描,每2.5 min對日本周邊地區進行一次區域掃描。目前,Himawari-8衛星沒有發布PWV業務化產品。
AHI具有2 個紅外分裂窗通道和6.2 μm、7.0 μm和7.3 μm 3個水汽通道觀測能力。利用中光譜分辨率大氣輻射傳輸模式(MODTRAN5.2)開展這些通道的水汽敏感性分析,圖1給出了不同高度中緯度冬季標準大氣濕度廓線5%變化,所引起的通道亮溫變化情況。AHI的6.2 μm、7.0 μm和7.3 μm通道權重函數的峰值在400 hPa、520 hPa和580 hPa附近,通常情況主要提供中上層水汽信息,受地表參數(如地表溫度和發射率)的影響較小。11.2 μm和12.3 μm窗區通道主要對低層水汽更為敏感,權重函數峰值為800 hPa和780 hPa附近。
通道敏感性在不同大氣條件下會有所不同,青藏高原平均海拔高度達4000 m,AHI水汽吸收通道具備提供整個空氣柱水汽含量的潛力。此外,紅外分裂窗區通道的差分吸收也能提供PWV。因此,選用AHI的水汽吸收和分裂窗區5個紅外通道亮溫進行水汽反演。表1為使用通道的主要特征,使用數據的時間是2016年1月1日-12月30日。此外,還使用了AHI L2級云檢測產品,主要用于分辨晴空和云天像元。AHI數據下載于日本宇宙航空研究開發機構地球觀測研究中心(http://www.eorc.jaxa.jp/ptree/index.html)。由于JAXA的P-Tree數據網發布的云檢測產品只有白天的數據,因此本研究僅使用了0-12 UTC的數據,時間間隔為1 h。

表1 算法所使用AHI通道的主要特征
1.1.2 GPS PWV數據
全球定位系統(global positioning system,GPS)地基站點在接收信號時的大氣延遲可用于大氣水汽反演,精度通常為1~2 mm[11]。GPS PWV數據已被廣泛應用于衛星水汽產品的評估和驗證。選用2016年1月1日-12月30日的逐小時GPS PWV作為真實參考數據,用于建模和驗證AHI反演的PWV精度。
青藏高原24°N~40°N,80°E~105°E共 32個GPS站點(圖2),站點海拔高度從2585~4705 m,年均PWV變化3.03~10.05 mm。2016年的逐小時PWV變化0.2~35.0 mm。
1.1.3 GFS PWV預報場
全球天氣預報系統(GFS)可以提供全球范圍0.25°,0.5°和1°的網格PWV數據。預測時間步長分別為0~240(間隔為3 h),240~384(間隔為12 h)。模式預報每天在UTC 00、06、12和18時運行。根據已有的研究,數值預報可以有效提高基于衛星數據的大氣參數估算精度[26]。將0.25°分辨率的GFS PWV數據作為模型的一個輸入,以期待通過融合衛星觀測和GFS PWV的預報信息,并減少云污染對衛星反演結果可能的影響,進而提高PWV反演精度。
美國大學大氣科學研究聯盟(UCAR)提供了非常便捷獲得GFS歷史數據子集的方式(https://rda.ucar.edu/datasets/ds084.1/)。實時的GFS PWV預報數據可從NOAA NCEP下載(https://www.nco.ncep.noaa.gov/pmb/products/gfs/)。由于GFS僅提供3 h間隔的數據,根據AHI的觀測時間和經緯度信息對GFS PWV進行了時空插值。
神經網絡是由多個神經元構成的非線性模型,其可以較好地描述訓練數據的輸入和輸出變量的非線性和復雜關系,也被廣泛應用于地球物理參數的反演和估算[26-27]。本研究選用多層前饋神經網絡來構建青藏高原PWV快速反演模型。
模型的輸入主要包括AHI的5個紅外亮溫、衛星觀測角、GFS PWV預報場、海拔高度、經度、緯度、儒略日和小時。利用最近鄰方法提取與GPS站點時空匹配的AHI像元多通道亮溫,對GFS數據進行時空插值以匹配AHI觀測。經過時空匹配和云檢測處理,最終形成21156組樣本。為分析GFS PWV預報場對反演模型的影響,將建立2個模型,模型1是基于全部預測因子的NN模型;模型2則為未包含GFS PWV的NN模型。針對2個模型均隨機選擇一半數據作為訓練數據,余下的數據作為驗證數據集。
為驗證方法的可靠性和評價結果的質量,使用相關系數(R)、均方根誤差(RMSE)和偏差(Bias)3個統計指標:
其中,PWVNN和PWVGPS分別是神經網絡模型反演和GPS站點的和分別是神經網絡模型反演和GPS站點的PWV平均值,N是數據樣本總數。
圖3給出了模型1和2反演結果與GPS PWV的二維直方分布圖。兩模型反演值與GPS PWV數據的相關系數大于0.94,RMSE小于1.52 mm,這意味兩個模型均能有效反演PWV。模型1的PWV數據比模型2更集中于1∶1線,這說明模型1估算值與GPS PWV吻合度更高。模型 1的 R、RMSE和 Bias分別為0.957、1.33 mm和-0.004 mm,模型2則分別為0.943、1.52 mm和0.01 mm。模型1和2輸入數據的差異是有無GFS PWV,這意味著引入GFS PWV預報場數據可以提高PWV反演精度。
圖4為兩個模型PWV反演誤差(反演值-GPS PWV)直方分布圖,兩模型誤差均呈現正態分布,絕大部分誤差在±4.0 mm以內(>97.3%樣本)。模型1和2的PWV反演誤差小于2.0 mm的數據點分別占90.75%和87.51%,誤差小于1.0 mm的數據點則分別為72.1%和67.1%。Lee等[27]利用AHI多通道亮溫、經緯度和觀測角數據,基于機器學習模型估算了東北亞地區的PWV。模型加入了更多與水汽相關的影響因子(比如海拔高度、時間信息和PWV預報場),因此展現了與GPS PWV的更好的吻合度。
通常情況下,衛星反演PWV的精度會受大氣含水量、海拔高度、經緯度和地表類型等多種因素影響,進而呈現一定的時空分布特征。為進一步分析本文模型的精度,逐個站點評估了PWV反演的精度。圖5給出了模型1和2的R和RMSE空間分布圖。總體而言,兩個模型在大部分站點均有較好的表現,RMSE主要在0.5~2.5 mm,相關系數主要在0.9~0.98。相比之下,由于引入了GFS PWV預報場,模型1在各站點均比模型2精度好,展現了較高的R和較小的RMSE。值得注意的是,也存在個別站點誤差偏大,RMSE可達3.0 mm,這可能跟云污染或訓練樣本代表性有限有關。
此外,對模型誤差的季節變化特征進行分析。圖6給出了模型的月平均相關系數、均方根誤差和偏差的時間序列。兩個模型的月平均RMSE和R展現了相似的季節變化特征。模型RMSE均從1月1.0 mm開始上升,7月達到最大值3.0 mm,然后又逐漸下降。整體來說,夏季呈現出較大的RMSE,冬季RMSE較小。RMSE趨勢跟PWV的季節變化特征相似,意味著水汽含量數值對RMSE有明顯影響,這與之前的研究結果是一致的[7,23]。冬季模型的相關系數低于其他季節,這可能跟冬季PWV動態變化范圍小有關。兩模型的月平均偏差小于0.25 mm,說明沒有明顯的高估或者低估。
總體而言,神經網絡模型反演結果與GPS PWV吻合度較好,具體表現在較高的相關系數、較低的均方根誤差和平均偏差,說明該算法可以有效反演青藏高原PWV。
神經網絡建模時使用了GPS站點數據。當有GPS PWV參考數據可用時,推薦使用模型1進行PWV的反演。沒有GPS PWV可用時,構建模型1將變得非常困難。此時,可以使用模型2進行PWV反演。具體操作如下:(1)收集研究區域有代表性的地表、大氣廓線數據(如月平均的同化模型數據);(2)利用輻射傳輸模型(如MODTRAN或者RTTOV)模擬衛星觀測的多通道亮溫;(3)基于模擬的多通道亮溫、大氣廓線積分的PWV以及模擬計算的輸入各種輔助參數,構建PWV神經網絡反演模型。模型2精度略差于模型1,其優點是在無GPS PWV數據可用時,可以通過模擬數據來構建模型。
新一代靜止氣象衛星為高時空分辨率PWV探測提供了良好的機遇。利用Himawari-8 AHI多通道紅外亮溫、GFS PWV預報場和其他輔助數據,基于神經網絡技術構建了適用于青藏高原低水汽環境下的PWV快速反演方法。引入水汽吸收通道和GFS PWV預報場,可以有效提高低水汽情況下的PWV反演精度。基于GPS PWV數據的驗證結果表明,反演的PWV的R和RMSE分別為0.957和1.33 mm,這意味著模型能夠提供青藏高原較高精度的PWV。此外,由于反演過程不需要輻射傳輸計算,因此算法速度遠高于物理反演算法,適合于實時的PWV反演。
分析了模型誤差的時空變化特征,大部分站點RMSE誤差小于2.0 mm,說明算法表現較穩定可靠。模型RMSE和R展現了一定的季節變化特征,RMSE夏季誤差大于冬季,與大氣水汽含量變化展現了相似的變化趨勢。冬季R小于其他季節,這可能跟冬季PWV動態范圍小有關。僅利用青藏高原地區32個臺站數據進行建模,沒有進行基于無線電氣象探空的PWV數據的驗證、對比,在其他地區的適用于性有待于進一步驗證。FY-4A/B的星載成像儀與AHI通道配置相近,算法也適用于FY-4A/B數據。