張利敏,楊明祥,王 浩
(1.北京工業大學建筑工程學院, 北京 100124; 2.中國水利水電科學研究院 流域水循環模擬與調控國家重點實驗室, 北京 100038)
降水是水循環最重要的環節之一,也是水文模型的重要輸入組成部分[1]。由于站點稀少、時空分布不均或觀測時間的非連續性等問題,水文氣象數據的稀缺性一直是水文建模中的一大問題,這很大程度上制約了研究工作的開展。借助再分析氣象數據來驅動模型進行模擬是一種可選方案[2]。再分析數據是基于氣候模式和衛星遙感數據源而開發的,具有不間斷區域覆蓋、高時空分辨率等優點,是水文模擬和其他應用的潛在替代氣象數據源[3,4]。目前應用比較廣泛的再分析降水產品有:美國國家環境預報中心(NCEP)氣候再分析資料(CFSR)[5](1979-2014-07,~38 km)、美國國家航空航天局(NASA)的氣候再分析資料(MERRA)(1979-2012,~50 km)[6]、歐洲中期天氣預報中心(ECMWF)發布的ERA-Interim(1979-2012,~82 km)[7]以及日本氣象廳(JMA)的JRA-55(1958-2012,~60 km)[8]等再分析資料。近年來,覆蓋東亞地區的再分析數據CMADS(China Meteorological Assimilation Driving Datasets for the SWAT Model,Version 1.1, 2008-2016,~30 km)成為研究的熱點,由于其擁有較高的空間分辨率,可為解決東亞地區氣象站點資料匱乏問題提供可選方案。
由于再分析數據所使用的數值模式、數據同化技術和數據源方面存在很大的不確定性,因此,在應用于特定區域之前,有必要對再分析數據質量和性能進行評估。DILE等[9]在青尼羅河上游構建SWAT模型以評估CFSR數據的質量,結果表明整體上實測氣象數據模擬的徑流結果好于CFSR的模擬結果,但是CFSR在實測數據匱乏的地區也可能是一個有價值的選擇。田霖等[10]在干旱山區的研究表明CFSR數據與觀測數據偏差較大,導致徑流的模擬值與實測值相對偏差大于40%。QUADRO等[11]觀察到3種產品(CFSR、MERRA和NCEP-2)的降水模式與南美洲大部分地區的觀測降水基本一致,并且CFSR降水顯示出最小的偏差。目前CMADS數據集已在軍塘湖、青藏高原、黑河、金沙江以及韓國的漢江等流域和地區進行了檢驗和評估[12-14]。例如,孟現勇等[15]在黑河流域分別用CFSR、CMADS和傳統站驅動SWAT模型,并對徑流模擬結果進行對比分析,總體上,CMADS的模擬結果優于CFSR和傳統站。GUO等在中國漓江流域做了CMADS、TMPA-3B42V7和傳統觀測站的精度對比,發現CMADS和傳統觀測站的相關性比TMPA-3B42V7高,徑流模擬精度可靠[16]。對再分析資料進行檢驗和評估工作,有助于改進和提高數據的性能[17],緩解水文建模對氣象數據稀缺性的難題。與此同時,準確的氣象數據對于區域及全球的水資源管理、水文過程模擬、防災減災等方面起著至關重要的作用[18]。
水文模型已被廣泛應用于水資源評價與開發利用、水旱災害防治、水生態環境保護、氣候變化及人類活動對水資源數量和質量的影響分析等研究。SWAT模型是一個具有較強物理基礎的分布式水文模型,以日為時間步長,多用于模擬和預測較長時間序列內大中流域尺度上不同土壤、土地利用與管理方式下的水量、泥沙、營養物質和殺蟲劑運移的變化[19]。目前,SWAT模型在全球的不同國家和地區、不同流域尺度廣泛應用[20-22]。根據XU等[23]的研究表明,當雨量站密度在每1 000 km21.0~1.4時,水文模型的表現可接受且相對穩定。本文選取全球應用較廣泛的NCEP第3代(最新)再分析數據CFSR以及覆蓋東亞地區較新CMADS數據進行比較,2者均擁有較高的空間分辨率,且獲取方便,數據格式均可直接用于SWAT模型。本文的研究目的是比較再分析數據CFSR、CMADS和實測站點數據(OBS)的降水在渾河流域的空間分布(多年平均降水量)和年內分配(1-12月多年平均降水量)情況,然后用CFSR、CMADS和OBS分別驅動SWAT模型(即CFSR+SWAT、CMADS+SWAT和OBS+SWAT)對3種降水數據在渾河流域徑流模擬的適用性進行評估。
渾河流域位于遼寧省東北部,河流發源于清源縣內。本文選取的是沈陽水文站上游,流域面積7 919 km2,地理位置為東經123°22′~125°17′,北緯 41°29′~42°16′(如圖1所示),占整個渾河流域總面積(11 481 km2)的69%。最高海拔約1 200 m,地勢東高西低,由山地、丘陵和平原組成。多年平均降水量771.8 mm(統計時段為1959-2013年),大多集中在6-9月,約占全年降水量的70%~80%。流域上游是大伙房水庫水源保護區,植被覆蓋率高,下游是平原,坐落著沈陽和撫順2大城市。

圖1 研究區概況Fig.1 Overview of the study area
利用已知站點的氣象要素數據,通過一定的空間插值方法來估算非站點的氣象要素數據是獲取連續空間上氣象要素數據的重要途徑。國內外常用的氣象插值方法有克里金方法(Kriging)、反距離加權法(Inverse Distance Weighted)、多項式插值法(Polynomial Interpolation)和樣條函數法(Spline)等。克里金方法、反距離權重法、多項式插值法等方法在站點分布密度大及地勢平坦的地區可以取得較好的插值效果,而對于地形復雜且站點匱乏的地區,這些插值方法的插值效果往往不理想[24,25]。而樣條法可以不受空間尺度影響,不要求空間平穩,利用光滑參數來優化平衡數據逼真度和擬合光滑曲面[26]。HARTKAMP等[27]研究了在大區域內插值氣象數據的統計方法,考慮到數值誤差預測、數據結構和計算簡單性,建議使用樣條法插值氣候變量。澳大利亞學者HUTCHINSON在總結前人研究的基礎上,基于普通薄盤樣條(Thin plate spline, TPS)和局部薄盤樣條插值理論編寫了針對氣候數據曲面擬合的專用插值軟件(Australian National University spline interpolation,ANUSPLIN)[28]。局部薄盤光滑樣條法是對薄板光滑樣條原型的擴展,除了通常的樣條自變量外還允許引入線性協變量子模型,根據最佳擬合效果自動確定模型系數,而且可以同時進行多個表面的空間插值,這很適合時間序列的氣象數據的空間插值[26,29]。局部薄盤光滑樣條的理論統計模型表述如下:
zi=f(xi)+bTyi+ei(i=1,…,N)
(1)
式中:zi表示空間i點的因變量(例如,降水、溫度等);xi表示d維樣條獨立變量矢量;f是要估算的關于xi的未知光滑函數;yi為獨立協變量;bT為yi的系數;bTyi為局部薄盤樣條函數;ei為自變量的隨機誤差;N為觀測點個數。
關于模型更多的信息可查看閻洪[26]、劉志紅[29]等的研究。
SWAT模型是上世紀90年代由美國農業部(USDA)的農業研究中心開發的一種用于流域管理的水文模型,在世界范圍內得到廣泛應用。SWAT模型所需要的主要輸入數據有數字高程模型(DEM)、土地利用數據、土壤數據、氣象數據等。DEM數據來自于國際農業研究協商小組空間信息協會(CGIAR-CSI)(http://srtm.csi.cgiar.org/srtmdata/),分辨率為 90 m × 90 m。基于DEM對研究區進行子流域劃分,并用實測河網對生成的數字河網進行校正。流域中用于表征下墊面特征的土地利用數據GLC2000[30]和土壤數據HWSD[31]均來自于寒區旱區科學數據中心(http:∥westdc.westgis.ac.cn),空間分辨率為1 km,用SPAW軟件計算模型所需的土壤參數。SWAT模型將子流域中同類型的土壤、土地利用和坡度視的組合視為一個水文響應單元(Hydrologic Research Unit, HRU),HRU是模型計算的最小單元,每一個HRU獨立計算,最后演算匯總至流域出口。
氣象再分析數據CMADS以中國國家氣象局的CLDAS驅動場要素為原始數據,通過數據循環嵌套、重采樣和雙線性插值等多種技術手段而建立。CMADS1.1數據集通過官網(http://www.cmads.org)獲取,空間分辨率為0.25°×0.25°,時間為2008-2016年。CFSR 再分析數據是NCEP利用全球預報系統(Global Forecast System)反演的全球再分析數據產品,耦合了大氣-海洋-陸地-海冰模式,空間分辨率為0.312°×0.312°。該數據可從SWAT官網(https:∥globalweather.tamu.edu/)獲取,包括:降水、最高/低溫度、相對濕度、太陽輻射和風速等要素,時間為1979-2014年7月。包括流域內及周邊的74個實測站點的氣象數據(OBS)(1959-2014年)來自中國國家氣象局。模型所需輸入的氣象要素(均為日尺度)包括降水量、最高最低溫度、相對濕度、太陽輻射和風速,選取3種數據共同的時間段2008-2013年用于模型參數的率定和驗證,其中2008-2010設為率定期,2011-2013年設為驗證期。
首先用ANUSPLIN軟件將再分析數據CMADS和CFSR的降水量插值到實測站點位置,以相關系數(r)、相對誤差(RE)、均方根誤差(RMSE)和標準差比(STDration)來初步判斷再分析數據的可靠性,同時比較2種再分析數據與實測數據的年均降水量空間插值分布。然后,分別用CFSR、CMADS再分析數據和流域內的4個實測站點數據驅動SWAT模型模擬渾河流域的徑流,以納什系數(NSE)和確定性系數(R2) 2個指標評價CFSR、CMADS和OBS在渾河流域的適用性。相關公式如下。
相關系數:
(2)
相對誤差:
(3)
均方根誤差:
1997年10月,國際炒家首次沖擊了香港金融市場,10月21日、22日香港恒生指數連續兩天大幅下挫9%,累計跌幅近1200點;23日,恒生指數報收于10426.3點,跌幅超過10%。
(4)
標準差比值:
(5)
Nash系數:
(6)
決定系數:
(7)

2.1.1 多年平均降水空間分布
研究區再分析數據CMADS、CFSR和OBS多年平均降水量(2008-2013,下同)的空間分布如圖2所示。從圖2中可以看出:3種氣象數據降水量的年均空間分布趨勢基本一致,受大氣環流和海洋水汽的影響,上游的降水量較為充沛,尤其是在流域的東南部(清源縣)。就年均降水總量而言,相對于OBS,CMADS存在低估,而CFSR存在高估。原因將在下一部分進行分析。但是,在不考慮年均降水量的情況下,CMADS與OBS的降水空間分布趨勢一致性更好。

圖2 CMADS、CFSR和OBS多年平均降水的空間插值結果Fig.2 Spatial interpolation results of annual mean precipitation of CMADS, CFSR and OBS
2.1.2 降水年內分配

圖3 研究區4個站點處3種降水數據年內分配Fig.3 Annual distribution map of the three precipitation data at four stations in the study area

表1 研究區4個站點處CMADS和CFSR降水的評價指標Tab.1 Evaluation indexes of CMADS and CFSR precipitation at four stations in the study area
CMADS以CMORPH衛星降水產品為背景場,而由于地表反射率的干擾[32],對4 mm以下的降水判定較為困難[33],這可能導致了CMORPH降水產品在中國地區的降水量總體相對偏低[34]。另一方面,渾河流域的降雪期一般是從10月份下旬至次年的3月下旬,降水量偏少。相較于在夏季,觀測取樣誤差、測量儀器誤差等因素在冬季計算降水量過程中的權重增大。CFSR數據存在高估多年平均降水量在很多研究中也得到了證明。高瑞等[35]在新疆喀什流域的研究結果表明,CFSR多年平均降水量嚴重偏大,且最小相對誤差為7.1%(9月),最大相對誤差為126%(3月)。在開都河流域表現出低估強降水和高估弱降水的特征[10]。根據LIU等[36]的研究,與氣象站點實測值相比,在青藏高原地區,CFSR的降水插值結果比CMADS差,表現出各月131個站點的平均降水量均大于OBS,相對誤差達到76%,其中77%的站點降水量表現出高估。而CMADS的降水插值相對誤差是8%,其中56%的站點表現為高估。
從對2種再分析數據的插值結果表明,再分析數據CMADS和CFSR與OBS相比,雖然CMADS對年均降水量在時間和空間分布存在低估,但是從各項指標的整體來看,CMADS要優于CFSR。
在2.1部分比較了再分析數據在研究區的年均降水量空間分布,以及實測站點處的多年平均降水量的年內分配。在這一部分將用CMADS、CFSR和OBS分別驅動SWAT模型來模擬徑流,并比較月徑流的模擬精度,以此來檢驗再分析數據在東北渾河流域的適用性。
在SWAT工程中,渾河流域一共被劃分為34個子流域和317個HRU,分別用3種氣象數據驅動SWAT模型,再利用SWAT-CUP工具對研究區參數進行率定和驗證。在研究區上游水文站(北口前)和流域出口控制站(沈陽)的徑流模擬結果如圖4所示,模型評價指標如表2所示。CMADS+SWAT(OBS+SWAT)模式率定期和驗證期的NSE范圍為0.54~0.94(0.63~0.93),R2范圍為0.73~0.97(0.78~0.95),即根據MORIASI等[37]的評價標準,CMADS和OBS驅動SWAT模型在2站的率定期和北口前水文站的驗證期都取得了非常好的效果,在沈陽站的驗證結果令人滿意。CFSR+SWAT模式在2站的率定期取得了比較好的效果(NSE和R2范圍為0.78~0.85),而在驗證期的模擬效果很差(NSE:-0.07~0.47;R2:0.39~0.5)。

表2 月徑流模擬評價指標Tab.2 The evaluation indexes for monthly runoff simulation
從徑流模擬圖圖4中可以看出,最大徑流值基本都在8月份,這與降水量在流域的年內分配(圖3)是一致的。CMADS+SWAT模式和OBS+SWAT模式模擬的徑流變化與實測徑流基本一致,而CFSR+SWAT模式徑流模擬在各年的8月份有時低估有時高估,這一現象在2012和2013年對徑流峰值的模擬結果中最為明顯。通過對比流域內CFSR和OBS在8月份的多站月平均降水量,發現CFSR數據在2012年高估實測降水約39.9 mm(+16.5%),而在2013年嚴重低估實測降水約95 mm(-33.7%)。經查找資料發現,被低估的2013年8月強降水引發了50 a一遇大洪水。此外,2010年是豐水年,8月份累積降水量較大,也發生了大洪水,但降水強度相對2013年較弱,該月CFSR低估實測降水約91 mm(-23.4%)。由于CFSR對強降水的低估,導致多年平均降水量在8月份低于實測降水量(圖3),所以模擬的徑流峰值被低估(圖4),在驗證期,CFSR+SWAT模式的徑流模擬效果很差。相反,在同一時期,CMADS+SWAT和OBS+SWAT模式徑流模擬結果較好,且模擬結果相近。站點的數量和站點空間分布的均勻性是影響水文模擬的2個重要方面。根據XU等[23]的研究表明,在水文模擬中雨量站密度最好為每1 000 km21.0~1.4。本研究中渾河流域實測站密度約為每1 000 km20.5,但是OBS+SWAT模式還是取得了比較好的結果。原因可能是渾河流域是一個上游寬下游窄的形狀,上游區的2大支流各有一個氣象站點,中游和下游各有一個,即氣象站點在渾河流域分布相對均勻,能夠反映出流域的降水情況,彌補了站點數量的不足。

圖4 水文站點處在率定期(2008-2010)和驗證期(2011-2013)月徑流的實測值與SWAT模型模擬值Fig. 4 Observed monthly runoff and SWAT model simulations at the hydrological stations during the calibration period (2008-2010) and validation period (2011-2013)
通過比較CMADS、CFSR和OBS降水數據在渾河流域空間上的年均降水分布和年內雨量分配評估結果,以及3種氣象數據驅動的SWAT模型徑流的模擬結果得結論如下。
(1)從3種降水數據(CMADS、CFSR和OBS)的多年降水量空間分布上而言,CMADS再分析數據的降水分布與OBS一致性更高。但是,從年均降水總量而言,CMADS存在低估,CFSR則存在高估。從統計的指標來看,CMADS數據與OBS的相關性更強,均方根誤差更小,標準差比值接近于1。相比于CFSR,CMADS的數據質量更好。
(2)整體來說,CMADS和OBS驅動的SWAT模型模擬的結果取得了非常好的效果,且模擬的月徑流過程較為一致。而CFSR由于對降水量存在高估弱降水和低估強降水的現象,僅在率定期取得了滿意的結果,而在驗證期由于其對強降水的嚴重低估,導致模型模擬結果很差。
(3)從統計分析的結果以及SWAT模型模擬的結果來看,在渾河流域CMADS再分析數據的質量遠高于CFSR。
(4)再分析數據是通過間接方式獲得的氣象數據,由于各再分析數據可能使用的數據來源、處理算法的差異等因素,造成在不同區域的適用性相差很大,因此在使用再分析數據之前,應該首先對其在該區域的適用性進行評價。