王文川,韓東陽,馬明衛,2
(1.華北水利水電大學水利學院,河南 鄭州 450046;2.河海大學水文水資源與水利工程科學國家重點實驗室,江蘇 南京 210098)
干旱作為全球最為常見的自然災害之一,已經對人類的生存環境造成了嚴重的影響。土地荒漠化進程加劇、生態系統日漸脆弱、水資源短缺等問題都是干旱的重要表現。目前,研究中較常涉及的干旱類型包括氣象干旱、農業干旱和水文干旱。氣象干旱大多以降水量作為指標,土壤含水量通常作為衡量農業干旱的重要依據,而水文干旱的主要表現則是河川徑流量持續偏少。據測算,全球不同地區每年因干旱造成的經濟損失高達60億~80億美元,已成為最嚴重的氣象災害之一[1]。國內外眾多學者對干旱和干旱指標做了大量研究,但由于地理位置差異,氣象條件不同以及人類活動的影響,干旱指標往往差異很大。正因如此,諸如降水Z指數,降水距平百分率,標準化降水指數(Standardized Precipitation Index,SPI),標準化流量指數(Standardized Flow Index,SFI),帕爾默干旱強度指數PDSI等一系列干旱指標先后被提出和應用。其中,標準化流量指數SFI采用Γ分布概率來描述徑流量的變化,其計算過程簡單,能較好地反映不同時段的水文干旱狀況。本文選取SFI指數作為干旱分析指標,基于渭河流域交口河水文站1952—2016年的逐月實測徑流系列定量評估北洛河的歷史水文干旱演變特征。研究結果能夠揭示研究區河川徑流豐枯變化的概率統計特性,對監控區域水文干旱情勢以及應對干旱的水資源配置具有現實意義。
Boostrap方法是一種增廣樣本的統計推斷方法,最早由美國斯坦福大學Efron[2]教授提出。經過幾十年的發展,這種統計推斷方法已被應用到各種領域[3- 5],以Bootstrap為主題的研究及應用成果不計其數[6- 7]?,F對Bootstrap方法的基本原理簡單描述如下:
假設給定的觀察樣本便是總體,總體的分布是未知的。在總體中隨機有放回的抽取樣本,由此得到的新樣本稱為自助樣本。通過對總體的重復采樣,對每一個自助樣本計算均值、方差等參數的估計值,根據相應估計參數的分布直方圖,就可得到由Bootstrap方法估計參數的經驗分布,一般假設為正態分布[8]。利用這些信息估計總體的分布參數,從而獲得觀察樣本的分布函數統計參數,并計算出相應的均值,方差等估計參數。

圖1 1952—2016不同分布函數SFI時序分布圖
Bootstrap的優點在于僅基于觀測樣本進行再抽樣,不需要對總體分布進行假設。借助Bootstrap抽樣,可以定量估算由于數據長度限制可能引起的分布參數估計的不確定性。
基于Bootstrap抽樣的標準化流量指數SFI具體計算步驟如下[9]:



(5)將分布函數F標準正態化,得到某年的SFI。具體計算步驟見參考文獻[10]。
此外,本文分別采用標準Bootstrap、百分位數Bootstrap、t百分位數Bootstrap三種抽樣方法進行比較分析,其核心思想都是通過對樣本重復隨機抽樣獲得再生樣本,分別求得標準正態分布下、百分位數下、t百分位數下再生樣本均值的置信區間。具體計算步驟見參考文獻[11]。以期在假設流量序列服從伽馬分布下利用Bootstrap方法估計形狀參數α和尺度參數β。以更好的控制分布線型形狀,提高標準化流量指數的計算精度。
北洛河是渭河最大的支流,黃河二級支流,也是陜西省內最長的河流。交口河水文站建于1952年,是北洛河中游干流控制站,位于洛川縣交口河鎮,地處東經109°21’,北緯35°39’,集水面積17180km2,屬于大陸性季風氣候,春季秋季雨少干旱,夏季多暴雨雷雨天氣,為年內的主要降雨時段。因此,該地區干旱與洪澇交替的特征顯著。
標準化流量指數(SFI)的計算核心是將流量序列用以合適的概率分布函數進行擬合。采用不同的概率分布函數擬合流量序列可得到不同的SFI值,本文采用伽馬分布,對數正態分布,正態分布三種分布函數分別擬合流量序列得到不同分布的SFI值。以伽馬分布擬合計算得到的SFI值為例,與另外兩種分布擬合結果進行對比分析,做SFI時序分布圖,如圖1所示。結果顯示,伽馬分布和對數正態分布在Bootstrap抽樣中得到的SFI值基本趨于一致,且在旱澇趨勢識別上結果呈現較高的一致性。基于正態分布計算的SFI存在汛期高估,非汛期低估的現象。導致這樣的結果可能是由于分布線型的不確定性引起的。伽馬分布和正態分布計算的SFI值更接近合理范圍。本文使用伽馬分布計算SFI。

表1 交口河水文站1月和11月流量期望值Bootstrap區間估計
選取渭河流域北洛河中游干流控制站交口河水文站65a(1952—2016年)的實測逐月流量資料為樣本。以1月和11月的流量系列為例,對每一個月流量系列抽取N=1000個Bootstrap樣本,對每一個Bootstrap再生樣本,分別取樣本容量n=65、75、85。分別采用標準Bootstrap方法、百分位數Bootstrap方法、t百分位數Bootstrap方法估算流量期望值5%置信水平下的置信區間[12],區間寬度越大,抽樣不確定性也越大[13]。計算結果見表1。
比較分析三種方法計算出來的區間寬度,在樣本容量n相同的情況下,利用百分位數Bootstrap方法較其他兩種方法計算結果區間寬度最小,精度最高。標準Bootstrap方法計算出來的區間寬度最大,表明其抽樣的不確定性大。對同一個月流量系列,樣本容量增大,區間寬度呈減小趨勢。由此可得,利用百分位數Bootstrap方法進行抽樣分析,其計算結果較其他兩種方法更好一些,抽樣不確定性更小一些,由此方法估計均值、方差等參數的準確度更高。因此,推薦使用百分位數Bootstrap方法估計樣本的均值、方差。假設樣本流量序列服從伽馬分布[14],由估計出的樣本均值和方差反推伽馬分布的狀參數α和尺度參數β。由此計算標準化流量指數,可以減小抽樣方法對計算標準化流量指數的不確定性。


表2 SFI干旱等級劃分標準
對交口河水文站65年流量資料進行SFI計算,劃分干旱等級。計算結果如圖2所示。自1952年建站以來到2016年,交口河水文站控制的區域干旱多發生于1—2月。其中1953年發生連續4個月的持續性干旱,隨后僅在1958年的1月2月和1961年的1月發生短期嚴重干旱,其余時間里鮮有重旱發生。1977年到2016年40年時間里,交口河水文站控制的區域整體是趨于無旱的。僅2005年12月,SFI值為-1.54,劃分為重旱等級,但于下年1月2月河道流量逐漸增大,及時補充水資源量,干旱程度有所緩解。在非汛期,偶爾會有流量偏小情況,但持續時間短,對下游影響較小,可忽略其干旱影響。

圖2 1952—2016年不同月份SFI時序分布圖

圖3 2014—2016年SFI時序分布圖
以2014—2016年為例,選用95%置信度下流量序列Bootstrap樣本均值的不確定性范圍,即以再抽樣樣本均值排序的2.5%和97.5%兩個分位點的區間數值作為月平均流量的不確定性范圍,如圖3所示。由圖3可得不確定性范圍的大小與月平均流量密切相關,月平均流量越大,不確定性范圍越大,不確定性范圍小的地方流量也越小。圖中有21個觀測值都在不確定性范圍內,占所有觀測值的58.3%,計算結果屬可接受范圍。但并不是所有的觀測值都在不確定范圍內,表明標準化流量指數不能完全的表示出控制區域的干旱程度。這一方面與研究區域的天然河道流量不確定性有一定關系,即同一月份不同年份的月平均流量可能相差很大。另一方面,伽馬分布線型也會對標準化流量指數的計算結果有一定的影響,形狀參數α和尺度參數β的估計值間接影響著干旱等級的評定。
Bootstrap方法可以在總體分布未知的情況下,以有限的樣本通過有放回的抽樣,定量計算由數據長度的限制引起的抽樣不確定性,發現數據長度越長,抽樣不確定性越小。以標準Bootstrap、百分位數Bootstrap、t百分位數Bootstrap方法估計流量期望值得置信區間,定量評價了抽樣方法的不確定性。區間寬度越窄,對SFI的估計越穩定。
由于影響水文干旱的因素眾多,本次研究只考慮流量因素,氣候因素和人類活動等因素都未考慮在內,對于干旱評估比較單一。序列的非平穩性以及不同時間尺度的滑動月平均流量累積序列都有可能影響SFI的不確定性,這些問題都有待進一步研究。