李 俊,武鵬林(太原理工大學水利科學與工程學院,太原 030024)
在汛期分期的基礎上,制定各分期的汛限水位,以制定汛期內各個時期調度方案,使水庫汛后的蓄滿率得到提升,是實現洪水資源化的重要手段,更可以進一步使防洪與興利相結合,增加水庫的效益。
傳統的汛期分期方法有數理統計法,模糊集合分析法等[1],他們具有考慮因素單一、主觀性強的缺點,而Fisher最優分割法在綜合考慮多個因子的作用的同時又能保持樣本的時序性,并能夠確定最優分類數目[2],因此Fisher相對傳統方法具有一定的優越性。考慮到各指標對樣本的重要程度不同,把各個指標的權重通過主成分分析法計算出來,改進Fisher最優分割法,使其能夠更加合理地考慮汛期分期的各個影響因子的重要程度,從而獲得一個更加符合實際的分期結果。以吳城水庫為例,本文使用該改進的方法對吳城水庫汛期進行劃分,并與模糊集合分析法[3]進行比較。
由于汛期分期是多指標的有序聚類分析,而各指標對樣本分類的重要程度不同,因此首先采用主成分分析法計算各指標權重。
構造樣本陣X:
式中:xij為第i個樣本中第j個指標的值。
對樣本陣X做標準化,變為標準化陣Y:
由于汛期分期中各指標特征值為適度指標,因此采用下式對樣本陣X進行標準化[4]:
(1)

標準矩陣Y的相關系數矩陣的計算:
(2)

主成分Fi的貢獻率為:
(3)
累計貢獻率為:
(4)
當λk對應的累計貢獻率大于或等于85%時,則其有k(k≤m)個與λ1,λ2,…,λk對應的主成分。
主成分載荷反映主成分Fi和各指標之間的相關程度,各指標在各主成分Fi(i=1,2,…,k)上的載荷lij為:
(5)
通過(5)式得到lij,接著通過(6)式得到各主成分的線性模型:
Fi=e1iX1+e2iX2+…+emiXm(i=1,2,…,k)
(6)
這樣,綜合得分模型為[5]:
其中,ai反映了各指標變量在主成分中的綜合重要度。
由此,得各指標變量的權重為:
(8)
Fisher最優分割法作為對有序時間樣本序列進行聚類劃分的方法,其分期依據是使樣本總離差平方和最小,并以類內部差異最小,類間差異最大為原則。汛期分期屬于聚類分析,而聚類分析又分為有序樣本聚類分析與非有序樣本聚類分析,Fisher最優分割法作為有序樣本的聚類方法,其最優解是使分成各組總的離差平方和最小,而所有可能的分類中都保持了樣本的時間連續性(換而言之,如果有一種分類破壞了樣本的時間連續性,即使其總的離差平方和再小,這些組合在Fisher分割法中也是不予以考慮的),正是這種特性使得Fisher最優分割法能夠保持樣本的時間連續性。
在有序樣本{X1,X2,…,Xn}中,每一個樣本都對應m項指標,則可得以下矩陣X(xij為第i個樣本的第j項指標的指標值):
為了消除物理尺寸的影響,對數據進行以下轉化:
(9)
式中:x′ij為標準化后的數量值;xmax,,j為第j列的最大值。
同時根據各個指標的權重,加權平均后得到向量Y,并以Y為基礎數據進行汛期分期,Y可由下式求得:
(10)

(11)
設D(i,j)表示Q的直徑,則可以通過下式計算出D(i,j):
(12)
設將n個有序時間數據分為k類,則定義I(n,k)為其中一種分法,其可由下式進行計算:
(13)
根據Fisher分割法的劃分原則,可得出當I(n,k)最小時對應的分法可以滿足Fisher的劃分原則,所以可以通過下式定義目標函數:
I*(n,k)=minI(n,k)
(14)
有以下定理:有序時間數據樣本的最優k類分割,必須由最佳的k-1類分割在其某一個截尾子部分添加一個類組成。
遞推公式表達為:
k=2時,
(15)
k>2時,
(16)
如果要把有序時間序列分成k類,先找出分割點ik,使得由遞推公式計算出的I*(n,k)最小,則{yik,yik+1,…,yn}為第k類,然后再找分割點ik-1,使得I*(ik-1,k-1)最小,則同樣可得第k-1類,即{yik-1,yik-1+1,…,yik-1},依照同樣的方法可以找出所有最優分類點。
通常I*(ik,k)~k曲線的拐點處對應的k為最優分段數,即最優分類數,或者計算:
γ(k)=|I*(n,k)-I*(n,k-1)|
(17)
后與k繪制γ(k)~k曲線, 最大所對應的k也是最優分段數。
吳城水庫位于中陽縣的東川河上,流域屬半干旱地區,氣候特征為:干旱少雨,氣候寒冷,降雨集中于7-9月。多年平均降水量為472 mm,時間和空間上分配不均勻,各年雨量差異大,全年降水量的70%都來自汛期。
本文的基本資料為吳城水庫1955-2007年(2001-2005 年未測)48 a的逐日降雨資料。研究的時間域為既定的6-9月,以旬為基本單位,在吳城水庫控制流域內,選取能體現汛期的暴雨洪水變化規律的4個影響因子:多年旬平均降雨量、多年旬平均最大3 d雨量、多年大雨天數(降雨大于25 mm為大雨)、多年旬平均Cv值。
為了消除各指標物理尺度的影響,因此根據式(1)對樣本指標進行處理,然后用SPSS軟件對標準化的樣本數據進行主成分分析,經分析可得表1及表2。
由表1可知,主成分1和2特征累積方差貢獻率達到85.756%,超過85%。因此,前兩個主成分能反映各項指標的絕大部分信息。

表1 解釋的總方差Tab.1 Total variance explained

表2 成分矩陣Tab.2 Component matrix
根據式(5)可以得出樣本各指標在主成分線性組合中的系數,再由(6)、(7)得到綜合得分模型為:
F=0.373ω1+0.382ω2+0.421ω3+0.354ω4
(18)
根據式(8)求得各指標的權重為ω=(ω1,ω2,ω3,ω4)=(0.232,0.275,0.250,0.243)。
將求得的各指標權重系數代入式(10),求得向量Y,由式(11)和式(12)計算各種組合的類直徑,計算結果如表3所示。

表3 各類分段直徑D(i,j)Tab.3 The diameter of all kinds of section D(i,j)
目標函數I*(n,k) 通過式(15)和式(16)求得,計算結果見表4。
由式(17)計算出γ(k),然后分別繪制I*(ik,k)~k、γ(k)~k曲線,分別見圖1、圖2。
由圖1得,曲線在k=3處出現拐點,以此同時k=3時,γ(k)最大,所以分三類最優,由表4查得3個分類分別為1-3月,4-9月,10-12月,即6月1日-6月30日為前汛期,7月1日-8月31日為主汛期,9月1號-9月30日為后汛期。
本文采用模糊集合分析法[6]對吳城水庫的汛期進行模糊分析,同時算出吳城水庫汛期模糊集合的隸屬度,見表5。
如果以隸屬度大于0.5對應的時間作為汛期的話,由表5

表4 分類目標函數I*(n, k)計算結果Tab.4 The calculation results of objective function I*(n, k)
注:斜線后的數字為當前分類情況下,第k類的與第k-1類的分割點ik。

圖1 I*(ik,k)~k關系圖Fig.1 The relation between I*(ik,k) and k

圖2 γ(k)~(k)關系圖Fig.2 The relation between γ(k) and k

表5 吳城水庫汛期經驗隸屬度Tab.5 Flood experience membership of Wucheng Reservoir
可以得到以下分期結果:
前汛期:6月1日至7月1日;主汛期:7月2日至9月3日;后汛期:9月4日至9月30日。為了便于比較把兩種方法的分期結果見表6。

表6 結果比較表Tab.6 Results of comparison
從以上的分析可以看出兩種方法的劃分結果一致,都能很好地反映出吳城水庫的暴雨洪水變化特點。但是模糊集合分析法在閾值選取方面多數依靠經驗選取,主觀性強,相對而言Fisher最優分割法比較客觀,因此說明了Fisher最優分割法可信,符合實際。
為了克服以往把各指標的權重看作相等的不足,本文利用主成分分析法計算各項指標權重以改進Fisher最優分割法,利用該改進的Fisher最優分割法對吳城水庫控制流域進行汛期分期,并與模糊集合分析法的結果進行比較。通過分析我們發現,Fisher最優分割法適用于汛期分期,能使分期結果更加符合實際。
本文也存在很多不足:本文以旬為單位進行劃分會人為打斷水文的連續性,如果能使劃分單位小一些,則可以使劃分結果更加接近實際。由于資料有限,所以有一些指標也沒能收集到,如能收集到逐日徑流資料,則可以擁有更多關于吳城水庫的暴雨洪水變化特點的信息,使分期更加科學。
□
[1] 喻 婷,郭生練,劉 攀,等. 水庫汛期分期方法研究及其應用[J].中國農村水利水電,2006,(8):24-26, 56.
[2] 劉克琳,王銀堂,胡四一,等. Fisher最優分割法在汛期分期中的應用[J].水利水電科技進展,2007,27(3):14-16, 37.
[3] 陳守煜. 工程水文水資源系統模糊集分析理論與實踐[M]. 遼寧大連:大連理工大學出版社,1998..
[4] 焦立新. 評價指標標準化處理方法的探討[J]. 安徽農業技術師范學院學報,1999,13(3):7-10.
[5] 韓小孩,張耀輝,孫福軍,等. 基于主成分分析的指標權重確定方法[J].四川兵工學報,2012,33(10):124-126.
[6] 孫等平. 吳城水庫汛期分期調度研究與應用[J].水利水電技術,2012,43(7):109-112.