邵年華
(深圳市西麗水庫管理處,廣東 深圳 518055)
水文模擬預測是流域防洪抗旱、水資源規劃的重要依據,也是水資源有效利用和社會經濟可持續發展不可或缺的手段。隨著水文數據獲取能力和計算機性能的提高,各種水文模型得到快速發展。但大多數水文模型都是基于確定性理論的預測,往往回避了不確定性問題。受氣象因素和地理因素影響,水文過程必然是一個復雜的動態過程,對水文預測也將存在普遍的不確定性[1]。因此,研究水文預測的不確定性對于完善水文模擬與預測理論、合理開發水資源都具有重要理論價值和現實意義。
水文水資源系統中的不確定性主要包括模糊性和隨機性等。研究方法有模糊理論和概率分析方法,但這些方法大多孤立的應用,很少綜合在一起。而水文系統往往是各種不確定性因素的綜合體,因此考慮多種不確定性的、基于貝葉斯概率理論的貝葉斯概率水文預報模型成為研究水文系統不確定性的主要方法[2-4]。但由于該模型的結構復雜,參數眾多,而不利于在實際中推廣應用。針對當前存在的問題,本文把基于不確定性理論的云推理模型引入水文預測領域。該模型可以把不確定性概念的模糊性和隨機性有機地結合起來,利用期望Ex、熵En和超熵He表征定性概念,實現不確定性語言值與定量數值之間的自然轉換,以期能拓展水文不確定性理論,豐富水文預測方法。
假設u(x)取值于區間[0,1],云即為U到區間[0,1]的映射,即u(x):U→[0,1],?x∈U,x→u(x)。
云不確定性概念可通過計算云的期望Ex、熵En和超熵He等數字特征來反映其整體特性[6]。云的Ex、En、He可將模糊性和隨機性統一起來,在定性概念和定量數值之間形成一種相互聯系的映射關系。
云的實現可通過軟件和固化成硬件來完成,即云發生器(Cloud Generator,簡稱CG)。它是在定性概念和定量數值之間建立的一種相互聯系的映射關系,是進行不確定性推理的基礎。正態云模型是云的基本模型,因此正態云模型為研究云發生器的常用模型。見圖1。

圖1 云發生器Fig.1 Cloud Generator


云還可以生成特定條件下的云發生器。已知正向云數字特征值(Ex,En,He),在給定特定條件x=a,則生成X條件云發生器;若給定特定條件是u(x)=u(a),則生成Y條件云發生器,連接二者,可生成單條件規則發生器。見圖2。

圖2 不同條件下的云發生器Fig.2 Cloud generator under different condition


云模型的云推理是以不確定性理論為基礎,并以所表達的一個概念與多個概念之間因果邏輯關系為推理規則。這種推理規則可以演繹成一對一、一對多、多對一、多對多等形式,對應于云模型即可建立成有單條件單規則、單條件多規則、多條件單規則和多條件多規則4種模式的不確定性推理過程。


圖3 單條件規則云發生器Fig.3 One single condition and rule cloud generator
當存在多條規則時,可根據a來確定合適的規則。利用隸屬概念判定的方法有極大判定法和隨機判定法。極大判定法利用特定值對所有規則集中規則隸屬程度的大小,來確定最大隸屬程度的規則作為隸屬概念。隨機判定法利用特定值在所有規則集中規則隸屬程度較大的幾個中隨機選擇隸屬規則。
從給定的時間序列數據中挖掘出m組規則數據,將規則數據輸入逆向云發生器可得到前件云A(ExA,EnA,HeA)與后件云B(ExB,EnB,HeB),m組前件云與后件云組成預測規則集合{A1→B1,A2→B2,…Am→Bm}。
根據慣性定理,在短暫的時間內時間序列數據具有相對穩定性,可從數據中挖掘當前趨勢作為預測信息。但數據所包含的當前趨勢只能反映未來的可能性,因此不能完全以當前數據計算的數值作為最終預測結果。當前趨勢的信息應包含不確定性且遵循當前數據的分布規律,因此它應當表示為定性趨勢而不是定量數值[8]。云模型可滿足這種定性趨勢與定量數值的轉換,將預測值的前t個數據作為趨勢數據輸入逆向云發生器,即可得趨勢云I(ExI,EnI,HeI)。
將預測規則集中的m個前件云分別構造X條件云發生器,代入特定值a分別得到m個輸出u,它們分別反映了u對m個前件云的確定程度。通過最大隸屬度原則可以找到最大ui,則Ai即為預測前件云。如果存在兩個以上最大值u,可以任選其中一個。Ai確定后,對應的Bi即為預測的后件云[9]。
若給定兩個相鄰的云模型C1(Ex1,En1,He1)和C2(Ex2,En2,He2),可以通過下面公式綜合這兩個云模型得到綜合云C(Ex,En,He):
(1)
En=En1+En2
(2)
(3)
通過式(1)-式(3)的計算,可整合后件云Bi和趨勢云I,形成預測云St。St的期望值在趨勢云和后件云之間,熵是它們熵的總和,這樣預測云就可計算出更多可能的預測結果。
通過構造可組成新的語言規則Ai→St,利用預測云St及相應的確定度ui構造Y條件云發生器,則Y發生器的輸出值b即為預測值。
和田河是塔里木河三大源流之一,發源于喀喇昆侖山和昆侖山,北流入塔里木盆地,穿過塔克拉瑪干大沙漠,匯入塔里木河。和田河有二源,西源喀拉喀什河(簡稱“喀河”)發源于喀喇昆侖山北,東源玉龍喀什河(簡稱“玉河”)發源于昆侖山北坡,并在出山口處分別設有烏魯瓦提和同古孜洛克水文站(簡稱“烏站”和“同站”)[10]。本研究選取玉河同站1956-2002年共46個實測年徑流數據進行模型預測分析。其中,云模型訓練樣本為1956-1992年36個實測年徑流量, 1993-2002年共10個實測年徑流量數據作為驗證模型預測效果樣本。
對選取玉河同站1956-2002年共46個實測年徑流數據序列進行歸一化處理,得到序列R={r1,r2,…,r46}。在云推理過程中,考慮相鄰年份對未來年份徑流量的影響,分別將歸一化處理后的1956-1991年和1957-1992年徑流量數據作為推導相鄰年份不確定性規則的輸入樣本E及輸出樣本O,即得到數據組合(ei,oi),i=1,2,…,31。
根據徑流豐枯變化特性,可以利用模糊模式識別對序列E進行分析,挖掘出豐水年、平水年、枯水年三組規則數據。O序列數據做相應于E的分類。將3組規則數據中的輸入樣本數據和輸出樣本數據分別輸入逆向云發生器生成規則前件云和后件云,這3條對應規則反映了相鄰年份徑流量之間的關系,規則數字特征見表1。同時,考慮歷史數據變化趨勢對未來徑流量的影響,將預測年份前5年的數據代入逆向云發生器生成趨勢云,根據式(1)-式(3)合并趨勢云與后件云,最后生成規則的預測云。

表1 云模型數字特征Tab.1 The digital character of cloud model in rules
在得到三則規則后,將預測值上一年徑流量代入,并通過最大隸屬度原理,確定預測規則,最后根據發生器計算出未來的年徑流量。在演算過程中,因進行不確定性推理,結果在一個允許范圍內會不同。本文進行10次演算后,對模型計算結果進行反歸一化處理,取期望值作為最終的徑流量預測值(表2)。

表2 云模型與LS_SVM模型的年徑流量預測結果比較Tab.2 Comparison between measured and predicted annual runoff of cloud model and LS_SVM model
本文還利用最小二乘支持向量機(LS_SVM)模型建立玉河年徑流量預測模型,并與云模型預測結果進行比較。兩種模型預測結果見表2和圖4。從表2可知,云模型預測結果中較大誤差發生在1993和1994年,分析可知1993年徑流量為整個系列的極小值,1994年徑流量為整個系列的極大值,說明云模型對極值的模擬效果略差。LS_SVM模型與云模型預測結果的平均誤差分別為12.3%和11.9%,說明云模型的整體模擬效果略好于LS_SVM模型。從圖4中可見,LS_SVM模型對極值部分模擬的較好,而云模型對整體的徑流變化模擬較好,說明考慮趨勢變化和相鄰數據之間關系的不確定性云模型對序列變化趨勢的模擬效果很好。

圖4 年徑流量預測值與實測值的比較Fig.4 Comparison between measured and predicted annual runoff
本文在不確定性理論的基礎上建立了云推理的預測模型,并以和田河同站實測年徑流為例,對模型預測效果進行驗證,結果令人滿意。研究表明,考慮趨勢變化和相鄰數據之間關系的云模型可以識別數據中不確定性信息,提高模型的預測效率,避免將不必要的不確定性因素引入模型。通過與LS_SVM模型比較發現,云模型結構簡單,方法簡便,預測效果較好,相信有很好的應用前景。同時,云模型也存在需要進一步研究的方面:云模型在模擬極值時效果較差,而干旱地區的水文時間序列往往波動較大,因此云模型是否適用于干旱地區有待研究;本文在建模時只考慮了單因素情況,今后基于多因素的多維云模型建模將是研究的另一個方向。