胡斌奇,伍永剛,成 濤
(1.湖南省電力公司電力調度通信局,長沙 410007;2.華中科技大學水電與數字化工程學院,武漢 430074)
水文典型年是流域水利工程規劃設計前的基礎性工作,也是水電站經濟運行的基本依據之一。在水利水電規劃設計中,常選擇有代表性的枯水年、平水年和豐水年作為設計典型年,分為稱為設計枯水年、設計中水年和設計豐水年。在水庫調度運行中,年徑流過程是制定中長期計劃的基礎。由于受現階段預報水平的制約,很難得到準確的中長期預報,但對于定性預測效果還比較理想,故選擇不同典型年過程對實際調度也具有很好的借鑒意義。
傳統基于頻率法[1-3]的典型年確定方法首先對徑流時間序列進行頻率分析得到其頻率分布曲線,再用設定的頻率值分別代表枯水年、平水年、豐水年進行曲線查詢得到對應的設計值,最后根據此值到歷史資料中選擇最為接近的一年作為典型年。但實際操作中,由于邊界的不確定性,上述方法存在著較大的人為性及經驗性, 如不同年份的兩徑流過程相像和不相像, 年徑流量中豐水、中水和枯水之分等并沒有明確的分界點。因此,相關學者提出采用模糊數學方法進行典型水文年的提取[4-6]。而在自然語言中,許多概念的不確定性包含了隨機性和模糊性兩個方面。這兩方面通常有很強的關聯性,不能分開。傳統的模糊本體中所涉及的模糊概念過多地強調了概念的模糊性,而忽略了其隨機性的特征。云模型方法[7,8]是在傳統模糊集理論的基礎上,引入概率統計思想,將隸屬函數的精確性拓展為具有統計分布的不確定性,能夠同時反映概念的模糊性和隨機性。顯然,用一個隨機變量來表示某個對象屬于某個不確定性概念的隸屬度,比傳統的確定隸屬度函數更符合實際。因此,將云模型方法應用于典型水文年的選取具有積極的意義,目前尚未見此類相關文獻報道。
本文運用云模型來描述水文年的定性概念,通過云變換的方法提取徑流時間序列的不確定性概念;再引入一種考慮概念云幅度系數影響的概念云合并算法實現定性概念的躍升,實現了對數據的自動劃分。相比傳統的頻率法,該方法避免了其計算過程中人為確定分類標準的主觀性;而與傳統的模糊理論構建方法比較,該方法不需要人為地統計對象屬于某個概念的隸屬度,可以直接從隸屬云中抽取概念,且兼顧模糊性和隨機性,更能反映流域水文的豐枯特性。
云模型能夠實現定性概念與定量值之間的不確定性轉換。設U是一個精確數值表示的定量論域,C是U上的定性概念,若定量值x∈U,且x是定性概念C的一次隨機實現,則x對C的確定度μ(x)∈[0,1]是有穩定傾向的隨機數。其中,上述定義中所提及的隨機實現,是概率意義下的實現;而確定度是模糊集意義下的隸屬度,同時又具有概率意義下的分布。取若干個x∈U,則x的分布就構成了云,而每一個x稱為一個云滴。
云由云滴組成,一般用期望Ex、熵En和超熵He這3個數字特征來整體表征一個概念[8]:①期望表示云滴在論域空間分布的期望,是概念在論域中的中心點;②熵表示定性概念的不確定性度量,由概念的隨機性和模糊性共同決定,反映了該定性概念的模糊程度,通常情況下,熵越大,定性概念可接受的云滴取值范圍就越大,定性概念越模糊;③超熵是熵的不確定性的度量,也就是熵的熵,揭示了在論域空間中所有點不確定度的凝聚性,也間接反映了云的厚度。
云變換是一種定量數據到定性概念轉換的 方法。傳統定性概念挖掘中大多采用等距離區間法和等頻率區間法,但由于其依憑主觀劃分的,且沒有考慮劃分邊界的模糊性,稱之為“硬劃分”[9]。本文中云變換是指將徑流數據轉換成由多個云疊加而成的定性概念,以實現對數據的“軟劃分”。給定徑流時間序列的頻率分布函數f(x),采用基于峰值的云變換算法,其數學表達式為:

(1)
式中:ai為幅度系數;n為變換后生成的離散概念的個數;C(Exi,Eni,Hei)為變換后的其中一個云概念。具體的峰值云變換過程如下[7]:
(1)對屬性U論域中的每一個可能屬性值x,計算數據庫中含有該屬性值的記錄個數,得到U的頻率分布函數f(x)。
(2)尋找數據分布函數f(x)分波峰所在位置,將其屬性值定義為云的質心位置(期望) ,計算用于擬合f(x)的、以Exi為期望的云模型的熵,計算云模型的分布函數fi(x)。
(3)從f(x)中減去已知云模型的數據分布fi(x),得到新的數據分布函數f′(x),并在此基礎上重復(2)、(3)得到多個基于云的數據分布函數。
(4)根據已知的f(x),最后得到的擬合誤差函數f(x)及各個云模型的分布函數,計算基于云模型的定性概念的3個特征值。
盡管通過云變換能夠很好地擬合原始數據分布,但由于沒有考慮云模型之間的關系,得到的云模型集較為粗糙。通常會出現下列2種特殊情況:云模型之間的交疊關系過于復雜,有些云模型之間的距離過近,所表達的定性概念非常近似;云模型之間過于稀疏,甚至出現概念“真空地帶”,所以要對這些基本概念進行躍升。所謂概念躍升,是指將云變換得到的基本概念作為泛概念樹的葉結點,逐步合并距離最近的兩個概念,以得到想要的概念層次。本文采用人機交互的躍升策略,即用戶預先指定躍升的概念粒度(即概念個數)進行概念躍升,同時根據挖掘結果多次干預并具體指導概念躍升。
設C1(Ex1,En1,He1)和C2(Ex2,En2,He2)是論域U上的兩個相鄰的基本云概念,若Ex1≤Ex2,則C1和C2按照文獻[10]基于“軟或”方式的概念躍升得到的云概念C3(Ex3,En3,He3):
(3)
He3=max(He1,He2)
(4)
通過上述“軟或”操作,可以將相鄰的兩個基本概念提升為能概括它們的較高層次的新概念,形成具有不確定性的泛概念樹。值得說明的是在泛概念樹中,同一層次的各個概念之間的區分不是硬性的, 允許一定的交疊。文獻[7]提出了另一種“積分”概念躍升算法,如下:
(5)
En3=E′n1+E′n2
(7)
設概念C1和C2的概率密度期望曲線相交于點d(xd,yd),截斷熵E′n1和E′n2的計算如下:
(9)
可以看出,“積分”云綜合法得到的綜合云更靠近熵較大的概念,但上述方法并沒有考慮其幅度系數對合并的影響。實際運用過程中,對于幅度系數大的概念應該有所傾斜,即合并后的綜合云期望應該距幅度系數大的期望值更近。設相鄰兩個概念云的幅度系數分別為r1和r2,改進后的概念躍升算法如下[11]:
(12)
計算合并后概念云的幅度系數得到:
(13)
將概念躍升到合適的概念粒度或概念層次后,剩下的問題就是判定所有的屬性值xj與云概念Ci的隸屬度。對于徑流時間序列的某樣本點而言,首先生成以Eni為期望,H2ei為方差的正態隨機數E′ni,然后得到其對Ci的隸屬度hi為:
hi=e-(xj-En)2/[2(E′ni)2]
(14)
隸屬概念的判定有2種方法:隨機判定法和極大判定法[12]。隨機判定法是根據屬性值對概念集中所有概念隸屬程度比例關系,在隸屬程度大的前幾名中隨機選擇隸屬概念。極大判定法則是根據屬性值對概念集中所有概念的隸屬程度的大小,選擇最大隸屬度的概念作為隸屬概念。本文采用極大判定法,即根據屬性值對概念集中所有概念的隸屬程度的大小,選擇最大隸屬度的概念作為隸屬概念。
本文所述方法其原理如圖1所示。首先按照2.1節方法提取徑流時間序列不確定性概念,并采用概念躍升方法進行云綜合,實現了對徑流數據定性概念的自動劃分;然后根據式(14)得到各輸入年徑流相對典型年概念集的隸屬情況,基于極大判定法得到其隸屬云和隸屬度;最后根據上述隸屬度值得到典型年份。值得注意的是,對于同一屬性值,以往模糊理論的方法只給出某一確定的、一成不變的隸屬概念。而基于云模型的典型年分析將給出隨機的、以一定分布出現的隸屬概念,綜合體現了定性概念的模糊性和隨機性,以及不同概念層次之間的多隸屬關系。

圖1 基于云模型的典型年選取原理
以湖南省資水流域柘溪水電站1930-2010年實測年徑流序列為例,驗證本文所述預測模型的有效性。柘溪水電站裝機容量44.7萬kW,是一座完全年調節的水庫。對原始數據首先對徑流資料進行歸一化處理。按照等距離區間法,圖2給出了年徑流數據的分布圖(區間數20)及正態分布擬合結果。從中可以看出,年徑流時間序列概率分布與正態分布函數并不吻合。對年徑流序列采用云變換,可以得到7個初始模糊概念,如圖3所示。

圖2 年徑流序列概率分布

圖3 年徑流時間序列云變換結果

圖4 云綜合后得到的云概念
從圖3可以看出,采用云變換進行徑流屬性的離散化,所得到的定性概念更可以反映論域中徑流值的實際分布。按第2.1節中的概念云合并算法,對上述獲得的初始不確定性云概念進行合并,最終得到3個粗粒度的不確定性概念,如圖4所示。其中經過合并后的綜合云即分別對應著水文特性中的典型枯水年、平水年和豐水年的特征分布。
從圖4中可以看出,最終得到的3個不確定性概念較為客觀地反映了柘溪水電站的年徑流時間序列的分布情況,這3個概念可分別被稱為枯水年、平水年、豐水年。為對比分析本文方法與傳統頻率法的結果,表1給出了基于頻率法的水電站設計典型年計算結果。首先對年徑流量資料系列按皮爾遜III型理論頻率曲線進行適線, 得到所要求5種頻率(其對應設計頻率為10%、20%、50%、80%、90 %)的理論年徑流量值。在傳統的頻率法中,一般選取頻率為20%、50%和80%作為典型特征年。按照此思路,在徑流歷史序列中,選取了與之最接近的兩個年份作為備特征選年份,如表1所示。可以看出,傳統的頻率法中存在較強的人為確定分類標準的主觀性。
不同于上述方法,采用基于云模型的典型年選取過程中,整個過程不受參數的影響, 避免了人為確定參數的主觀性。表2給出了不同方法得到的設計典型年徑流,可以看出采用考慮幅度系數的云模型得到的概念中心較原始云綜合法更貼近傳統的頻率法的計算結果,這也驗證了本文概念躍升方法的有效性。但同時也可以看出,本文方法與傳統頻率法結果存在一定差異,產生這種差別的原因在于年徑流序列本身邊界的模糊性和不確定性。傳統頻率法得到的結果受人工主觀性影響較大,而基于云模型的選取方法中通過計算不同年份下的年徑流值對于上述概念云的隸屬度來得到歷史序列中最為接近的年份作為典型年。依據式(14)對給定的歷史序列進行分析,最終得到的柘溪水電站的典型枯水、平水、豐水年分別為1983年,1976年和1969年。

表1 基于頻率法得到的設計典型年

表2 不同方法得到的設計典型年徑流
此外,對于特定的某水文年,為分析其豐枯特性,可根據該年徑流對于上述概念云的隸屬度直接推求。與傳統的模糊構建方法比較,云變換方法的優點在于它使用云模型來描述概念,克服了人為確定分類標準的主觀性, 使選取的豐枯典型年更加合理;且對于特定的輸入對象,其對概念的隸屬度采用條件云發生器得到,更能反映對象的隨機性。依據式(14),計算2008-2010年徑流量的隸屬度,經過多次運行得到的結果是一系列不確定的、在某個范圍內變化的離散點的集合。采用其數學期望作為最終隸屬結果,如表3所示。從中可以看出,基于云模型的水文特性分析,不僅能給出典型設計年徑流量,且采用具有隨機概念的隸屬度來描述特定年的水文豐枯特性,更符合實際情況下不同人對于相同屬性值在同一模糊概念下隸屬度差異性的情形。

表3 不同年份的水文豐枯特性分析結果
針對傳統基于頻率法確定典型水文年計算過程中人為確定分類邊界的主觀性和確定性,本文引入云模型來描述年徑流的定性概念,從而更好地體現水庫水文豐枯特性的隨機性與模糊性。通過采用云變換和云概念躍升措施,自動提取年徑流序列的典型概念中心,并通過條件云發生器產生不同年份的水文豐枯特性隸屬度。相比于傳統的頻率法和模糊法,由于基于云模型的水文特性分析得到的結果是模糊的、不確定的,更符合人類對定性事物的判斷方式。
□
[1] 唐德善. 黃河流域水文典型年和典型系列優選[J]. 河海大學學報, 1994,22(2):15-19.
[2] 陳利群, 蔣 詠. 典型年法的修正及其在城鎮給水規劃中的應用[J]. 水利水電技術,2011,42(10):22-24.
[3] 左其亭, 陳耀斌. 具有多個水文站的多支流河流典型年選取方法[J]. 水文, 2012,32(2):1-4.
[4] 夏莉敏, 張 瑋. 基于模糊聚類迭代模型的典型水文年選取研究[J]. 武漢理工大學學報(交通科學與工程版), 2009,33(4):695-698.
[5] 易淑珍, 嚴遠玲. 模糊優選方法在降水典型年選擇中的應用[J]. 廣東水利水電,2005,(2):81-83.
[6] 宋亞婭,張 振,黃振平,等. 基于模糊識別理論的無資料地區設計徑流典型年選擇[J]. 河海大學學報(自然科學版), 2014,42(1):19-23.
[7] 李德毅, 杜 鹢. 不確定性人工智能[M]. 北京: 國防工業出版社, 2005.
[8] 劉常昱,李德毅,潘莉莉. 基于云模型的不確定性知識表示[J]. 計算機工程與應用,2004,(2):32-35.
[9] 栗 然,崔天寶,肖進永. 基于云模型的短期電價預測[J]. 電網技術,2009,33(17):185-190.
[10] 蔣 嶸,李德毅,范建華. 數值型數據的泛概念樹的自動生成方法[J]. 計算機學報,2000,23(5):470-476.
[11] 孟 暉,王樹良,李德毅. 基于云變換的概念提取及概念層次構建方法[J]. 吉林大學學報(工學版), 2010,40(3):782-787.
[12] 張家精,王煥寶,陳金蘭,等. 基于云模型的隸屬概念判定算法的改進[J]. 計算機技術與發展,2007,17(10):65-68.