王 培,許仕榮,唐國強,胡 毅(.新疆油田公司供水公司,新疆 克拉瑪依 834000;.湖南大學 土木工程學院,湖南 長沙 4008)
基于集對分析原理的城市需水量預測模型及其應用
王 培1,許仕榮2,唐國強1,胡 毅1
(1.新疆油田公司供水公司,新疆 克拉瑪依 834000;2.湖南大學 土木工程學院,湖南 長沙 410082)
城市需水量預測對合理分配水資源起著重要作用,但城市需水量本身的影響因素眾多,其預測是典型的不確定性問題。集對分析是處理不確定問題的新方法,它通過聯系度展示了研究對象間關系的詳細結構,對處理不確定性問題十分有效。采用集對分析相似預測法,結合集對分析同異反模式中的“擇近原則”和相似分析法中相似的歷史原因產生相似結果的原則,在預測過程中將需水量時間序列作為需水量的影響因子,利用一定時長的歷史數據來建立基于集對分析原理的相似預測法模型。通過對克拉瑪依市三坪地區需水量的預測發現,集對分析相似預測法不但計算簡單,而且精度優于傳統的ARIMA模型。
集對分析原理;相似預測法;不確定性問題;預測
新疆克拉瑪依地處我國西北,屬于干旱地區,水資源本身較為短缺,加上近年來城市化進程的加快,這一問題更為突出。因此,科學預測城市需水量,將對克拉瑪依市的供水設施建設和原水調度的優化起著重要作用。城市需水量變化要受到諸多因素的影響,存在著諸多的不確定性因素。由于傳統的ARIMA模型在預測城市需水量特別是對相關影響因子進行分析時,存在著引入的自變量是否適當可靠,各因子間是否因密切相關而導致難以分離各個變量等問題[1]。為了消除城市需水量預測中由不確定性帶來的影響,不少學者嘗試用新的方法來進行城市需水量的預測。馬文敏等[2]等將灰色系統理論應用在了對銀川市的城市需水量預測中;劉勇健等[3]提出基于遺傳—神經網絡的城市需水量預測方法。然而,這些方法原理都比較復雜,當需要對模型中的參數進行修改時,對非專業人士來說存在著一定的困難。在處理不確定性信息方法中,集對分析方法不但原理簡單,而且相比傳統方法更具有優越性[4]。
本文嘗試利用基于集對分析原理的相似預測法對城市日需水量進行預測。首先根據新疆克拉瑪依三坪地區的日需水量歷史數據建立預測模型,利用該模型進行預測,通過預測值和實際值的對比來檢驗預測模型的可行性,同時與傳統的ARIMA模型進行對比,以分析和檢驗其預測精度。
2.1 集對分析原理
在水文水資源系統中,“集對”概念可定義為在不確定性系統中有一定聯系的兩個集合組成的對子。在水文水資源系統中集對一般表示為H(A,B),表達A和B構成的一個對子[5]。在需水量預測中,我們可以將連續幾天的需水量放在一起組成一個集合,根據日期的不同,可以有多個這樣的集合,任意兩個集合放在一起都可以看成一個集對。
集對分析法(SPA)是一種處理不確定性問題的系統分析方法,其中心思想是先對不確定性系統的兩個有關聯的集合構造成集對,再對集對的特性做同一性、差異性、對立性分析,然后建立集對的同異反聯系度。SPA的基礎是集對,關鍵是聯系數[6],計算公式為:
(1)
式中,N為集S合特性的總項數;S為同一性的個數;P為對立性的個數;F為差異性的個數;i為差異度系數,在(-1,1)區間取值,有時僅起差異標記作用[5];j為對立度系數,一般j=-1,有時僅起對立標記作用[5]。
定義a=S/N為同一度、b=F/N為差異度、c=P/N為對立度(實際上是該屬性的同、異和反三方面的模糊關系)[5],則式(1)可改寫為:
μ(A-B)=a+bi+cj
(2)
式中,a+b+c=1,且a、b和c均為非負實數,分別表示就某種屬性而言具有相同性質、差異性質和相反性質的程度。其中,a和cj是相對確定性的項,bi是相對不確定性的項,可統一描述隨機性、模糊性、灰色性、未確知性、中介(反映客觀事物相互過渡的各離散狀態)等不確定性信息[5,6]。式(2)是最常用的三元聯系數。將式(2)中的bi根據A或B的子集、不確定性的類型(如隨機性、模糊性)等進一步拓展可得k元聯系數:
μA-B=a+b1i1+b2i2+…+bk-2ik-2+cj
(3)
其中,a+b1+b2+…+bk-2+c=1。
集對分析法就是在一定的問題背景下,對所討論的集對特性展開同異反分析,并進行度量、刻劃,得到集對的同異反聯系數表達式,利用聯系數及其運算深入展開有關系統的演化、突變、識別、模擬、預測、評價、決策、控制等問題的研究[7]。
2.2 相似預測法
相似預測法是按照相似原因產生相似結果的原則,從歷史樣本集中找出與現在最相似的一個或幾個樣本作為預測結果的一種非參數預測方法[8]。用相似方法預測城市需水量需要解決一個關鍵問題,即如何定量描述需水量歷史樣本之間的相似性。樣本之間在某些分量上常常反映出確定的相同或相反特性,而在另外的一些分量上又往往反映出不確定的差異特性。可見,上述相關性和相似性都是既含有確定性因素又含有不確定性因素的一類確定性與不確定性相耦合的復雜系統。
集對分析為相似預測法在預測城市需水量預測中的運用所遇到的兩個關鍵問題提供了一種新的解決途徑。基于集對分析原理的相似預測法,就是通過集對分析原理去尋找各個城市需水量集合的同異反關系,計算聯系數,將聯系數作為相似性的度量,用多個最相似的歷史樣本水資源加權平均值作為當前城市需水量的預測值,建立基于集對分析的水資源相似預測模型,從而對城市需水量進行預測[9]。
3.1 建模預處理
建模預處理主要包括數據整理、選擇集合和構建集對三個步驟:①數據整理。整理出某地區一段時間內的日需水量數據。②選擇集合。設有日需水量時間系列xi(i=1,2,…,n),xi依賴前m個相鄰歷史的數據xi-1,xi-2,…,xi-m+1,xi-m;集體集合Bi=(xi,xi+1,…,xi+m-1)(i=1,2,…,n-m),xm+i為后續值。這里將集合Bi的元素當作自變量,即有m個自變量和m個影響因子;xm+i作為因變量,即我們需要預測的數值。預測的后續值xn+1,可構建集合Bn+1=(xn-m+1,xn-m+2…xn-1,xn)。③構建集對。可將所要預測的需水量xn+1的主要影響因子集Bn+1與歷史樣本需水量的主要影響因子集Bi建立集對H(Bn+1,Bi)。
3.2 集合的分級量化
將影響因子集合Bi中的各個元素等級進行符號化處理,對落入一級標準范圍內的記為符號“1”,落入二級標準范圍內的記為符號“2”,對落入K級標準范圍內的記作符號“K”,以此類推。
3.3 建立聯系度表達式,計算聯系數
構建當前預測值xn+1的影響因子集合Bn+1與歷史樣本xi的影響因子集合Bi的同異反聯系度,對i、j取值后計算聯系數[5]。
3.4 選取最相似歷史樣本預測
合理確定最相似的歷史樣本數目K值,將多個最相似的歷史樣本需水量的加權平均值作為當前需水量的預測值,也可對相似的歷史樣本取一定的權重再進行加權評價[9,10]。
我們收集了新疆克拉瑪依市三坪地區2013年12月—2014年11月的一年需水量數據,用以預測2014年的12月的日需水量,并與實測值進行比較。

表1 各影響因子的均值和離差

表2 量化結果和聯系數計算


表3 聯系數最大時相關集合
為了整體評價模型的精度,分別采用本模型和傳統的時間序列法ARIMA模型[11,12](q=0、d=1、q=2)預測一周的日需水量數據,并計算各預測結果的平均絕對誤差(MAE)和平均相對誤差(MAPE),結果見表4、表5。從表4、表5可以看出,集對分析相似預測法作為一種新的預測方法是可行的,且預測精度比傳統的ARIMA模型高。

表4 集對分析相似分析法預測精度評價結果

表5 時間序列法ARIMA模型預測精度評價結果
本文利用新疆克拉瑪依市三坪地區的日需水量歷史數據進行建模并驗證分析,證實了基于集對分析原理的相似預測法在城市需水量預測中的可行性。與傳統的時間序列法ARIMA模型相比,基于集對分析原理的相似預測法不但原理簡單,而且具有更高的精度。此外,集對分析相似預測法的關鍵點在于聯系數的計算,而聯系數的計算相對較簡單。集對分析相似預測法中所涉及的參數m、i、j之類都不是固定的,而是可以根據實際情況取不同的值,因此集對分析相似預測法對不同的情況都有較好的適應性。但集對分析相似預測法中參數的確定存在一定的主觀性,且參數的不同取值會對預測結果產生一定程度的影響。如何更加準確地確定這些參數,是集對分析相似分析法需要改進的地方,以便為城市需水量預測提供一個更有效的方法。
[1]席洋,程水源,郭秀銳,等.灰色預測模型在城市需水量預測中的應用[J].環保科技,2007,13(1)∶25-34.
[2]馬文敏,唐蓮.灰色系統理論在城市需水量預測中的應用[J].西北水資源與水工程,2001,12(1)∶14-16.
[3]劉勇健,沈軍.基于遺傳一神經網絡的城市需水量預測方法研究[J].水資源與水工程學,2004,15(4)∶21-25.
[4]和蕊,原晨陽,楊思波,等.集對分析聚類方法預測法在城市生活需水量中的應用[J].水利科技與經濟,2010,16(12)∶1324-1327.
[5]王文圣,李躍清,金菊良,等.水文水資源集對分析[M].北京:科學出版社,2010.
[6]王文圣,李躍清.水文水資源集對分析[J].南水北調與水利科技,2011,9(2)∶27-32.
[7]陳光怡,秦帥,葛松,等.基于SPA-TFN-SS耦合的隧道瓦斯突出分析模型[J].土木工程學報,2011,44(S2)∶240-243.
[8]嚴華生,謝應齊,曹杰.非線性統計預報方法及其應用[M].昆明:云南科技出版社,1998.
[9]金菊良,魏一鳴,王文圣.基于集對分析的水資源相似預測模型[J].水力發電學報,2009,28(1)∶72-77.
[10]汪明武,金菊良,周玉良.集對分析耦合方法與應用[M].北京:科學出版社,2014.
[11]吳今培,孫德山.現代數據分析[M].北京:機械工業出版社,2006.
[12]馮國生,呂振通,胡博.SPSS統計分析與應用[M].北京:機械工業出版社,2011.
ModelforForecastofUrbanWaterDemandedBasedonSetPairAnalysisandItsApplication
WANG Pei1,XU Shi-rong2,TANG Guo-qiang1,HU Yi1
(1.Water Supply Company of Xinjiang Oilfield Company,Karamay 834000,China;2.College of Civil Engineering,Hunan University,Changsha 410082,China)
The forecast of urban water demanded was very important when water resources needed to be distributed reasonably.There were many factors which could affect the results when we predicted the urban water demanded.It was a classical uncertainty problem,and at the same time,Set Pair Analysis was a new method to solve the uncertainty problems.It could express the detailed structure between studied variables with the connection degree So Set Pair Analysis was always effective when we tried to work out the uncertainty problems.Using the Similar Prediction Method based on Set Pair Analysis to forecast the urban water demanded,with the principle of “picking up the nearest one”in Set Pair Analysis and “similar reasons leading to similar results”in the Similar Prediction Method.This paper treated the time series as the factors and built the model based on the Similar Prediction Method and Set Pair Analysis with a number of data which was recorded for some time.At the same time,this paper used the data of water demanded in Sanping,Karamay of Xinjiang to test the model based on the Similar Prediction Method and Set Pair Analysis,which showed the method was simple and had a higher accuracy compared with the traditional ARIMA model.
Set Pair Analysis;similar prediction method;uncertainty problems;forecast
10.3969/j.issn.1005-8141.2017.04.005
TU991.31
A
1005-8141(2017)04-0408-03
2017-02-10;
2017-03-21
王培(1973-),男,新疆維吾爾自治區克拉瑪依人,碩士研究生,工程師,主要從事科技管理、信息管理等工作。
許仕榮(1965-),男,湖南省永州人,教授,研究方向為給排水管網系統及其優化與飲用水安全保障技術。