摘要:對H市日用水量數(shù)據(jù)進(jìn)行了混沌識別,結(jié)果表明其具備混沌特性,結(jié)合BP神經(jīng)網(wǎng)絡(luò)和混沌理論,利用重構(gòu)相空間的嵌入維數(shù)確定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),建立了基于混沌理論的城市用水量神經(jīng)網(wǎng)絡(luò)模型,實(shí)際數(shù)據(jù)驗(yàn)證了該方法對城市用水量預(yù)測的有效性。
關(guān)鍵詞:混沌;城市用水量;時間序列;神經(jīng)網(wǎng)絡(luò)
中圖分類號:O415.5TP183 文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2008)34-1793-02
Forecast Research of Urban Water Consumption Based on Chaos Theory and Neural Networks
CHEN Min1, DENG Ying-wei2
(1.Hunan Insititute of Technology, Hengyang 421002, China; 2.Hengyang City Water Company, Hengyang 421001, China)
Abstract: The paper finds chaos character in the data of Chinese urban everyday water consumption. By taking advantage of structures of neural network being determined by embedding dimension of phase space reconstruct, neural network model of urban water consumption based on chaos theory is put forward . Practical data show that the method is able to do urban water consumption prediction effectively.
Key words: chaos; urban water consumption; time series; neural network
1 引言
水是經(jīng)濟(jì)的命脈,是城市生存和發(fā)展的首要條件。為保證對城市供水的可靠性,需要通過準(zhǔn)確的城市供水短期預(yù)測來編制城市供水的總體規(guī)劃和工程規(guī)劃,指導(dǎo)城市供水設(shè)施的建設(shè),使水的供應(yīng)與需求相適應(yīng)。常用的預(yù)測方法可分為兩類:一類是解釋性預(yù)測方法,即找出被預(yù)測量的各種影響因素,建立回歸分析模型;另一類是時間序列分析方法,它是依據(jù)被預(yù)測量的歷史觀測數(shù)據(jù),通過序列分析,找出其順序變化規(guī)律。由于城市用水量受經(jīng)濟(jì)、人口、生活水平、全天氣象等多種因素的影響,要找出系統(tǒng)內(nèi)部的變化機(jī)理及各類因素之間相互影響的明確關(guān)系是比較困難的,并且每個城市的用水量的影響因素也不盡相同,所以回歸分析模型不具備普適性,這使得回歸預(yù)測分析方法在用水量預(yù)測過程中的應(yīng)用受到限制。而按時間順序?qū)⒂^測或記錄到的一組數(shù)據(jù)排列起來的時間序列分析方法,對外部影響因素復(fù)雜的作用進(jìn)行簡化,只考察歷史觀測數(shù)據(jù)及其數(shù)據(jù)模式隨時間的內(nèi)在變化規(guī)律,進(jìn)而對整個系統(tǒng)進(jìn)行描述和解釋,以對系統(tǒng)未來狀態(tài)作出預(yù)測,它比較符合用水量序列的特點(diǎn),因而在用水量預(yù)測工作中應(yīng)用較為廣泛。
混沌理論是非線性動力學(xué)的重要發(fā)展。混沌現(xiàn)象的研究自20世紀(jì)60年代開始以來,到20世紀(jì)80年代初期已經(jīng)初步發(fā)展成為一個具有獨(dú)特的概念體系和方法論框架的新學(xué)科。城市用水量的時間序列具有多種不確定性和非線性,具備混沌特性,不易建立精確數(shù)學(xué)模型。人工神經(jīng)網(wǎng)絡(luò)(ANN) 具有強(qiáng)大的非線性映射能力、具有自適應(yīng)、自學(xué)習(xí)、容錯性和并行處理等性質(zhì),應(yīng)用人工神經(jīng)網(wǎng)絡(luò)理論,則可以克服時間序列預(yù)測方法的局限性,方便、靈活地進(jìn)行城市用水量的預(yù)測。對于城市用水量,首先對城市用水量的時間序列進(jìn)行混沌識別,如果給定的時間序列具備混沌特性,則通過應(yīng)用混沌理論中的相空間重構(gòu)技術(shù),把城市用水量時間序列嵌入到重構(gòu)的相空間中,然后利用神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行擬合,進(jìn)而進(jìn)行預(yù)測。神經(jīng)網(wǎng)絡(luò)與混沌時間序列理論結(jié)合,為城市用水量預(yù)測的研究提供一條嶄新的途徑
2 混沌識別
在城市用水量時間序列中,由于觀測方法和觀測手段等不可避免的誤差,使得噪聲與混沌往往并存,城市用水量序列中既有確定性成分,也有隨機(jī)性成分。因此,城市用水量序列性質(zhì)的鑒別或混沌性識別主要指在某一置信度下判斷城市用水量序列以何種成分為主,或研究城市用水量序列是否為混沌序列。
在實(shí)際應(yīng)用中,判斷一個系統(tǒng)的動態(tài)行為是否混沌,即是否有混沌吸引子,一般從混沌吸引子的兩個基本特征來判斷:1) 系統(tǒng)相空間中的吸引子是否具有自相似結(jié)構(gòu)的分形維特征;2) 系統(tǒng)對于初始條件是否具有敏感性。如果所研究的吸引子具備這兩個特征,那么,我們就可以認(rèn)為該吸引子是混沌吸引子,系統(tǒng)的行為是混沌的。一般從定性、定量兩個途徑來進(jìn)行時間序列性質(zhì)的鑒別[1],定性分析方法主要是根據(jù)觀測序列在時域或頻域內(nèi)表現(xiàn)出的特殊性質(zhì)對序列的主要特性進(jìn)行粗略分析,常用的有相圖法、功率譜法、龐加萊截面法和代替數(shù)據(jù)法等[2]。定量分析的方法主要是對描述混沌系統(tǒng)的重要特性指標(biāo)包括關(guān)聯(lián)維數(shù)[3]、最大Lyapunov指數(shù)[4]和Kolmogorov熵[3]等特性指標(biāo)定量分析,從而進(jìn)行混沌識別。
3 相空間重構(gòu)
近十幾年來,混沌信號處理為人們提供了分析自然現(xiàn)象的全新方法。混沌吸引子的相空間重構(gòu)一般是分析混沌動力學(xué)系統(tǒng)的第一步,Packard等人最早提出了相空間重構(gòu)的方法[5],Takens用數(shù)學(xué)為之奠定了可靠的基礎(chǔ)[6]。混沌動力學(xué)研究表明,系統(tǒng)任意分量的演化是由與之相互作用著的其它分量決定。而這些相關(guān)分量的信息就隱含在任意分量的發(fā)展過程中,因此,可以從某一分量的時間序列數(shù)據(jù)中提取和恢復(fù)出系統(tǒng)原來的規(guī)律,這種規(guī)律是高維空間下的一種軌跡。Packard等建議用原始系統(tǒng)的某變量的延遲坐標(biāo)來重構(gòu)相空間,即將在某些固定時間延遲點(diǎn)上的觀測值作為新維來處理,從而通過“嵌入”方法可以構(gòu)造出一個與原系統(tǒng)等價(jià)的相空間,在這個空間中可以恢復(fù)原有動力系統(tǒng),并研究其吸引子的性質(zhì)。相空間重構(gòu)可表述如下:
設(shè)時間序列{x(t),t=0,1,2…,n},由此序列嵌入m維相空間,可得到一系列m維相空間的相點(diǎn)為:
■ (1)
其中m為嵌入維數(shù),τ為延遲時間,N=n-(m-l)τ。
Takens的嵌入定理證明了一維時間序列在無限長且無噪聲的情況下,延遲時間取任意值時都能重構(gòu)原系統(tǒng)相空間。但實(shí)際上,實(shí)測時序是有限長的,且不可避免的被噪聲污染,因此延遲時間取任意值不能重構(gòu)原系統(tǒng)相空間,嵌入定理也沒有提供嵌入維數(shù)的選取方法。因此對實(shí)測時序相空間重構(gòu)的關(guān)鍵是其參數(shù)的選取。
4 相空間重構(gòu)的參數(shù)選取
4.1 延遲時間的選取方法
延遲時間是一個重要的相空間重構(gòu)參數(shù)。最佳延遲時間τ不能選的太大也不能太小,當(dāng)τ選擇的太小時,延遲矢量各坐標(biāo)值之間有很強(qiáng)的相關(guān)性,這時重構(gòu)矢量被壓縮在相空間的主對角線的周圍,信息不易顯露,產(chǎn)生冗余誤差;而當(dāng)τ選擇的太大時,重構(gòu)矢量各坐標(biāo)值之間的關(guān)系幾乎變成隨機(jī)的,破壞了原系統(tǒng)各變量之間的內(nèi)在關(guān)系,這時吸引子沿著與主對角線垂直的方向發(fā)散,將使得重構(gòu)矢量包含的原動力系統(tǒng)信號失真。因此應(yīng)該選取合適的τ使重構(gòu)矢量保持原動力系統(tǒng)各變量之間的關(guān)系。
關(guān)于延遲時間τ與嵌入維數(shù)m的選取,一種認(rèn)為τ與m互不相關(guān),即τ與m的選取是獨(dú)立進(jìn)行的,方法主要有自相關(guān)法[2]、復(fù)自相關(guān)法[7]、去偏自相關(guān)法[8]、互信息法[9]和AD法[10]。另一種則認(rèn)為τ與m的選取是相互依賴的,方法有時間窗口法[11]、C—C方法[12]。
4.2 嵌入維數(shù)的選取方法
在目前確定嵌入維數(shù)的方法中,偽鄰點(diǎn)法[13]、奇異值分解法[14]和Cao法[15]、 飽和關(guān)聯(lián)維數(shù)法[16]是比較好的方法,但是各自都有些不足。這里只簡要介紹偽鄰點(diǎn)法[13],偽鄰近點(diǎn)法根據(jù)嵌入維數(shù)從m到m+1時偽鄰近點(diǎn)的行為變化來確定最佳嵌入維數(shù)。偽鄰近法對高斯白噪聲也能確定出一個較佳的嵌入維數(shù),因此它不能區(qū)分噪聲和混沌信號。其優(yōu)點(diǎn)是它可以定量給出偽鄰近點(diǎn)百分比(1 nearest neighbor percentage FNNP),從而可以根據(jù)FNNP大小來確定嵌入維數(shù)。
預(yù)先設(shè)定一個Sm值,當(dāng)相空間嵌入維數(shù)從m增加到m+1,則偽鄰近點(diǎn)為滿足下式的點(diǎn)
■(2)
式中,xi(m)、xir(m)分別為嵌入維數(shù)取m時相空間中的相點(diǎn)矢量及其最鄰近點(diǎn), xi+mτ,xir+mτ分別為嵌入維數(shù)增加后,相應(yīng)矢量相點(diǎn)增加的分量。對相空間中的所有相點(diǎn)進(jìn)行偽鄰近點(diǎn)判斷,則偽鄰近點(diǎn)數(shù)目占相點(diǎn)數(shù)目的比例,可以作為時間序列在m維相空間中是否確定性的判據(jù),從而可以根據(jù)偽鄰近點(diǎn)比例趨向于零時的m值,選取合適的重構(gòu)相空間的嵌入維數(shù)。Sm為一個預(yù)先設(shè)定的值,根據(jù)數(shù)值計(jì)算,一般取Sm=10。
5 預(yù)測模型的建立
設(shè){x(t),t=0,1,2…,n}表示要研究的離散時間序列,選擇適當(dāng)?shù)难舆t時間τ和嵌入維數(shù)m對該時間序列重構(gòu)相空間為:
{Y(t)}Y(t)[x(t),x(t+τ),…,x(t+(m-1)τ)],t=0,1,2,…,n-(m-1)τ}(3)
并由Takens嵌入定理知,存在光滑映射f:Rn->R滿足:
x(t+(mτ)=f(Y(t))= f(x(t),x(t+τ),…,x(t+(m-1)τ))(4)
理論上滿足上式的f是唯一的,但是實(shí)際中可用數(shù)據(jù)總是有限的,因而不可能真正求得f,而只能由有限的數(shù)據(jù)構(gòu)造映射■:Rm->R使■充分逼近f。神經(jīng)網(wǎng)絡(luò)用于時間序列預(yù)測,就是構(gòu)造一個神經(jīng)網(wǎng)絡(luò)模型,首先用該神經(jīng)網(wǎng)絡(luò)模型來擬合理論上滿足公式(4)的這種函數(shù)關(guān)系 。然后利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)來推導(dǎo)未來的值,即用時間序列的前m 個值(x(t),x(t-τ),…,x(t-(m-1)τ))去預(yù)測下個值x(t+τ)。
6 實(shí)例計(jì)算
用中南地區(qū)H市2008年2月1日——6月21日的水量數(shù)據(jù)訓(xùn)練,進(jìn)行相空間重構(gòu)和建模,對2008年6月22日—7月7日的水量數(shù)據(jù)進(jìn)行預(yù)測。采用自相關(guān)法計(jì)算延遲時間為7,用GP算法計(jì)算關(guān)聯(lián)維數(shù),用matlab編程,發(fā)現(xiàn)關(guān)聯(lián)維數(shù)到2.03時不再增大,由于混沌時間序列的關(guān)聯(lián)積分是呈指數(shù)衰減的,其關(guān)聯(lián)維數(shù)作為關(guān)聯(lián)積分的冪指數(shù),隨嵌入維數(shù)的增加逐漸趨于一個定值,當(dāng)達(dá)到某個特定的嵌入維數(shù)后,基本不再增大,所以可以判斷該時間序列是混沌序列,然后用Cao法求得嵌入維數(shù)為5。采用 BP神經(jīng)網(wǎng)絡(luò)進(jìn)行擬合和預(yù)測,可取嵌入維為5,延遲時間為7,隱層數(shù)為9,訓(xùn)練2673次之后,得到的用水量實(shí)際值與擬合值見圖1,本文提出的結(jié)合神經(jīng)網(wǎng)絡(luò)和混沌理論的得到預(yù)測值及灰色模型得到的預(yù)測值見表1。
從表1可以看出,用結(jié)合混沌理論和神經(jīng)網(wǎng)絡(luò)的方法對6月22日、23、24、25等日的預(yù)測較為準(zhǔn)確,與灰色模型的預(yù)測結(jié)果相比,本文的預(yù)測結(jié)果整體誤差的指標(biāo)較好,呈現(xiàn)較好的綜合預(yù)測性能。BP神經(jīng)網(wǎng)絡(luò)結(jié)合混沌理論,可以對城市用水量有效的做出正確的短期預(yù)測,其擬合效果好,預(yù)測精度高,而且BP神經(jīng)網(wǎng)絡(luò)本身就是一種辯識模型,結(jié)合混沌理論,很容易確定輸入節(jié)點(diǎn)個數(shù),不需要建立以實(shí)際系統(tǒng)數(shù)學(xué)模型為基礎(chǔ)的預(yù)測模型,可以省去在預(yù)測前對系統(tǒng)建模這一步驟。但是對于長期預(yù)測,目前的結(jié)果其精度還不盡人意.
7 結(jié)論
城市用水量與經(jīng)濟(jì)、人口、生活水平、全天氣象等因素有關(guān),它是一個多因素、多層次的復(fù)雜系統(tǒng),要建立準(zhǔn)確描述這些因素與用水量的回歸分析模型比較困難,但城市用水量的時間序列具備混沌特性,結(jié)合混沌理論和神經(jīng)網(wǎng)絡(luò)理論,建立了基于混沌理論的城市用水量神經(jīng)網(wǎng)絡(luò)模型。該方法需要的訓(xùn)練數(shù)據(jù)較少,通過對用水量時間序列進(jìn)行相空間重構(gòu),通過重構(gòu)相空間的嵌入維數(shù)確定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),選擇神經(jīng)網(wǎng)絡(luò)的最佳輸入模式,解決了一般BP網(wǎng)絡(luò)理論進(jìn)行時間序列預(yù)測難以確定輸入節(jié)點(diǎn)這一關(guān)鍵問題。該方法預(yù)測精度高,方法簡單,可行性強(qiáng),預(yù)測結(jié)果表明,該方法可以對城市用水量進(jìn)行有效短期預(yù)測。
參考文獻(xiàn):
[1] 席劍輝.混沌時間序列的長期預(yù)測方法研究[D].大連理工大學(xué),2005.
[2] 呂金虎,陸君安,陳士華.混沌時間序列分析及其應(yīng)用[M].武漢:武漢大學(xué)出版社,2002.
[3] 趙貴兵,石炎福.從混沌時間序列同時計(jì)算關(guān)聯(lián)維和Kolmogorov熵[J].計(jì)算物理,1999,16(3):309-315.
[4] Rosenstein M T,Collins J J,Deluca C J.A practical method for calculating largest Lyapunov exponents from small data sets[J].Physiccr D,1993(65):117-134.
[5] Packard N H.Geometry from a Time series[J].Phys Rev Lett,1980,45(9):712-716
[6] TAKENS F.On the numerical determination of the dimension of an attractor[C].Dynamical systems and turbu-lence,1981:230-241.
[7] 林嘉宇,王躍平,黃芝平,等.語音信號相空間重構(gòu)中的時間延遲的選擇——復(fù)自相關(guān)法[J].信號處理,1999,15(3),220-225.
[8] 高華東,霍達(dá),陶連金.混沌神經(jīng)網(wǎng)絡(luò)在深基坑開挖側(cè)移預(yù)測中的應(yīng)用[J].工業(yè)建筑,2005,35(4):55-59.
[9] 呂小青,曹彪,曾敏,等.確定延遲時間互信息法的一種算法[J].計(jì)算物理,2006,23(2):184-188.
[10] 陳鏗,韓伯棠.混沌時間序列分析中的相空間重構(gòu)技術(shù)綜述[J].計(jì)算機(jī)科學(xué),2005,32(4):67-70.
[11] Rosenstein M T,Collins J J,De Luca C J.A practical method for calculating largest Lyapunov exponents from small data sets[J].Physica D,1993(65):117-134.
[12] 陸振波,蔡志明,姜可宇.基于改進(jìn)的C-C方法的相空間重構(gòu)參數(shù)選擇[J].系統(tǒng)仿真學(xué)報(bào),2007,19(11):2527-2529.
[13] 郁俊莉,王其文,韓文秀.經(jīng)濟(jì)時間序列相空間重構(gòu)與混沌特性判定研究[J].武漢大學(xué)學(xué)報(bào):理學(xué)版,2004,50(1):33-37.
[14] 任曉華,蔡述明,任憲友.奇異值分解法在湖北省農(nóng)業(yè)土地利用時空變化研究中的應(yīng)用[J].華中師范大學(xué)學(xué)報(bào):自然科學(xué)版,2004,38(4):516-518.
[15] 李小俚,歐陽高翔,關(guān)新平,等.基于EEG模糊相似性的癲癇發(fā)作預(yù)測[J].中國生物醫(yī)學(xué)工程學(xué)報(bào),2005,25(3):346-349.
[16] Grassberger P, Procaccia I. Measuring the strangeness of strange attractors[J].Physica D,1983(9):189-208.