崔惠敏,薛惠鋒,王 磊,趙臣嘯
(1.西安理工大學(xué),西安 710000; 2.中國航天系統(tǒng)科學(xué)與工程研究院,北京 100048)
國家“十三五”規(guī)劃綱要明確提出“實(shí)行最嚴(yán)格的水資源管理制度,以水定產(chǎn)、以水定城,建設(shè)節(jié)水型社會(huì)”等要求。水資源分布不均衡、配置機(jī)制不完善等問題制約著我國節(jié)水型社會(huì)的建設(shè)進(jìn)程,面向決策支持的用水量預(yù)測研究是水資源優(yōu)化配置的數(shù)據(jù)支撐,是水資源應(yīng)用研究的重要組成部分[1]。現(xiàn)有文獻(xiàn)中存在許多用水量相關(guān)預(yù)測方法,適用于地區(qū)水資源合理配置。其中,短時(shí)間內(nèi)日用水量預(yù)測多用于供水系統(tǒng)的優(yōu)化調(diào)度和設(shè)備檢測管理,年度中長期用水量預(yù)測多用于對(duì)城市建設(shè)、生態(tài)保護(hù)提出決策建議。
國外研究者對(duì)于水資源趨勢預(yù)測分析更多的是對(duì)算法進(jìn)行優(yōu)化。G-CHEN等[2]提出了一種多隨機(jī)森林模型,集成小波變換和隨機(jī)森林回歸(W-RFR)用于城市用水量的預(yù)測。使用離散小波變換(DWT)分解,并用隨機(jī)森林回歸(RFR)方法對(duì)每個(gè)子系列進(jìn)行預(yù)測。LCP Velasco等[3]利用人工神經(jīng)網(wǎng)絡(luò)(ANN)分析城市用水決策數(shù)據(jù),使用Neuroph Studio進(jìn)行數(shù)據(jù)準(zhǔn)備、模型模擬和預(yù)測結(jié)果的測試。TMF Jr等[4]利用滯后的天氣狀況歷史數(shù)據(jù)和以前記錄的用水量來預(yù)測8個(gè)區(qū)域的需求量。國內(nèi)研究者在預(yù)測方面研究了相關(guān)因素對(duì)用水量的影響。李斌等[5]預(yù)測短期市區(qū)供水系統(tǒng)用水量,使用組合預(yù)測權(quán)重系數(shù)優(yōu)化指標(biāo),并對(duì)灰色-神經(jīng)網(wǎng)絡(luò)的二元組合進(jìn)行求解。郭磊等[6]分析了總用水量與地區(qū)生產(chǎn)總值的負(fù)相關(guān)性,構(gòu)建了基于相關(guān)性分析結(jié)果,構(gòu)建了基于經(jīng)濟(jì)、人口為自變量的趨勢模型。景亞萍等[7]分析比較不同預(yù)測模型使用效果,構(gòu)建組合灰色神經(jīng)網(wǎng)絡(luò)預(yù)測模型,并運(yùn)用馬爾科夫鏈進(jìn)行修正,獲得高精確度的預(yù)測值。王開章等[8]運(yùn)用灰色理論模型,通過精度檢驗(yàn),不斷進(jìn)行模型修正,對(duì)水源地的水質(zhì)變化趨勢進(jìn)行了預(yù)測分析。
綜上,現(xiàn)有水資源預(yù)測模型的算法包含許多智能算法,其中在選擇預(yù)測所用的影響因子時(shí),論證不夠充分、合理,主要依賴于一些定性分析。統(tǒng)計(jì)指標(biāo)涵蓋了多項(xiàng)影響因素,歷史數(shù)據(jù)反映出各因素對(duì)用水量指標(biāo)產(chǎn)生的復(fù)雜影響。構(gòu)建完備、適合的指標(biāo)模型,有利于分析影響用水量的關(guān)鍵因素,從而可以更全面、準(zhǔn)確地預(yù)測用水量,為水資源管理決策提供完備、高效、準(zhǔn)確的定量數(shù)據(jù)支撐。本文采用定性與定量相結(jié)合的方法[9],針對(duì)統(tǒng)計(jì)數(shù)據(jù),應(yīng)用DEMATEL(Decision Making Trial and Evaluation Laboratory,決策試驗(yàn)評(píng)估實(shí)驗(yàn)室)方法作定性分析,應(yīng)用皮爾遜相關(guān)系數(shù)作定量分析,對(duì)與用水量相關(guān)的指標(biāo)進(jìn)行分析篩選,利用BP神經(jīng)網(wǎng)絡(luò)3層結(jié)構(gòu)模型對(duì)年度用水量進(jìn)行預(yù)測,為國家資源宏觀調(diào)控提供數(shù)據(jù)支撐。
皮爾遜相關(guān)系數(shù)PPCs(Pearson correlation coefficient)是由統(tǒng)計(jì)學(xué)家卡爾·皮爾遜在前人的基礎(chǔ)上改進(jìn)得出的。皮爾遜相關(guān)系數(shù)用于定量地衡量變量間相關(guān)程度,標(biāo)準(zhǔn)值介于-1到1之間。針對(duì)2個(gè)變量之間的皮爾遜相關(guān)系數(shù),函數(shù)定義為變量協(xié)方差與標(biāo)準(zhǔn)差的商值,計(jì)算公式如下:
(1)
式中:R為相關(guān)系數(shù);X與Y分別表示2個(gè)用于比較的變量。
皮爾遜相關(guān)系數(shù)已經(jīng)應(yīng)用于異常檢測、醫(yī)學(xué)信號(hào)相關(guān)度測量、光熱試驗(yàn)影響分析等多種研究領(lǐng)域[10-12]。
1971年Bottele為研究解決現(xiàn)實(shí)世界里復(fù)雜問題,提出了DEMATEL方法論。該理論運(yùn)用圖論以及矩陣工具進(jìn)行系統(tǒng)要素分析,判斷要素間強(qiáng)弱的因果關(guān)系[13],充分利用專家的知識(shí)與經(jīng)驗(yàn)來處理復(fù)雜的問題,通過篩選主要的影響因素,從而實(shí)現(xiàn)對(duì)系統(tǒng)結(jié)構(gòu)的簡化分析。方法實(shí)現(xiàn)需要進(jìn)行以下步驟:
(1)確定不同因素間的關(guān)聯(lián)關(guān)系,構(gòu)建直接影響矩陣,并進(jìn)行規(guī)范化處理。
(2)
(2)規(guī)范化直接影響矩陣G,計(jì)算系統(tǒng)影響因素指標(biāo)間的綜合影響矩陣T。
(3)
T=G+G2+…+Gn
(4)
T=G(I-G)-1
(5)
一般情況下選擇公式(2)計(jì)算綜合影響矩陣,但當(dāng)我們所需分析的指標(biāo)數(shù)量足夠多時(shí),我們也可以采用公式(3)進(jìn)行近似計(jì)算。
(3)計(jì)算指標(biāo)的影響度fi與被影響度ei。
(6)
(7)
(4)計(jì)算指標(biāo)的中心度與原因度。中心度的計(jì)算方法是將影響度與被影響度相加。對(duì)于研究對(duì)象而言,獲得的中心度數(shù)值越大,影響力表現(xiàn)越大,反之則越小。原因度是將影響度與被影響度相減,當(dāng)2者數(shù)值大于零時(shí),則該因素為原因因子,反之則為結(jié)果因子。
mi=fi+ei
(8)
ni=fi-ei
(9)
BP神經(jīng)網(wǎng)絡(luò)是一種采用誤差反向傳播原理的前饋神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)方式是將輸入與輸出的映射轉(zhuǎn)變成一個(gè)非線性優(yōu)化的問題,使用梯度下降算法,多層迭代修正網(wǎng)絡(luò)結(jié)構(gòu)間的權(quán)重,從而使得預(yù)測值與實(shí)際值間相對(duì)誤差逐漸減少。網(wǎng)絡(luò)結(jié)構(gòu)由3層構(gòu)成,分別是輸入層、隱含層、輸出層。其網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)見圖1。

圖1 BP神經(jīng)網(wǎng)絡(luò)拓?fù)鋱D
現(xiàn)有文獻(xiàn)在影響用水量指標(biāo)分析上,普遍選取了人口、工業(yè)水平、人民生活水平以及社會(huì)經(jīng)濟(jì)水平、氣候變化等因素。《變化環(huán)境下城市用水量影響因子識(shí)別》一文[14]認(rèn)為東莞市用水量影響因子涵蓋年末總?cè)丝凇DP、農(nóng)業(yè)總產(chǎn)值、工業(yè)總產(chǎn)值、第三產(chǎn)業(yè)增加值、年平均氣溫、年降雨量、降雨量大于0.1 mm的天數(shù)和日照時(shí)數(shù)等。《免疫進(jìn)化算法和投影尋蹤耦合的水資源需求預(yù)測》[15]一文認(rèn)為用水量與GDP、工業(yè)總產(chǎn)值、農(nóng)業(yè)總產(chǎn)值、有效耕地面積、實(shí)灌耕地面積、農(nóng)業(yè)用水系數(shù)、城鎮(zhèn)人口、農(nóng)村人口、城鎮(zhèn)供水利用系數(shù)、牲畜數(shù)量、水重復(fù)利用率、居民人均可支配收入等指標(biāo)關(guān)聯(lián)性較高。王麗霞、任志遠(yuǎn)、孔金玲等人[16]選取工業(yè)生產(chǎn)總值、農(nóng)業(yè)生產(chǎn)總值、人均GDP、城鎮(zhèn)人口數(shù)、農(nóng)村人口數(shù)、萬元工業(yè)產(chǎn)值用水量、萬元農(nóng)業(yè)產(chǎn)值用水量、人均日生活用水量、農(nóng)田有效灌溉面積、牲畜量、居民生活、農(nóng)業(yè)生產(chǎn)和工業(yè)生產(chǎn)總用水量等10個(gè)因子作為延河流域用水量預(yù)測的關(guān)鍵驅(qū)動(dòng)因素。
本文在已有研究的基礎(chǔ)上,通過文獻(xiàn)整理與網(wǎng)絡(luò)調(diào)查歸納出廣東省地級(jí)市水資源統(tǒng)計(jì)數(shù)據(jù)在人口、經(jīng)濟(jì)、地理、水資源4個(gè)層面共28種影響因素,并用A1、A2、…、G27、G28分類表示,結(jié)果見表1。依據(jù)研究地區(qū)的特定屬性以及普遍認(rèn)可的用水量預(yù)測的普適因子進(jìn)行匯總。

表1 統(tǒng)計(jì)指標(biāo)匯總
水資源受人口、經(jīng)濟(jì)、地理等多種因素影響。其中,既存在與用水量高度相關(guān)的指標(biāo),也存在關(guān)聯(lián)度較弱的指標(biāo)。本文采用從定性到定量的綜合集成方法對(duì)指標(biāo)進(jìn)行篩選,構(gòu)建科學(xué)合理的與用水量關(guān)聯(lián)的指標(biāo)體系。
2.2.1 數(shù)據(jù)來源
統(tǒng)計(jì)28個(gè)指標(biāo)因素在廣州的原始數(shù)據(jù),為確保所有指標(biāo)均有數(shù)據(jù),時(shí)間范圍劃定為2005-2016年。數(shù)據(jù)來源為廣州市統(tǒng)計(jì)局統(tǒng)計(jì)年鑒、廣州市水務(wù)局水資源公報(bào)。
2.2.2 定性分析篩選
用DEMATEL方法對(duì)指標(biāo)進(jìn)行定性分析,定量描述。
首先以5級(jí)量表法對(duì)不同指標(biāo)間相關(guān)性進(jìn)行打分,得出初始的直接影響矩陣。指標(biāo)因素i對(duì)j的影響層級(jí)分為5級(jí),強(qiáng)相關(guān)、較強(qiáng)相關(guān)、一般相關(guān)、較弱相關(guān)、無關(guān),每層對(duì)應(yīng)的分?jǐn)?shù)分別是7、5、3、1、0,對(duì)屬于層級(jí)之間的關(guān)系,以2、4、6給予評(píng)分。在此次調(diào)查中,專家組由7名長期從事水資源研究工作的人員組成。其中包括2名國家水利部工作人員、3名省級(jí)水利廳工作人員、2名高校水資源專業(yè)教授。將打分表取平均值,對(duì)小數(shù)部分進(jìn)行四舍五入,保留到整數(shù)位。根據(jù)公式(3)進(jìn)行矩陣的規(guī)范化處理,根據(jù)公式(5)計(jì)算綜合影響矩陣。
根據(jù)得到的綜合影響矩陣,依照公式(6)、(7)分別計(jì)算指標(biāo)間的影響度與被影響度,進(jìn)而得出指標(biāo)間關(guān)系的中心因子與原因因子。在笛卡爾坐標(biāo)系中,依據(jù)因素指標(biāo)的中心度與原因度標(biāo)記出每個(gè)因素所處的位置,分析不同水資源指標(biāo)在用水量預(yù)測中的重要性。由于主要考慮的是指標(biāo)的影響程度,因此以中心度的值作為計(jì)算數(shù)據(jù)進(jìn)行后續(xù)計(jì)算。
2.2.3 定量分析篩選
從指標(biāo)的真實(shí)數(shù)據(jù)入手開展指標(biāo)關(guān)聯(lián)分析,分析冗余性。運(yùn)用皮爾遜相關(guān)系數(shù)計(jì)算匯總指標(biāo)與用水量關(guān)聯(lián)程度并排序,從而篩選出高關(guān)聯(lián)度的指標(biāo)作為預(yù)測的參考因素。
首先對(duì)數(shù)據(jù)進(jìn)行無量綱化處理,每一個(gè)指標(biāo)除以該列最大值。其次選擇用水量作為參考數(shù)據(jù),其余28項(xiàng)指標(biāo)依次作為對(duì)比數(shù)據(jù),依照公式(1)計(jì)算皮爾遜相關(guān)系數(shù)。
考慮專家意見具有較強(qiáng)的隨機(jī)性,將定性分析得到的中心度和定量分析得到的相關(guān)系數(shù)分別以40%、60%比例加和,將計(jì)算結(jié)果按照從高到低的順序依次排列,結(jié)果見表2。計(jì)算取值范圍的中位數(shù),結(jié)果為0.815 5。選擇影響程度綜合排名高于0.815 5的指標(biāo)因素作為預(yù)測時(shí)的考量信息。

表2 指標(biāo)篩選結(jié)果

續(xù)表2 指標(biāo)篩選結(jié)果
2.3.1 BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型
(1)統(tǒng)計(jì)數(shù)據(jù)處理。為了體現(xiàn)趨勢動(dòng)態(tài)變化過程,分析用水量變動(dòng)特征,從而更好地進(jìn)行預(yù)測,不直接采用歷年的直接統(tǒng)計(jì)數(shù)據(jù)作為考量信息,而是首先計(jì)算統(tǒng)計(jì)數(shù)據(jù)的同比變化率pi,作為預(yù)測模型的輸入量。
pi=(xi-xi-1)/xi
(10)
式中:xi為第i年用水量。
(2)歸一化處理。統(tǒng)計(jì)數(shù)據(jù)屬于不同的量級(jí),應(yīng)首先對(duì)原始的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行歸一化處理,選擇mapminmax歸一化函數(shù)分別對(duì)訓(xùn)練集的輸入輸出矩陣、測試集的輸入輸出矩陣進(jìn)行處理,將其數(shù)值歸一化到[-1,1]。
(3)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)定。神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)將直接影響網(wǎng)絡(luò)預(yù)測結(jié)果的準(zhǔn)確性。網(wǎng)絡(luò)輸入層包含的14個(gè)節(jié)點(diǎn)分別對(duì)應(yīng)于本文所提出的指標(biāo)體系中的14個(gè)指標(biāo)。輸出層共包含1個(gè)節(jié)點(diǎn),輸出用水量預(yù)測值。

(4)結(jié)果評(píng)價(jià)。將預(yù)測出的同比變化率轉(zhuǎn)化為實(shí)際的用水量數(shù)據(jù),使用相對(duì)誤差和決定系數(shù)進(jìn)行結(jié)果評(píng)價(jià),相對(duì)誤差越小,精確度越高,決定系數(shù)越接近1,擬合效果越好。計(jì)算公式如下:
(11)
(12)

2.3.2 參照對(duì)比賦權(quán)指數(shù)平滑法
水資源統(tǒng)計(jì)數(shù)據(jù)具有時(shí)序性,在對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測時(shí)要充分考慮其時(shí)間價(jià)值。一般認(rèn)為距離預(yù)測時(shí)間較近的數(shù)據(jù)擁有更高的時(shí)間價(jià)值。因此在預(yù)測分析時(shí)對(duì)各個(gè)時(shí)期的數(shù)據(jù)賦予不同的使用權(quán)重[18]。
假設(shè)當(dāng)前時(shí)間為t,各觀測時(shí)間的用水量記為X1,X2,…,Xt,進(jìn)行連續(xù)n個(gè)時(shí)期的時(shí)序記錄,下一時(shí)期將預(yù)測t+1階段的數(shù)值Xt+1,不同時(shí)段數(shù)據(jù)的時(shí)間價(jià)值權(quán)重依次表示為:
(13)
進(jìn)行歸一化處理的結(jié)果:
(14)
預(yù)測計(jì)算公式:
(15)
(n≥2)
(1)BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型。2005-2016年的統(tǒng)計(jì)數(shù)據(jù)包含12條信息,首先計(jì)算2006-2016年指標(biāo)變化率pi,得出11條信息作為基本指標(biāo)。將前一年的14項(xiàng)基本指標(biāo)變化率作為輸入,當(dāng)年的用水量變化率作為輸出,一共構(gòu)成11條樣本。選擇其中9條樣本作為訓(xùn)練集,以整體樣本作為測試集。經(jīng)過多次調(diào)試,當(dāng)隱含層的節(jié)點(diǎn)數(shù)為10時(shí),模型預(yù)測效果最好。調(diào)用MATLAB工具箱,選擇節(jié)點(diǎn)數(shù)為14-10-1模型,設(shè)置相關(guān)參數(shù),迭代次數(shù)設(shè)置為50次,訓(xùn)練目標(biāo)為1e-8,學(xué)習(xí)率為0.01。將模型計(jì)算出的年度預(yù)測變化率轉(zhuǎn)化為用水量,并計(jì)算與實(shí)際用水量之間的相對(duì)誤差和決定系數(shù)。
(2)賦權(quán)指數(shù)平滑法。利用模型公式,代入用水量歷史數(shù)據(jù)進(jìn)行計(jì)算,得到結(jié)果見表3。
比較BP神經(jīng)網(wǎng)絡(luò)預(yù)測方法與賦權(quán)指數(shù)平滑法在用水量預(yù)測上的準(zhǔn)確度,作為預(yù)測結(jié)果的分析依據(jù)。
圖2為BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果與實(shí)際值的比較,圖3為BP神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練樣本的擬合效果,可以看出BP神經(jīng)網(wǎng)絡(luò)能很好地?cái)M合用水量趨勢變化量。
已有文獻(xiàn)中通常基于指標(biāo)原始數(shù)據(jù)對(duì)用水量進(jìn)行預(yù)測,這種方法往往無法體現(xiàn)用水量動(dòng)態(tài)變化趨勢,利用變化率預(yù)測能夠更好地體現(xiàn)這一狀態(tài),且用水量變化率包含多級(jí)小數(shù)位,對(duì)于誤差的逆向傳播提供了更高的精確度。本文以用水量年變化率pi與上年度用水量的乘積表征用水量預(yù)測值,能夠更好地滿足用水量預(yù)測的精度要求。

表3 預(yù)測結(jié)果分析

圖2 測試結(jié)果與實(shí)際值對(duì)比

圖3 BP神經(jīng)網(wǎng)絡(luò)對(duì)訓(xùn)練樣本的擬合效果
表3是測試用水量預(yù)測結(jié)果對(duì)比。原始數(shù)據(jù)從2005年開始,計(jì)算后的同比變化率從2006年開始,分析前述評(píng)價(jià)指標(biāo),其中決定系數(shù)為0.942 6,相對(duì)誤差見表3,相對(duì)誤差為0.000 1~0.003 3,取得較高的準(zhǔn)確度,說明神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)模型適合用于多統(tǒng)計(jì)指標(biāo)的以年為基本單元的中長期用水量預(yù)測。
依據(jù)相對(duì)誤差的比較,BP神經(jīng)網(wǎng)絡(luò)與賦權(quán)指數(shù)法2者的相對(duì)誤差在精確度上超過2個(gè)數(shù)量級(jí),BP神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢格外顯著。賦權(quán)指數(shù)平滑法在試驗(yàn)過程中,雖然給予時(shí)間序列數(shù)據(jù)以遞增的權(quán)重,但對(duì)于以年為單位的較大用水量數(shù)值,即使是個(gè)位數(shù)的變動(dòng)對(duì)整體也有很大影響,單純數(shù)理上的加和缺乏科學(xué)性、合理性。
BP神經(jīng)網(wǎng)絡(luò)的合理應(yīng)用離不開輸入層指標(biāo)的設(shè)置,將影響用水量的指標(biāo)通過定性與定量相結(jié)合的方法進(jìn)行篩選。從篩選結(jié)果上看,影響用水量的主要指標(biāo)集中在人口因素、經(jīng)濟(jì)因素上,地理因素雖然會(huì)對(duì)水資源產(chǎn)生影響,但因?yàn)槠渥陨頎顟B(tài)的穩(wěn)定性,趨勢變化不明顯,對(duì)于用水量的預(yù)測參考價(jià)值低。另外,用水量數(shù)據(jù)出現(xiàn)連年下降的趨勢,降幅比例沒有明顯變動(dòng)規(guī)律,但下降趨勢非常穩(wěn)定。本文分析研究了廣州市用水量統(tǒng)計(jì)數(shù)據(jù),發(fā)現(xiàn)工業(yè)用水在用水總量中占據(jù)較大比重,而用水總量持續(xù)下降,反映出廣州市的水資源利用效率伴隨經(jīng)濟(jì)社會(huì)發(fā)展持續(xù)提高。
為保障資源的合理利用,采用準(zhǔn)確、高效的預(yù)測方法對(duì)用水量進(jìn)行預(yù)測至關(guān)重要。對(duì)于大量的歷史統(tǒng)計(jì)數(shù)據(jù),本文提出一種更全面、準(zhǔn)確的基于PCCs-DEMATEL指標(biāo)篩選的BP神經(jīng)網(wǎng)絡(luò)用水量預(yù)測模型。使用廣東省廣州市統(tǒng)計(jì)數(shù)據(jù)作為基礎(chǔ)數(shù)據(jù)進(jìn)行實(shí)證研究,與傳統(tǒng)的、單一的基于時(shí)間序列的賦權(quán)指數(shù)平滑法進(jìn)行比較分析,證實(shí)了本文提出的模型方法更具優(yōu)越性。本文提出的這種研究模型也可以應(yīng)用到水資源其他關(guān)鍵指標(biāo)的預(yù)測分析上,比如廢水指標(biāo)中的入河廢污水量、廢污水排放量等,從而可以根據(jù)預(yù)測結(jié)果進(jìn)行除污設(shè)備有效設(shè)置、突發(fā)事故預(yù)防等先決性工作指示。水資源相關(guān)指標(biāo)的預(yù)測工作為國家實(shí)施最嚴(yán)格水資源管理制度提供了定性與定量相結(jié)合的、可靠的數(shù)據(jù)支撐。