鄭浩然 潘雨青 李世偉 徐愛平
1 (江蘇大學計算機科學與通信工程學院 江蘇 鎮江 212000) 2(常州安控電器成套設備有限公司 江蘇 常州 213300)
隨著城市建設加快,高層建筑日益增多,二次供水設施已成為城市供水管網建設中不可缺少的一部分。然而,在當前的二次供水方案中,仍然存在一定的安全隱患,例如因設定不合理的壓力導致供水主管網在部分地區產生負壓,影響供水管網的安全[1]。研究對二次供水設施進行遠程監控、狀態預測及智能遠程控制具有以下的意義:
(1) 實時傳輸管網數據使得管理員能夠及時掌控現場信息;
(2) 狀態預測及故障判定能夠為巡檢與維修人員提供參考;
(3) 通過了解小區內的用水情況,能夠制定更合適的管網控制策略,從而降低整體的能耗并提高設備的壽命。
當前,已有較多人從不同的方面對管網供水進行了研究。
在對供水設施的遠程監控方面,通常是采用SCADA系統(Supervisory control and data acquisition system),即數據采集與監視控制系統。在SCADA系統構建方面,廖曙江等[2]構建了基于GPRS、無線射頻傳輸及CAN總線等遠程建筑消防水壓實時監控系統。付剛等[3]利用GPRS遠傳模塊和水壓監測裝置等建立了二次供水管理系統,并將其用于聊城市二次供水。在上述系統中,雖然都對數據進行了采集,但是數據未能被充分挖掘,也并未涉及到如何通過分析數據來影響下一步對管網的控制過程。
在對供水設施的狀態預測方面,練庭宏等[4]使用ARIMA模型對月度水需求進行預報。在文獻[5]中,Mahmut Firat等通過人工神經網絡技術對月度需水量進行了預測。
在上述的方案中,文獻[4-5]均是以月為周期進行分析,屬于中長期的預測,中長期的預測結果往往難以直接體現在遠程控制的過程中。而在本文的方案中采用24小時作為分析的周期,預測的速度能夠達到小時,即能夠預測下一個小時的用水狀態。本文方案提高了預測的實時性,使得預測結果更適用于實時的遠程控制。
為了進一步挖掘所預測結果的價值,本文提出,將預測的結果用于協助判定管網所存在的狀態異常。這是由于通常爆管等異常都伴隨著水壓等明顯變化[6],此時,水壓通常會大幅度偏離正常值。
在對供水管網的異常檢測方面,有較多人已經進行了研究。程偉平等[7]將加權最小誤差法用于供水管網的爆管水力模型的建立,Wu等[8]運用數據驅動的聚簇算法來進行爆管檢測。Christopher Hutton等[9]提出了基于貝葉斯需求預測方法的供水系統的實時爆管檢測方案;文玉梅等[10]對聲信號頻率分布和復雜度進行了分析,并將譜寬參數和近似熵用于供水管道泄漏辨識。
上述方案為異常檢測與定位提供了實現手段。但對于上述方案,通常對歷史數據的規模及傳感器的精度與數量有較高的要求。本方案適合用于小區的供水預測、異常檢測及遠程控制的原因如下: ARIMA模型所需要的歷史數據量較少;使用PLC采集常規的數據如進水壓力、頻率、功率即可,無需采集聲音等信息,成本較低,便于實施;本模型的預測速度快,能夠及時發現小區供水管網中存在的異常。并能夠及時通知管理員去現場排查問題,或直接通過服務器進行遠程控制,并通知相關人員及時到現場進行查看。
通過將物聯網技術、時間序列分析技術及遠程控制技術運用到無負壓供水的監控與反饋控制中,能夠對小區供水進行實時預測,并能及時發現供水管網的異常及進行遠程反饋控制,在保障了系統安全的同時,降低了運維成本,具有顯著的經濟效益及社會效益。
時間序列是指將同一統計指標的數值按其發生的時間先后順序排列而成的數列。時間序列分析的主要目的是根據已有的歷史數據對未來進行預測,其被廣泛應用于經濟預測、用電量預測、天氣預報及地震預報等。
ARIMA模型全稱為自回歸求和滑動平均模型(Autoregressive Integrated Moving Average Model),是一種著名的時間序列預測模型。該模型首先對原始時間序列進行平穩化處理,再對平穩化后的時間序列建立自回歸滑動平均模型,通過有效性檢驗的模型將能被用于時間序列預測。對于ARIMA模型,通常分為非季節性ARIMA模型與季節性ARIMA模型。其中,季節性ARIMA模型適合用于具有明顯的周期性特征的時間序列。
季節性ARIMA模型是引入了季節項的ARIMA模型。也就是說,季節性ARIMA包含了非季節項和季節項。該模型可以寫作ARIMA(p,d,q)×(P,D,Q)S。其中,p為非季節性自回歸階數,d為非季節性差分階數,q為非季節性移動平均階數,P為季節性自回歸階數,D為季節性差分階數,Q為非季節性移動平均階數,S為有重復模式的周期。
當考慮差分運算時,上述季節性ARIMA模型可以寫作:
(1)
式中:wt為獨立擾動或隨機誤差;B為后移算子,有Bxt=xt-1;▽為差分算子,其中▽xt=xt-xt-1=(1-B)xt,因此有▽=1-B,進一步有▽d=(1-B)d。
(1)φp(B)為p階非季節性自回歸運算符,其定義為φp(B)=1-φ1B-…-φpBp。
(2)θq(B)為q階非季節性移動平均運算符,其定義為θq(B)=1+θ1B+…+θqBq。
(3) ▽d為d階非季節性差分運算符,其定義為▽d=(1-B)d。
(4)ΦP(BS)為以S為周期的時間序列的P階季節性自回歸運算符,其定義為ΦP(BS)=1-Φ1BS-…-ΦPBPS。
(5)ΘQ(BS)為以S為周期的時間序列的Q階季節性移動平均運算符,其定義為ΘQ(BS)=1+Θ1BS+…+ΘQBQS。


在上述的季節性時間序列中:


(3)ΘQ(BS)θq(B)wt為移動平均項。
在對季節性ARIMA模型的模型識別過程中,關鍵是對p、d、q和P、D、Q進行定階,并對各φ、θ、Φ、Θ所對應的參數進行估計。經過上述步驟,最終得到的模型將能被用于時間序列預測。
當對于ARIMA(0,1,1)×(0,1,1)12,根據季節性ARIMA模型公式可得:
整理可得:
xt=xt-1+xt-12-xt-13+wt+θ1wt-1+
Θ1wt-12+θ1Θ1wt-13
式中:θ1和Θ1為需要進一步估計的參數,常用的估計方法有矩估計[11]、最小二乘估計[12]及最大似然估計[13]等。
步驟如下:
(1) 對數據進行預處理,并畫出時間序列圖。
(2) 對時間序列平穩性進行識別,包含對非平穩時間序列的平穩化處理。
(3) 對第(2)步中的非白噪聲時間序列進行模型識別與模型定階。
(4) 對第(3)步所得到的模型進行參數估計。
(5) 對第(4)步所產生的模型進行檢驗,如果檢驗通過,則轉至步驟(6),否則轉至步驟(3)。
(6) 根據第(5)步中的模型,建立預測模型,并將其用于實際預測。
ARIMA 模型的建模流程如圖1所示。

圖1 ARIMA模型建模流程圖
通過物聯網技術,使用數據透傳模塊來實現對供水設備的實時運行數據采集及遠程控制。其中,數據透傳模塊具有串口通信及網絡通信的功能,其通過串口接收PLC所采集的數據或向PLC發送遠程控制命令,并使用以太網或GPRS與服務器進行數據及命令交互。服務器負責對歷史數據及實時數據的統計分析,并根據分析結果發送控制命令給數據透傳模塊,以實現對工控現場的智能控制。
在數據分析階段,首先對數據進行預處理并繪制所需的圖形。樣本數據如表1所示。

表1 用于分析的樣本數據
在對所采集的數據經過預處理等操作之后,建立如圖2所示的時間序列圖。從圖上可以看出,各類數據具有明顯的周期性,下面將進一步分析。


圖2 運行數據的時間序列圖
通過對所采集的數據以24小時為周期建立如圖3所示的月份圖,可以觀察到每個參數本身及各個參數之間存在如下的相關性:
(1) 通過進水壓力曲線(圖3(a))可以看出,水壓在0點至5點之間時處于較高水平(0.4 MPa),在5點到8點之間水壓存在明顯的下降,而在下午3點到晚上8點之間的水壓也存在下降的趨勢。該趨勢符合文中小區的用水規律,即:早上5點之后漸漸進入用水高峰期,在15點之后又有一輪用水小高峰。
(2) 通過頻率曲線(圖3(c))可以看出,其與進水壓力呈現明顯的負相關。原因是:當進水壓力低時,需要升高變頻器的頻率;當進水壓力高時,需要降低頻率,這兩個因素相互影響。頻率調節的目的是為了保證出水壓力的穩定。
(3) 通過出水壓力曲線(圖3(b))可以看出,出水壓力在進水壓力和頻率的共同影響下,處于穩定(水壓位于0.449 5 MPa與0.449 9 MPa之間)。
(4) 通過功率曲線(圖3(d))可以看出,其與變頻器的頻率存在明顯的正相關。原因是運行頻率的升高將導致功率的上升。

圖3 各數據的月份圖(monthplot)
通過上述分析,可知各個參數之間存在一些相關性,為了降低建模的復雜度,提升預測的效率,故在下文中對各個參數之間的相關度進行計算。由于所采集的頻率和功率與進水壓力呈現明顯的負相關,因此已提前對它們的符號進行了處理 (頻率和功率取負值后再進行計算),以便于在相關圖進行排序。表2給出了各變量的相關系數矩陣。

表2 各變量的相關系數矩陣
相關系數矩陣通常不易觀察,故繪制如圖4所示的相關圖,以便直觀地查看不同變量之間的相關性。在本方案中,采用相關度較高的運行頻率(或進水壓力) 進行分析。

圖4 各變量的相關圖
圖5是根據本時間序列數據繪制的小提琴圖。小提琴圖結合了箱線圖和核密度圖的優點,即:箱線圖僅僅顯示了平均值、中位數、四分位數范圍等統計數據,而小提琴圖則顯示了數據的完整分布情況。從圖5可以看出,對于每天某個固定的時間點,其進水壓力呈現正態分布。該特點為下文中根據標準分數z來判斷管網異常的發生提供了依據。

圖5 樣本序列的小提琴圖
當前,在供水量預測方面,所采用的典型方法與模型有回歸分析法、ARIMA模型、人工神經網絡、灰色預測模型、機器學習模型及組合預測模型等[14]。
ARIMA模型常被用于供水預測,其適合用于具有明顯周期性、趨勢性等特性的數據。對于非頻繁變化的系統,采集的歷史數據越多,預測的精度越高。使用ARIMA模型時,對供水的實時數據采集有較大的要求。本方案中已經實現了對工控現場的實時供水數據的采集,為ARIMA模型的數據源提供了保證。
通過分析本方案中所采集數據,由于其具有明顯的周期性,且季節性ARIMA模型能夠滿足遠程控制的預測需求,故采用季節性ARIMA模型進行后續分析。
2.3.1 ARIMA模型的階數識別
在對季節性ARIMA模型的階數識別及參數估計上,通常采用Box-Jenkins方法。該方法主要考察數據的自相關函數(ACF)、偏相關函數(PACF)及周期S,其中,周期S通常與實際息息相關,如以月、天、小時為周期。
在確定本模型的季節項上,對其繪制如圖6所示的ACF圖。從圖中可以看出,該序列在 24、48、72 等處有明顯的峰值。上述特征與供水的實際情況相符,故下文中使用 24 作為模型的季節項。

圖6 樣本序列的小提琴圖進水壓力的ACF圖
關于季節性ARIMA模型中的差分階數d和季節差分階數D的選取,通常可以采用試探的做法,也可以利用信息準則。在采取試探的方案時,通常對差分階數d,D選擇較低的數值(如1、2、3)。
當采用信息準則時,典型的方案是選擇AIC準則(Akaike Information Criterion)、AICc準則(corrected AIC)或BIC準則(Bayesian Information Criterion)來進行判斷。
在上述的信息準則中,本方案采用AIC信息準則來確定模型的階數。AIC 準則函數如公式:
AIC=-2log(L)+2(p+q+k+1)
(2)
式中:L為數據的極大似然度,k為獨立參數個數。
通過使AIC最小化,能夠得到合適的模型階數。在確定了模型的階數之后,通常采用最大似然估計和無約束最小二乘估計等方式來對各模型參數進行估計。
2.3.2 對樣本數據建立季節性ARIMA模型
表3是本實驗中對樣本數據進行ARIMA模型識別的部分數據。

表3 ARIMA模型識別
在本方案中,選擇AIC數值最小的模型作為預測模型。根據上述的選區方案,文中所選擇的季節性ARIMA模型為ARIMA(3,0,1)×(1,1,1)24,該模型所對應的σ2為0.404 9,AIC為284.850。
由上述模型所計算的預測結果樣例如表4所示。該預測結果將被用于異常判定。異常判定即:根據所建立的預測模型,將預測的實時數值與實際的實時數值進行對比。若超過了相應的閾值,則可認為發生了異常。其中的閾值可以根據標準分數z來進行設定。

表4 ARIMA(3,0,1)×(1,1,1)24的擬合結果
根據公式z=(v-vapprox)/σ,可以得到z的數值。式中:v為該時間點的實際值,vapprox為該時間點的預測值,σ為該時間序列的歷史數據的標準差。
服務器可以根據歷史數據的統計情況及遠程控制策略來設定z的閾值范圍。
表4中同時給出了預測結果的百分比誤差δ。
(3)
圖7是對供水管網的運行頻率的預測擬合圖。通過該圖及上述的表4可以看出,文中的季節性ARIMA
模型ARIMA(3,0,1)×(1,1,1)24能很好地擬合測試數據。

圖7 運行頻率預測擬合圖
通過對所采集的數據進行數據預處理,對供水管網的實時數據及歷史數據的分析,建立季節性ARIMA模型并進行預測。實驗結果表明,得到的季節性ARIMA模型能夠有效地對小區的供水狀況進行預測。該方法具有較好實際應用價值,可以為降低小區供水的運維成本提供參考。在后續工作中,可以根據預測供水情況,通過遠程智能控制等手段,實現更高效的遠程控制,以進一步提升系統的整體效率,達到節能的目的。
[1] 韓曉峰,丁莉芬.淺析遠程監控系統在城市二次供水管理中的應用[J].給水排水,2014(4):120-123.
[2] 廖曙江,刑佳佳,陳睿迪,等.基于物聯網技術的遠程建筑消防水壓實時監控系統[J].自動化與儀器儀表,2012(5):16-17,20.
[3] 付剛,朱晨光,劉彥華.基于遠程控制技術的二次供水管理系統的探索與實踐[J].中國給水排水,2013,29(12):14-17.
[4] 練庭宏,劉秋娟,王景成.基于ARIMA時序辨識的需水量預測[J].控制工程,2008(S1):166-168.
[5] Firat M,Turan M E,Yurdusev M A.Comparative analysis of neural network techniques for predicting water consumption time series[J].Journal of Hydrology,2010,384(1):46-51.
[6] 高金良,姚芳,葉健.結合圖論的供水管網PMA分區方法[J].哈爾濱工業大學學報,2016,48(8):67-72.
[7] 程偉平,趙丹丹,許剛,等.供水管網爆管水力學模型與爆管定位[J].浙江大學學報(工學版),2013,47(6):1057-1062.
[8] Wu Yipeng,Liu Shuming,Wu Xue,et al.Burst detection in district metering areas using a data driven clustering algorithm[J].Water Research,2016,100:28-37.
[9] Hutton C,Kapelan Z.Real-time Burst Detection in Water Distribution Systems Using a Bayesian Demand Forecasting Methodology[J].Procedia Engineering,2015,119(1):13-18.
[10] 文玉梅,張雪園,文靜,等.依據聲信號頻率分布和復雜度的供水管道泄漏辨識[J].儀器儀表學報,2014,35(6):1223-1229.
[11] 鄒柏賢,劉強.基于ARMA模型的網絡流量預測[J].計算機研究與發展,2002,39(12):1645-1652.
[12] 韓超,宋蘇,王成紅.基于ARIMA模型的短時交通流實時自適應預測[J].系統仿真學報,2004,16(7):1530-1532,1535.
[13] 彭志行,鮑昌俊,趙楊,等.ARIMA乘積季節模型及其在傳染病發病預測中的應用[J].數理統計與管理,2008,27(2):362-368.
[14] 白云.時間序列特性驅動的供水量預測方法研究及應用[D].重慶大學,2014.