丁 倩,黃耀英,謝 同,李 峰,高 磊
(1.三峽大學 水利與環境學院,湖北 宜昌 443002;2.湖北漢江王甫洲水力發電有限責任公司,湖北 襄陽 430048;)
大壩原型觀測資料的正分析主要是建立統計模型、確定性或混合模型以及預測模型[1]。其中,變形統計模型憑借其簡單有效的優勢,在工程實踐中得到廣泛應用。如顧沖時等[2]建立了碾壓混凝土壩變形安全監控模型;李海楓等[3]通過變形回歸模型分析特高拱壩施工期和蓄水初期變形的主要影響因素;萬智勇等[4]利用碾壓混凝土壩壩體及壩基多測點變形統計模型分離出用于材料參數反演的水壓分量;趙程等[5]以白鶴灘水電站壩基監測數據為例,建立了考慮體形影響的特高拱壩施工期壩基變形統計模型;朱趙輝等[6]運用穩健估計的思想,得到具有抗差性的大壩變形統計模型。但目前常用變形統計模型預報量與預報因子之間一般都是線性關系,由于實際工程問題十分復雜,預報量與預報因子之間的關系往往是非線性的,這導致常用統計模型的預測精度具有較大局限性。
隨著計算技術快速發展,人工神經網絡得到了廣泛應用。近年來,不少研究者引入更適合處理非線性數據的人工神經網絡來建立預測模型,其中,BP神經網絡因其簡便性,在實際工程中采用較多。如趙斌等[7]將BP神經網絡模型引入到大壩安全監測數據的預報方面;蘇懷智等[8]用遺傳算法改進的BP神經網絡建立大壩安全監控預報模型;趙新瑞等[9]構建進化神經網絡模型以預測堆石壩沉降變形和面板撓度;齊銀峰等[10]利用改進粒子群算法優化大壩變形預測的BP神經網絡模型;王雪紅等[11]以重力壩壩頂順河向位移實測數據為例,建立了預測精度較高的BP神經網絡模型;潘潔晨[12]采用附加動量法和自適應學習效率改進BP神經網絡模型,以分析哈爾濱西泉眼水庫大壩變形規律。BP神經網絡雖然在處理非線性數據時具有很大優勢,卻有易陷入局部最優及隱含層選取等諸多限制,預測結果有時并不理想。近年來有些學者提出利用馬爾科夫鏈修正大壩變形模型預測結果,如張英豪[13]等利用馬爾科夫修正灰色模型預測結果,使預測相對誤差縮小到11%以內;何啟等[14]針對樣本數據波動性大的問題,用加權馬爾科夫修正灰色神經網絡大壩變形監控模型;周子東等[15]提出偏最小二乘-馬爾科夫鏈大壩位移預測模型,解決了傳統回歸模型數據波動的問題;董丹丹等[16]根據馬爾科夫鏈原理,修正GACO-BP模型擬合值的相對誤差,進而提出GACO-BP-MC模型。但上述文獻或是默認馬氏鏈具有時齊性,或是漏掉了對隨機序列的馬氏檢驗,或是未考慮不同滯時相依關系強弱不同。另外,雖然馬爾科夫鏈用于水文序列預測的研究相對豐富,但是報道水工建筑物安全監測數據分析的文獻不多,而將BP神經網絡與馬爾科夫鏈相結合的研究相對更少。
基于以上研究的不足,本文結合王甫洲水利樞紐泄水閘水平位移的實測數據,將BP神經網絡與加權馬爾科夫鏈相結合,建立BP神經網絡-加權馬爾科夫模型。最后與逐步回歸統計模型和BP神經網絡模型的預測效果相比較,以分析加權馬爾科夫鏈能否提高模型精度。
統計模型是水工建筑物變形預測的實用工具,但它假設干擾項數學期望為零,近似假設其服從正態分布[17],而實際問題不一定滿足該條件,其模型精度取決于預報因子的選擇,且在變形相關因子中,時效的影響因素眾多,不宜擬定明確的表達式[7]。另外,水工建筑物結構行為往往呈現非線性特征[18],而BP神經網絡可自學習、自適應[19],在處理非線性數據方面具有很大優勢。由于單隱含層網絡能滿足水工建筑物變形預測要求,本文擬采用經典的3層網絡結構。其中,輸入層節點是與水工建筑物變形相關的因子,輸出層節點是水工建筑物變形效應量。影響水工建筑物變形的因素比較復雜,本文主要分析水壓分量、溫度分量和時效分量,采用的變形表達式[1]如下:

(1)
式中:δ為變形量,mm;H1、H2和H3分別為上游水深的一次方、二次方和三次方,H4為下游水深,m;t為觀測日至始測日的天數;θ等于觀測日至始測日的天數除以100;a0、b1i、b2i、c1和c2為常數項和回歸系數,可由逐步回歸分析法得到。
根據公式(1),網絡的輸入節點數為10,輸出節點數為1。
選取隱含層節點數時,通常先用經驗公式計算初始節點數,再依次遞增或遞減,試算出較優隱含層節點數。設輸入層節點數為m,輸出層節點數為n,則隱含層節點數N可按下式[20]計算:
(2)
水工建筑物變形實測數據具有波動性,在水庫蓄水初期尤為明顯,而馬爾科夫鏈適合處理隨機波動性大的數據[21],在水工建筑物變形預測方面已有應用。常見的馬爾科夫模型有3種,基于絕對分布的馬爾科夫模型、疊加馬爾科夫模型和加權馬爾科夫模型[22]。加權馬爾科夫預測模型不受馬氏鏈時齊性的限制,且考慮了不同滯時相依關系的強弱,充分挖掘了樣本數據包含的信息,精度一般比基于絕對分布的馬爾科夫預測模型和疊加馬爾科夫模型要高[23],其模型建立的步驟如下:
(1)狀態分類。擬采用均值-均方差法將隨機序列指標值劃分成5個狀態區間[14]。
(2)馬氏性檢驗。對于離散型的水工建筑物變形序列,可構造卡方統計量來檢驗馬氏性[14]。

(4)各階自相關系數和轉移權重。選取滯時,分別計算各階自相關系數rk和轉移權重wk[14]。
(5)預測表編制。分別以預測年之前若干年的水平位移作為初始狀態,再結合相應滯時的轉移概率矩陣,得到預測年的各階狀態概率。然后對同一狀態的各年預測狀態概率加權求和,即為預測年處于各狀態的平均概率。上述計算可編制成預測表,取預測表中最大概率值對應狀態,用加權馬爾科夫模型進行預測。
BP神經網絡能很好處理非線性問題,馬爾科夫鏈則適于預測波動性較大的隨機序列,BP神經網絡-加權馬爾科夫模型綜合二者的優勢,可用于水工建筑物變形數據處理。首先利用BP神經網絡模型的訓練結果,將實測值與擬合值進行比較,得到誤差序列之后,再按2.2節的步驟建立加權馬爾科夫模型,最終得到的模型即為BP神經網絡-加權馬爾科夫模型。圖1為BP神經網絡-加權馬爾科夫模型的計算流程。

圖1 BP神經網絡-加權馬爾科夫模型計算流程
王甫洲水利樞紐泄水閘共23孔,每孔凈寬14.50 m,閘底板高程76.23 m。泄水閘外部上、下游向水平位移采用1條引張線和2臺伸縮儀監測。此外,還在泄水閘右岸1#閘墩、左岸24#閘墩頂部上游側分別布置IP4、IP5兩個倒垂孔觀測閘體內部水平位移。泄水閘只在汛期泄洪時打開,其他時間起擋水作用,在上下游水位差、溫度和揚壓力等因素作用下,閘墩順河向會產生水平位移,方向以向下游為正,向上游為負。本文采用位于泄水閘中部的11#閘墩測點水平位移的實測數據,分別使用BP神經網絡模型和BP神經網絡-加權馬爾科夫模型進行預測,并結合逐步回歸統計模型的預測結果,對比3種模型的相對誤差,驗證本文建立的BP神經網絡-加權馬爾科夫模型的可靠性。圖2為王甫洲水利樞紐泄水閘模型的縱剖面圖。

圖2 王甫洲水利樞紐泄水閘模型縱剖面圖
訓練樣本采用王甫洲泄水閘11#閘墩測點2008年9月至2018年8月的實測水平位移值,輸入項為公式(1)中的10個因子,訓練的目標誤差設為0.001,輸出項為泄水閘11#閘墩測點的水平位移。預測樣本采用王甫洲泄水閘11#閘墩測點2018年9月至2019年2月的實測水平位移值。圖3為BP神經網絡結構圖。

圖3 BP神經網絡結構圖
圖4為隱含層節點數與訓練樣本平均相對誤差[24]的關系曲線,圖5為泄水閘11#閘墩測點水平位移實測值與BP神經網絡模型擬合值過程線,表1為BP神經網絡模型的預測結果與實測值對比。

圖4 隱含層節點數與訓練樣本平均相對誤差關系曲線

圖5 閘墩測點水平位移實測值與BP神經網絡模型 擬合值過程線(2008年9月至2018年8月)

表1 閘墩測點水平位移BP神經網絡模型預測結果與實測值對比
由公式(2)可得,隱含層初始節點數為6,按逐次遞增法試算,由圖4可以看出,當隱含層節點數為7時,訓練樣本的平均相對誤差最小,最小值為4.48%,因而隱含層節點數設置為7。由圖5可以看出,除了數據跳動比較大的幾個曲線尖點之外,BP神經網絡模型擬合值與實測值的變化趨勢一致,平均相對誤差絕對值為5.72%,模型的擬合效果較好。由表1可以看出,BP神經網絡模型預測王甫洲泄水閘11#閘墩測點水平位移的相對誤差絕對值在0.51%~7.46%范圍內,平均相對誤差絕對值為3.36%,預測效果較好。
為進一步提高BP神經網絡模型的預測精度,現結合加權馬爾科夫模型進行誤差修正。利用3.2節BP神經網絡模型2008年9月至2018年8月的擬合值,可得相對誤差序列,其余計算步驟與結果分述如下。
(1)狀態分類。相對誤差序列的均值為75%,均方差為7.64%,劃分為5個狀態,對應區間分別為[-22.44%,-9.16%]、(-9.16%,-4.58%]、(-4.58%,3.07%]、(3.07%,7.65%]和(7.65%,24.20%]。
(2)馬氏性檢驗。計算一步轉移頻數矩陣fij、一步轉移概率矩陣p(1)以及邊際概率(見表2)和卡方統計量(見表3)。

表2 邊際概率表

表3 卡方統計量計算表
(3)狀態轉移概率矩陣。取BP神經網絡模型2008年9月至2018年8月擬合值的相對誤差作為隨機序列,得到步長分別為2、3、4、5的一步狀態轉移概率矩陣如下:
(4)各階自相關系數和轉移權重。表4為計算所得各階自相關系數(rk)和轉移權重(wk)。

表4 各階自相關系數和轉移權重表
(5)預測表編制。根據BP神經網絡模型擬合的泄水閘11#閘墩測點水平位移2018年4-8月相對誤差所處狀態,對相應的狀態轉移概率進行加權計算,預測2018年9月的相對誤差狀態。表5為2018年9月相對誤差狀態加權預測結果。取預測表最大概率值對應狀態S,對應狀態區間取中值E,則修正后的預測值可按下式計算:

表5 2018年9月閘墩測點水平位移相對誤差狀態加權預測表
xBM=xBP/(1+E)
(3)
式中:xBM為BP神經網絡-加權馬爾科夫模型的預測值,mm;xBP為BP神經網絡模型的預測值,mm。
同理,分別將2018年9、10、11和12月及2019年1月的擬合誤差加入到隨機序列中,按上述步驟分別計算2018年10、11和12月及2019年1和2月的預測表,取預測表中6個加權和最大概率值,分別為0.517 9,0.518 3,0.478 1,0.531 2,0.463 9,0.515 3,均對應狀態3,誤差區間為(-4.58%,3.07%],取區間中值-0.75%,得預測相對誤差為-0.75%,BP神經網絡-加權馬爾科夫預測模型修正后的水平位移預測值分別為-14.46、-14.29、-14.37、-14.29、-14.45、-13.83 mm。
根據3.2節和3.3節關于王甫洲泄水閘11#閘墩測點水平位移的計算成果,并結合逐步回歸統計模型的預測結果,以2018年9月至2019年2月的實測值作為預測對比依據,3種模型的預測結果及相對誤差見圖6、7和表6。其中,圖6為閘墩測點水平位移預測值與實測值過程線對比,圖7為閘墩測點水平位移預測值的相對誤差絕對值,表6為閘墩測點水平位移預測值相對誤差對照,BM模型表示BP神經網絡-加權馬爾科夫模型。

圖6 3種模型預測的閘墩測點水平位移與實測值過程線對比(2018年9月至2019年2月) 圖7 3種模型預測的閘墩測點水平位移相對誤差絕對值(2018年9月至2019年2月)

表6 3種模型預測的閘墩測點水平位移相對誤差對照(2018年9月至2019年2月)
由圖6可知,泄水閘11#閘墩測點水平位移實測值隨時間的變化是非線性的,且BP神經網絡模型和BP神經網絡-加權馬爾科夫模型預測的水平位移與實測數據的變化趨勢一致,但逐步回歸統計模型預測的水平位移呈現與實測值不同的線性變化。再結合逐步回歸統計模型的分析可知,11#閘墩測點水平位移主要受溫度分量影響,隨溫度有周期性變化趨勢,而逐步回歸統計模型預測值不能反映監測物理量非線性的變化特征,在處理非線性數據方面,其預測效果不如BP神經網絡模型和BP神經網絡-加權馬爾科夫模型。由圖7和表6可知,在6個預測月份中,就模型預測相對誤差而言,BP神經網絡-加權馬爾科夫模型整體上最小,而逐步回歸統計模型整體上最大。逐步回歸統計模型、BP神經網絡模型和BP神經網絡-加權馬爾科夫模型的相對誤差絕對值的平均值分別為5.13%、3.36%和2.96%,可見BP神經網絡模型精度優于逐步回歸統計模型,BP神經網絡-加權馬爾科夫模型精度優于BP神經網絡模型。
本文利用BP神經網絡模型訓練樣本的擬合結果得到相對誤差隨機序列,采用均值-均方差法進行狀態分類,并檢驗隨機序列的馬氏性,建立BP神經網絡-加權馬爾科夫模型,結合王甫洲泄水閘水平位移實測數據,對比了逐步回歸統計模型、BP神經網絡模型和BP神經網絡-加權馬爾科夫模型預測的相對誤差,主要結論如下:
(1)BP神經網絡模型適于處理水工建筑物變形監測數據,能正確反映水工建筑物變形的非線性變化規律;逐步回歸統計模型更適合處理線性問題;加權馬爾科夫模型考慮了不同滯時相依關系的強弱,充分挖掘樣本數據包含的信息,可以顯著降低模型預測誤差,提高模型預測精度,尤其適用于波動性較大的數據系列。本文建立的BP神經網絡-加權馬爾科夫模型比較合理,預測精度較高,能更好地描述水工建筑物變形規律,為水工建筑物安全監測數據處理提供一種新思路。
(2)由于本文所采用的實際數據資料系列的規律性較好,逐步回歸統計模型和BP神經網絡模型的預測精度較高,所以加權馬爾科夫模型未充分發揮其修正誤差的作用。當獲得更多實測數據資料系列時,應及時訓練和擬合預測模型,然后再進行后續的動態預測。