鄧 多,陳建康,裴 亮,周 弭,孫 燕
( 1.四川大學(xué)水利水電學(xué)院,四川 成都 610065;2.國網(wǎng)四川甘孜州電力有限責(zé)任公司康定市供電分公司,四川 甘孜 626000)
復(fù)雜地質(zhì)條件下,重力壩的深層抗滑穩(wěn)定是工程穩(wěn)定分析關(guān)注的一個焦點[1]。重力壩地基中的各種錯動帶和裂隙可能會組成雙滑面或多滑面的滑移通道,這些深層滑移通道就成了控制重力壩抗滑穩(wěn)定的關(guān)鍵性因素。抗滑穩(wěn)定安全系數(shù)是評估重力壩抗滑穩(wěn)定的一個應(yīng)用較為廣泛的指標(biāo)。對于深層抗滑穩(wěn)定安全系數(shù)和多種因素有關(guān),包括壩前水深以及滑移通道上的各種材料參數(shù)等。安全系數(shù)和影響因素之間呈現(xiàn)一種復(fù)雜的非線性映射關(guān)系,難以用函數(shù)顯式表達。而人工神經(jīng)網(wǎng)絡(luò)模擬人腦神經(jīng)組織的處理過程,具有自組織、自學(xué)習(xí)特性,將知識存儲與連接權(quán)值中,可以實現(xiàn)各種非線性映射[2]。
人工神經(jīng)網(wǎng)絡(luò)在水文預(yù)報[3- 5]和邊坡的穩(wěn)定性研究方面[6- 7]應(yīng)用較多,這些研究多是基于BP等淺層神經(jīng)網(wǎng)絡(luò)進行的。傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)存在著一些缺陷[8]。一是當(dāng)網(wǎng)絡(luò)層數(shù)過深,而訓(xùn)練網(wǎng)絡(luò)時權(quán)值初始化的很小,那么模型會很快的陷入局部最優(yōu)解;二是網(wǎng)絡(luò)需要大量的帶標(biāo)簽數(shù)據(jù),即有監(jiān)督的學(xué)習(xí)來進行訓(xùn)練,無法很好地解決小樣本問題。Geoffrey Hinton在2006年提出的一種深度置信網(wǎng)絡(luò)(Deep Belief Network, DBN)[9]則很好地克服了這些問題。
深度置信網(wǎng)絡(luò)作為深度學(xué)習(xí)的算法之一,在文字檢測、人臉與表情識別,遙感圖像識別等諸多領(lǐng)域取得了進展和應(yīng)用[10]。深度學(xué)習(xí)可以通過多層網(wǎng)絡(luò)模型來學(xué)習(xí)數(shù)據(jù)的多層抽象特征,極大地提升了語音識別、視覺對象識別、對象檢測等領(lǐng)域的技術(shù)水準(zhǔn)[11]。與此同時,深度置信網(wǎng)絡(luò)在變量預(yù)測方面也展現(xiàn)出了優(yōu)勢,代杰杰等[12]提出變壓器油中溶解氣體濃度預(yù)測模型,該模型將多種氣體組分與環(huán)境量一同輸入深度置信網(wǎng)絡(luò)模型,預(yù)測結(jié)果比單一氣體含量預(yù)測模型更精確,姚騰輝[13]提出一種基于深度置信網(wǎng)絡(luò)的建筑用水流量預(yù)測方法,預(yù)測結(jié)果優(yōu)于BP網(wǎng)絡(luò)。劉春柳等[14]使用了帶有高斯分布的CRBM模型并針對特征冗余問題提出基于拉普拉斯函數(shù)的連續(xù)DBN模型,取得了比傳統(tǒng)DBN更為精確的預(yù)測結(jié)果。
目前深度置信網(wǎng)絡(luò)在應(yīng)用重力壩穩(wěn)定方面的應(yīng)用還較少。鑒于傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu)解以及擬合度不高的缺點,本文提出一種基于深度置信網(wǎng)絡(luò)的重力壩深層安全系數(shù)預(yù)測方法。該方法先通過三維有限元模型計算,得到不同壩前水深和材料參數(shù)作用下的應(yīng)力分布,通過應(yīng)力代數(shù)和比值法計算得到一系列安全系數(shù)。用DBN深度置信網(wǎng)絡(luò)來構(gòu)建壩前水深、材料參數(shù)等影響因素和安全系數(shù)之間的映射關(guān)系,構(gòu)建重力壩深層抗滑穩(wěn)定安全系數(shù)預(yù)測模型,并對模型的隱藏層數(shù)和隱藏節(jié)點數(shù)進行優(yōu)化分析。同時用傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)構(gòu)建模型來對比兩種網(wǎng)絡(luò)的預(yù)測效果。
深度信念網(wǎng)絡(luò)是由若干個受限波爾茲曼機(Restricted Boltzmann Machine,RBM)和一個分類器組成的前饋神經(jīng)網(wǎng)絡(luò)。輸入數(shù)據(jù)會首先經(jīng)過RBM訓(xùn)練,第一層RBM的輸出作為第二層的輸入,這樣層層傳遞堆疊。每一層采用貪婪算法單獨訓(xùn)練以達到每層最優(yōu)。最后通過分類器模型進行一次有監(jiān)督學(xué)習(xí),一般采用BP網(wǎng)絡(luò),完成對各層參數(shù)的微調(diào)。整個DBN即訓(xùn)練完成。
單個RBM的組成只有可見層和隱藏層兩層神經(jīng)元,圖1為RBM網(wǎng)絡(luò)結(jié)構(gòu)示意圖,可見層神經(jīng)元用vi表示,bi為該可見層神經(jīng)元的偏移量,隱藏層神經(jīng)元用hj表示,ci為該隱藏層神經(jīng)元的偏移量??梢妼优c隱藏層之間的神經(jīng)元全連接,第i個可見元vi和第j個隱元hj之間的連接權(quán)重用wj,i表示,層內(nèi)部的神經(jīng)元相互不連接。RBM是基于能量函數(shù)的模型,其能量函數(shù)如式(1)所示。對于給定的可見層和隱藏層單元向量(v,h),聯(lián)合概率分布P(v,h;θ)如式(2)所示。RBM的訓(xùn)練通過對比散度(Contrastivedivergence, CD)算法來更新權(quán)重等參數(shù)。

圖1 RBM結(jié)構(gòu)
(1)
(2)

由于層內(nèi)部的神經(jīng)元不相互連接,因此第i個可見元vi和第j個隱元hj的激活概率分別為:
(3)
(4)

基于DBN的重力壩深層抗滑安全系數(shù)預(yù)測分析及基本流程如圖2所示。首先參照工程實例建立重力壩有限元模型,獲取各種材料參數(shù)及統(tǒng)計特征。根據(jù)材料參數(shù)及統(tǒng)計特征設(shè)計正交試驗。將正交試驗組帶入模型提取所需應(yīng)力,按照公式計算安全系數(shù)。接下來將數(shù)據(jù)歸一化,并分為訓(xùn)練集和測試集。將訓(xùn)練集數(shù)據(jù)輸入不同隱藏層和隱藏層節(jié)點數(shù)的DBN網(wǎng)絡(luò)模型,DBN網(wǎng)絡(luò)模型的結(jié)構(gòu)如圖3所示。將測試集的數(shù)據(jù)帶入訓(xùn)練好的網(wǎng)絡(luò),獲得安全系數(shù)預(yù)測值。根據(jù)模型評價指標(biāo)篩選出最優(yōu)隱藏層結(jié)構(gòu)的DBN網(wǎng)絡(luò)。本文還構(gòu)建了BP神經(jīng)用以對比模型的預(yù)測效果。

圖2 基于DBN的重力壩深層抗滑穩(wěn)定安全系數(shù)預(yù)測流程

圖3 DBN預(yù)測模型結(jié)構(gòu)
本文基于DBN的預(yù)測模型需要用到材料的彈性模量、凝聚力和摩擦系數(shù)等數(shù)據(jù)由于單位不同,數(shù)值間存在數(shù)量級的差別。為了數(shù)值計算中“大數(shù)吃小數(shù)”情況的發(fā)生,以及為了使數(shù)據(jù)滿足神經(jīng)網(wǎng)絡(luò)中節(jié)點轉(zhuǎn)移函數(shù)的要求,需要將數(shù)據(jù)進行歸一化處理。數(shù)據(jù)歸一化的方法主要有最大最小法和平均數(shù)方差法[15]。這里采用較為常用的最大最小法。采用式(5)對預(yù)測模型的輸入變量進行歸一化,將彈性模量、凝聚力、摩擦系數(shù)與壩前水深等歸一化到[0,1]之間。每種數(shù)據(jù)對應(yīng)一個維度,每個維度的數(shù)據(jù)需要單獨歸一化。另外,這些數(shù)據(jù)的標(biāo)簽(本模型中即為安全系數(shù))也需要采用式(5)歸一化。同時DBN預(yù)測模型直接輸出的也是歸一化之后的值,需要采用式(6)進行反歸一化。數(shù)據(jù)歸一化之后,還需將數(shù)據(jù)劃分為訓(xùn)練集和測試集。
(5)
(6)

為了評估不同結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)預(yù)測模型的質(zhì)量,本文采用神經(jīng)網(wǎng)絡(luò)中較為常用的均方誤差MSE(mean squared error)和決定系數(shù)R2(coefficient of determination)來量化預(yù)測模型的表現(xiàn)。MSE是指參數(shù)估計值與參數(shù)真值之差平方的期望值,MSE可以評價數(shù)據(jù)的變化程度,MSE的范圍為(0,+∞),MSE的值越小,說明預(yù)測模型描述實驗數(shù)據(jù)具有更好的精確度。
(7)
R2也是一種常用的來評判模型擬合精度的衡量指標(biāo),反映了該模型擬合程度,R2的范圍為(-∞,1),R2越接近1,表明模型越精確,當(dāng)R2小于0時,表明模型效果很差。
(8)

某混凝土重力壩9號壩段如圖4所示。該壩段高148m,壩基包含多條裂隙和錯動帶。這些裂隙和錯動帶組成了一條具有4個滑裂面的危險滑移通道。4個滑裂面從左到右依次為錯動帶f×9- 1、f×10- 5、f×10- 4和第④組裂隙,其材料參數(shù)見表1。

圖4 重力壩剖面圖

表1 壩體及壩基材料基本參數(shù)建議值
本次工程算例分析根據(jù)以上工程情況建立的有限元模型如圖5所示。地基的建模范圍為:從建基面向下延伸取兩倍壩高,從壩踵和壩址分別向上游和下游延伸2倍壩高,橫河向?qū)挾热?號壩段的實際壩段寬度20m。模型單元均采用Solid45單元類型,結(jié)點總數(shù)12201,單元總數(shù)13445。

圖5 有限元模型
模型計算中主要考慮壩體、地基以及構(gòu)成壩體深層滑移通道的兩種錯動帶和一種裂隙的彈性模量E、凝聚力c′、摩擦系數(shù)f′及壩前水深共15個隨機變量。這些隨機變量的分布及統(tǒng)計特征見表2。

表2 隨機變量統(tǒng)計特征
將上述隨機變量分別按照一倍標(biāo)準(zhǔn)差和兩倍標(biāo)準(zhǔn)差進行波動,得到126組正交試驗數(shù)據(jù)。根據(jù)這些壩前水深和材料參數(shù)的正交試驗數(shù)據(jù)輸入有限元模型,并施加相應(yīng)荷載:作用在壩體上下游表面靜水壓力,作用在壩基面上的揚壓力(揚壓力在帷幕灌漿處按強度系數(shù)α=0.25折減計算)、重力、初始地應(yīng)力。加載上述荷載運行后得到有限元模型的應(yīng)力分布。提取深層滑移通道上的單元應(yīng)力,按公式(9)計算得到每一組正交試驗數(shù)據(jù)對應(yīng)的安全系數(shù)K。
(9)

本次DBN網(wǎng)絡(luò)模型的編程計算在MATLAB(R2014A)平臺上進行。將上文得到的126組數(shù)據(jù)中的100組作為訓(xùn)練集,剩下26組作為測試集。各種材料參數(shù)和壩前水深作為DBN網(wǎng)絡(luò)的輸入,因此DBN網(wǎng)絡(luò)的輸入層節(jié)點數(shù)為15。將安全系數(shù)K的值減去1作為預(yù)計的輸出,輸出層節(jié)點數(shù)為1。DBN網(wǎng)絡(luò)的隱藏層數(shù)和隱藏節(jié)點數(shù)對網(wǎng)絡(luò)的預(yù)測精度影響很大,為了達到最優(yōu)預(yù)測結(jié)果,下文將通過多次訓(xùn)練不同層數(shù)和節(jié)點數(shù)的網(wǎng)絡(luò),以選取預(yù)測效果最好的隱藏層網(wǎng)絡(luò)結(jié)構(gòu)。另外網(wǎng)絡(luò)的傳遞函數(shù)采用Sigmoid函數(shù),學(xué)習(xí)率為1,迭代次數(shù)經(jīng)測試設(shè)置為120。
首先,設(shè)置隱藏層層數(shù)為1,設(shè)置節(jié)點為1,2,…,19,20,來測試的DBN網(wǎng)絡(luò)模型擬合效果。圖6為單隱藏層DBN網(wǎng)絡(luò)節(jié)點數(shù)為1到20時的MSE變化情況,其中當(dāng)單隱藏層節(jié)點數(shù)為13時MSE最小,為0.01583。節(jié)點數(shù)為1時網(wǎng)絡(luò)的MSE遠大于其余各種情況的MSE,故未在圖中畫出。

圖6 單隱藏層DBN網(wǎng)絡(luò)誤差
然后設(shè)置隱藏層為2,第一和第二隱藏層節(jié)點數(shù)以2為步長,從2增加到20。每層有10種不同的節(jié)點數(shù),兩層組合得到100種節(jié)點組合的網(wǎng)絡(luò)擬合情況,如圖7所示。表3為100種節(jié)點組合中MSE最小的10種節(jié)點組合的具體數(shù)據(jù),從表中看出雙隱藏層最優(yōu)節(jié)點組合為第一層20,第二層2,MSE為0.01392。相比于單隱藏層最優(yōu)網(wǎng)絡(luò)的MSE有所降低,表明網(wǎng)絡(luò)的擬合效果提高了。

圖7 雙隱藏層DBN網(wǎng)絡(luò)誤差

表3 雙隱藏層部分節(jié)點組合擬合效果
接下來探究隱藏層數(shù)為3的情況,由于三隱藏層如果也按各層節(jié)點自由組合的方式會產(chǎn)生過多的組合。這里我們僅選取雙隱藏層中最小的10種節(jié)點組合進行下一步篩選。對于每一個雙隱藏層最優(yōu)節(jié)點組合,讓第三隱藏層的節(jié)點數(shù)以2為步長,從2增加到20,這樣也產(chǎn)生了100種網(wǎng)絡(luò)節(jié)點的組合,擬合效果如圖8所示。從圖中可以看出,三隱藏層的MSE普遍較大。這里從每個雙隱藏層節(jié)點的10種組合中取出MSE最小的一組,數(shù)據(jù)見表4。對比表2表3可以看出,三隱藏層的誤差明顯增大,說明增加的第三隱藏層已不能使網(wǎng)絡(luò)擬合效果進一步提高,增加的層反而使累積誤差增大。
綜合以上數(shù)據(jù),確定該DBN網(wǎng)絡(luò)模型隱藏層最優(yōu)結(jié)構(gòu)為雙隱藏層,節(jié)點數(shù)為[20- 2]。如果加上輸入層和輸出層,則完整的最優(yōu)DBN網(wǎng)絡(luò)模型結(jié)構(gòu)為[15- 202- 1]。

圖8 三隱藏層DBN網(wǎng)絡(luò)誤差

表4 三隱藏層部分節(jié)點組合擬合效果
對于BP神經(jīng)網(wǎng)絡(luò)也采用相同的思路來進行探尋最優(yōu)的網(wǎng)絡(luò)結(jié)構(gòu)。不過由于BP神經(jīng)網(wǎng)絡(luò)各神經(jīng)元的參數(shù)是隨機生成的,其網(wǎng)絡(luò)訓(xùn)練很容易陷入局部解,每次訓(xùn)練的網(wǎng)絡(luò)性能有一定的差異性,故將每種結(jié)構(gòu)的BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練100次,將100次網(wǎng)絡(luò)評價的均值作為該結(jié)構(gòu)網(wǎng)絡(luò)評價的代表值,最終確定最優(yōu)的BP神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)結(jié)構(gòu)為[15- 2- 1]。
在保證將最優(yōu)隱藏層結(jié)構(gòu)的DBN模型和BP模型所預(yù)測的結(jié)果進行對比,真實值和二者的預(yù)測值繪制如圖9,二者預(yù)測誤差如圖10所示。DBN模型在多數(shù)點上的預(yù)測誤差都小于BP模型。二者的全局?jǐn)M合評價見表5,DBN網(wǎng)絡(luò)的均方誤差為0.01392,小于BP網(wǎng)絡(luò)的均方誤差0.02190,前者相對于后者減小了36.42%。且DBN網(wǎng)絡(luò)的決定系數(shù)也大于BP網(wǎng)絡(luò),表明DBN網(wǎng)絡(luò)的綜合擬合效果優(yōu)于BP網(wǎng)絡(luò)。

圖9 DBN網(wǎng)絡(luò)和BP網(wǎng)絡(luò)預(yù)測結(jié)果對比

圖10 DBN網(wǎng)絡(luò)和BP網(wǎng)絡(luò)預(yù)測誤差對比

表5 最優(yōu)BDN和BP模型結(jié)構(gòu)與評價
本文將深度學(xué)習(xí)中的DBN深度置信網(wǎng)絡(luò)引入重力壩深層抗滑穩(wěn)定安全系數(shù)預(yù)測,以具體重力壩壩段為例,驗證了DBN網(wǎng)絡(luò)在安全系數(shù)預(yù)測方面的可行性和實用性。DBN網(wǎng)絡(luò)由于其多層RBM堆疊而帶來的高效特征提取能力,使得其在預(yù)測擬合度上取得了優(yōu)勢。
通過對不同網(wǎng)絡(luò)層數(shù)和節(jié)點層數(shù)的DBN網(wǎng)絡(luò)模型的優(yōu)化分析過程可知,當(dāng)DBN網(wǎng)絡(luò)深度增加時,多層RBM堆疊提升了網(wǎng)絡(luò)的特征提取能力,網(wǎng)絡(luò)的預(yù)測精度相應(yīng)提高。但網(wǎng)絡(luò)深度過大時,又會使訓(xùn)練時間和復(fù)雜程度增加,誤差也會逐層增加。因此應(yīng)合理選擇網(wǎng)絡(luò)深度以在精度提升和誤差增加之間取得最優(yōu)。