曹國(guó)清,張曉明,陳亞峰
1(北京化工大學(xué) 信息科學(xué)與技術(shù)學(xué)院,北京 100029)
2(北京石油化工學(xué)院 信息工程學(xué)院,北京 102617)
我國(guó)屬于礦山資源大國(guó),礦山排土場(chǎng)的安全問(wèn)題尤為重要,很多排土場(chǎng)存在著滑坡危險(xiǎn),排土場(chǎng)的選址,堆放方式,管理方式可能都會(huì)引起滑坡事故.隨著傳感器技術(shù)的發(fā)展,各種類型的傳感器被應(yīng)用到了礦山排土場(chǎng)的安全監(jiān)測(cè)當(dāng)中,傳感器能保持不間斷地采集排土場(chǎng)的相關(guān)參數(shù),這些相關(guān)參數(shù)對(duì)排土場(chǎng)的安全指標(biāo)具有重大意義,在一定程度上體現(xiàn)著排土場(chǎng)的安全狀況,傳感器傳輸?shù)膶?shí)時(shí)數(shù)據(jù)代表排土場(chǎng)的相關(guān)特征指標(biāo),當(dāng)技術(shù)人員接收到異常數(shù)據(jù)時(shí),排土場(chǎng)滑坡或許已經(jīng)產(chǎn)生了,若提前預(yù)測(cè)出傳感器下一時(shí)刻的數(shù)據(jù),在一定程度上可以減少排土場(chǎng)滑坡造成的財(cái)產(chǎn)損失和人員傷亡.針對(duì)國(guó)內(nèi)相關(guān)研究,常用的排土場(chǎng)滑坡風(fēng)險(xiǎn)分析預(yù)測(cè)方法有工程類比、案例推理、可拓理論等,欒婷婷等提出了可拓理論預(yù)警方法[1],根據(jù)可拓評(píng)價(jià)指標(biāo)只是瞬時(shí)性地判斷排土場(chǎng)是否有滑坡危險(xiǎn),該方法沒(méi)有考慮到歷史數(shù)據(jù)對(duì)現(xiàn)有數(shù)據(jù)的影響,在一定程度上或許會(huì)影響到預(yù)測(cè)的精度; 梁冰等提出了采用電磁信號(hào)發(fā)射及信號(hào)測(cè)距的邊坡內(nèi)部位移監(jiān)測(cè)的方法[2],該方法能實(shí)時(shí)性地監(jiān)測(cè)排土場(chǎng)內(nèi)部位移量和排土場(chǎng)邊坡的安全狀況,但是該設(shè)計(jì)只是局限于了解到當(dāng)前排土場(chǎng)的安全狀況,并不能對(duì)排土場(chǎng)下一時(shí)刻的安全狀況做出相應(yīng)的判斷; 易慶林等提出結(jié)合多個(gè)監(jiān)測(cè)點(diǎn)對(duì)滑坡整體移動(dòng)的貢獻(xiàn)率通過(guò)小波分析的方法推導(dǎo)出綜合位移方程的方法[3],該方法在判斷滑坡風(fēng)險(xiǎn)性方面有一定的實(shí)用價(jià)值,但是復(fù)雜的數(shù)學(xué)方程求解過(guò)程需要耗費(fèi)一定的時(shí)間,同時(shí)該綜合位移方程的泛化能力方面比較弱; 張偉等提出主成分結(jié)合BP神經(jīng)網(wǎng)絡(luò)在壩頂位移監(jiān)控的方法[4],該方法雖然避免了建立復(fù)雜的數(shù)學(xué)模型過(guò)程,但是BP神經(jīng)網(wǎng)絡(luò)在擬合高度非線性函數(shù)時(shí)經(jīng)常會(huì)陷入局部最優(yōu),出現(xiàn)欠擬合和過(guò)擬合現(xiàn)象.這些分析方法理論比較完善,能基本確定一定時(shí)期內(nèi)排土場(chǎng)的安全狀況,但是由于影響排土場(chǎng)滑坡穩(wěn)定性的因素較多,且大多數(shù)因素具有隨機(jī)性、模糊性等特征,各因素之間的關(guān)系非常復(fù)雜,很難用準(zhǔn)確的數(shù)學(xué)方程進(jìn)行描述,這些方法在準(zhǔn)確性、及時(shí)性及智能性方面存在缺陷.
LSTM網(wǎng)絡(luò)通過(guò)自身特殊的設(shè)計(jì)[5],極好地避免了常規(guī)循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程中存在的梯度消失和梯度爆炸問(wèn)題,因此其能夠被有效地被訓(xùn)練,進(jìn)而真正有效的利用相關(guān)歷史序列信息[6].LSTM已經(jīng)在語(yǔ)音識(shí)別,視頻標(biāo)簽分類[7]、聲音識(shí)別[8]、自然語(yǔ)言處理[9]等諸多前沿領(lǐng)域中得到廣泛研究和應(yīng)用,LSTM彌補(bǔ)了循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失和梯度爆炸、長(zhǎng)期記憶能力不足等問(wèn)題,使其能夠有效地利用長(zhǎng)距離的時(shí)間序列信息進(jìn)行預(yù)測(cè),礦山排土場(chǎng)各個(gè)特性指標(biāo)都具有時(shí)間序列的本質(zhì)特征,為通過(guò)運(yùn)用LSTM網(wǎng)絡(luò)用多種數(shù)據(jù)源來(lái)判斷礦山排土場(chǎng)是否有滑坡的風(fēng)險(xiǎn)的想法應(yīng)運(yùn)而生.
礦山排土場(chǎng)災(zāi)害監(jiān)測(cè)是一個(gè)動(dòng)態(tài)的時(shí)間序列,排土場(chǎng)的穩(wěn)定性的過(guò)程是漸變的,也就是說(shuō)當(dāng)前排土場(chǎng)的穩(wěn)定性與歷史的穩(wěn)定性相互關(guān)聯(lián),多個(gè)特征指標(biāo)間存在著相互關(guān)聯(lián),通過(guò)各特性指標(biāo)間的相關(guān)性分析,得出地表位移這一排土場(chǎng)物理指標(biāo)與內(nèi)部位移、土壓力,土壤含水率等相關(guān)性較大,同時(shí)結(jié)合調(diào)研的相關(guān)文獻(xiàn),本文提出長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型(LSTM),通過(guò)傳感器接收的已有數(shù)據(jù),采用多特征指標(biāo)來(lái)預(yù)測(cè)下一時(shí)刻的地表位移量具有重大意義.首先采用灰色關(guān)聯(lián)度算法,分析地表位移與其它指標(biāo)的關(guān)聯(lián)度[10],根據(jù)關(guān)聯(lián)度大小對(duì)多變量時(shí)間序列進(jìn)行篩選,進(jìn)而降低數(shù)據(jù)規(guī)模和復(fù)雜度,最后,利用LSTM網(wǎng)絡(luò)對(duì)多變量時(shí)間序列與地表位移之間的非線性關(guān)系進(jìn)行動(dòng)態(tài)時(shí)間建模,構(gòu)建地表位移預(yù)測(cè)模型,通過(guò)LSTM網(wǎng)絡(luò)建立的地表位移預(yù)測(cè)模型,將已有數(shù)據(jù)預(yù)測(cè)貴州某礦山排土場(chǎng)的短時(shí)期位移量預(yù)測(cè),結(jié)果表明,本文提出的方法通過(guò)多變量時(shí)間序列預(yù)測(cè)地表位移的效果較好[11].
以貴州某礦山排土場(chǎng)的從2016年1 2月19日~2017年11月20日的數(shù)據(jù)為研究對(duì)象,數(shù)據(jù)集中包含8個(gè)特性指標(biāo),分別是地表位移(Mp),土壓力(Dm),內(nèi)部位移(Ep),濕度(Hum),降雨量(Rg),土壤含水率(Smc),孔隙水壓力(St),溫度(Tpr).每組數(shù)據(jù)按一定周期持續(xù)更新,如圖1所示.影響山體滑坡的因素有許多,地表位移是表示著山體表面的移動(dòng)距離,土壓力表示山體之間的相互作用力,在一定程度上表示著山體之間的緊密程度; 土壤含水率,孔隙水壓力,溫度,降雨量,濕度都會(huì)直接或間接地影響到山體滑坡,故將這些特性指標(biāo)作為分析對(duì)象.
排土場(chǎng)的原始數(shù)據(jù)存在著眾多的異常值和少部分的缺失值,由于礦山排土場(chǎng)的滑坡需要嚴(yán)格地按照時(shí)間序列來(lái)預(yù)測(cè),若直接對(duì)異常值進(jìn)行舍棄,對(duì)預(yù)測(cè)結(jié)果會(huì)造成較大的影響,針對(duì)異常值,先對(duì)異常值進(jìn)行空值處理,將其視為缺失值,然后通過(guò)拉格朗日插值法對(duì)所有空缺值進(jìn)行插值填補(bǔ)[12].

圖1 各特性指標(biāo)的變化趨勢(shì)

數(shù)據(jù)集中的每個(gè)特性指標(biāo)間存在著量綱差異,為了消除不同量綱間的影響,需要對(duì)數(shù)據(jù)進(jìn)行無(wú)量綱化處理,無(wú)量綱化有多種方法,本文采用歸一化法對(duì)數(shù)據(jù)集中的所有特性指標(biāo)進(jìn)行標(biāo)準(zhǔn)化

礦山排土場(chǎng)特性指標(biāo)總共8種,排土場(chǎng)滑坡風(fēng)險(xiǎn)評(píng)價(jià)受多種因素之間的相互影響,通過(guò)主成分分析(PCA)確立所有特性指標(biāo)的主成分,通過(guò)主成分確立出作為影響礦山排土場(chǎng)滑坡的重要的特性指標(biāo),通過(guò)對(duì)礦山排土場(chǎng)的數(shù)據(jù)樣本進(jìn)行主成分分析.



地表位移(Mp),土壓(Dm),內(nèi)部位移(Ep),濕度(Hum),降雨量(Rg),土壤含水率(Smc),孔隙水壓力(St),溫度(Tpr)的特征值分別是549.99,377.92,64.54,77.80,48.50,28.60,8.28,0.104如圖2所示.由各個(gè)指標(biāo)的特征值,地表位移特征值遠(yuǎn)大于其他指標(biāo)的特征值,由此,在礦山排土場(chǎng)滑坡風(fēng)險(xiǎn)預(yù)測(cè)中,地表位移可以作為重要的考慮對(duì)象.

圖2 各特性指標(biāo)的特征值
影響礦山排土場(chǎng)滑坡的因素有許多,其中最明顯的表征就是地表位移,由2.2可知,地表位移在所有特征值中為第一主成分,因此可以將地表位移作為所有特性指標(biāo)中對(duì)排土場(chǎng)滑坡影響最大的因素; 通過(guò)灰色關(guān)聯(lián)算法求解地表位移與其它指標(biāo)(內(nèi)部位移、土壓力、孔隙水壓力、土壤含水率、降雨量,溫度、濕度)之間的關(guān)聯(lián)度.
灰色關(guān)聯(lián)分析法決策的思想是根據(jù)某個(gè)問(wèn)題的實(shí)際情況確定出參考序列[13]; 然后,通過(guò)方案的序列曲線和幾何形狀與參考序列的曲線和幾何形狀的相似程度來(lái)判斷其之間的關(guān)聯(lián)程度; 曲線和幾何形狀越接近則說(shuō)明其關(guān)聯(lián)度越大,方案越接近參考序列,反之亦然.設(shè)有個(gè) 對(duì)象,每個(gè)對(duì)象有項(xiàng)指標(biāo),由于每個(gè)評(píng)價(jià)的指標(biāo)量綱是不一樣的,為了消除量綱之間的差異對(duì)結(jié)果的影響,需對(duì)評(píng)價(jià)指標(biāo)數(shù)據(jù)進(jìn)行歸一化處理,如(3)式,歸一化后的數(shù)據(jù)為令地表位移為參考序列,則與關(guān)于第個(gè)指標(biāo)的關(guān)聯(lián)系數(shù)為:



由公式(6)與公式(7)可得出其它排土場(chǎng)參數(shù)指標(biāo)與地表位移的關(guān)聯(lián)度,地表位移(Mp)與土壓力(Dm),內(nèi)部位移(Ep),濕度(Hum),降雨量(Rg),土壤含水率(Smc),孔隙水壓力(St),溫度(Tpr)的關(guān)聯(lián)度為0.8325,0.6114,0.4312,0.6233,0.7827,0.7416,0.7404如圖3所示,由關(guān)聯(lián)度的大小可知土壓力,土壓力,土壤含水率,溫度這幾個(gè)特性指標(biāo)與地表位移的相關(guān)性較大,其對(duì)地表位移綜合影響為利用多變量同時(shí)預(yù)測(cè)地表位移下一時(shí)刻提供了可能.

圖3 地表位移(Mp)與各特性指標(biāo)的關(guān)聯(lián)度
由2.2可知地表位移在所有特性指標(biāo)中為第一主成分,可以利用地表位移作為預(yù)測(cè)排土場(chǎng)滑坡的重要特性指標(biāo),同時(shí)由2.3得出地表位移與其他特性指標(biāo)間的關(guān)聯(lián)度大小,為利用多個(gè)其他特性指標(biāo)預(yù)測(cè)地表位移提供了重要依據(jù).基于LSTM的多變量預(yù)測(cè)得的神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖4所示.

圖4 LSTM多變量預(yù)測(cè)神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
圖4中,輸入層為經(jīng)過(guò)有監(jiān)督時(shí)間序列化處理后的礦山排土場(chǎng)的各特性指標(biāo),隱含層為長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM),LSTM是RNN的一種變體,是RNN的一種特殊單元,LSTM將RNN中隱含層的神經(jīng)元替換成了記憶塊,每個(gè)記憶塊中包含一個(gè)或多個(gè)記憶細(xì)胞和3種非線性求和單元,這樣的做法很好地解決了傳統(tǒng)RNN存在梯度消失的問(wèn)題[15],LSTM存儲(chǔ)單元的基本結(jié)構(gòu)如圖5所示; 輸出層為下一時(shí)刻地表位移這一特性指標(biāo).

圖5 存儲(chǔ)單元基本結(jié)構(gòu)
存儲(chǔ)單元的運(yùn)作原理由以下面5個(gè)公式表示:

1) 按照前向計(jì)算方法公式(8)–(12)計(jì)算LSTM細(xì)胞的輸出值;
2) 反向計(jì)算每個(gè)LSTM細(xì)胞的誤差項(xiàng),包括按時(shí)間和網(wǎng)絡(luò)層級(jí)兩個(gè)反向傳播方向;
3) 根據(jù)相應(yīng)的誤差項(xiàng),計(jì)算每個(gè)權(quán)重的梯度;
4) 應(yīng)用基于梯度的優(yōu)化算法更新權(quán)重.
梯度算法是求解最優(yōu)化問(wèn)題的一類重要方法.算法選取目標(biāo)函數(shù)的負(fù)梯度方向作為搜索方向,并且常依據(jù)目標(biāo)函數(shù)的梯度來(lái)確定搜索步長(zhǎng).梯度優(yōu)化算法有隨機(jī)梯度下降(SGD),RMSProp,AdaGrad,Adam等,以平均絕對(duì)誤差(MAE)為目標(biāo)損失函數(shù),圖6和圖7表示的是不同梯度優(yōu)化算法在訓(xùn)練集和測(cè)試集上的損失函數(shù)曲線,發(fā)現(xiàn)Adam優(yōu)化算法表現(xiàn)比其他優(yōu)化算法效果更好,本文選用適應(yīng)性動(dòng)量估計(jì)算法(Adam),Adam是一種有效的基于梯度的隨機(jī)優(yōu)化算法,該算法融合了AdaGrad和RMSProp算法的優(yōu)勢(shì),能夠?qū)Σ煌瑓?shù)計(jì)算適應(yīng)性學(xué)習(xí)率并且占用比較少的存儲(chǔ)資源.試驗(yàn)結(jié)果表明Adam相比與其它的隨機(jī)優(yōu)化算法在實(shí)際應(yīng)用中整體表現(xiàn)更優(yōu)[16].

圖6 訓(xùn)練集上各梯度優(yōu)化算法

圖7 測(cè)試集上各梯度優(yōu)化算法
基于上述的相關(guān)模型和算法,其具體流程為:
1) 數(shù)據(jù)預(yù)處理,包括異常值的舍棄,缺失值的填補(bǔ)以及數(shù)據(jù)的篩選;
2) 將數(shù)據(jù)轉(zhuǎn)化為有監(jiān)督的時(shí)間序列,便于對(duì)對(duì)下一時(shí)刻的數(shù)值進(jìn)行相應(yīng)的預(yù)測(cè),劃分訓(xùn)練集和測(cè)試集,訓(xùn)練集為數(shù)據(jù)集的80%,測(cè)試集為20%;
3) 訓(xùn)練與評(píng)價(jià)模型,利用前兩步處理后的數(shù)據(jù)和Adam優(yōu)化算法,學(xué)習(xí)率為1.0,神經(jīng)元的節(jié)點(diǎn)數(shù)為50,采用Relu激活函數(shù),訓(xùn)練基于LSTM的深度神經(jīng)網(wǎng)絡(luò).
性能評(píng)價(jià)指標(biāo)有均方根誤差(RMSE),一致性指數(shù)(IA),本文以RMSE來(lái)評(píng)估網(wǎng)絡(luò)的預(yù)測(cè)效果,如公式(13),RMSE的值越小則預(yù)測(cè)效果越好.

本文以貴州某礦山排土場(chǎng)的相關(guān)數(shù)據(jù)為驗(yàn)證對(duì)象,根據(jù)主成分分析和關(guān)聯(lián)性分析,提出采用通過(guò)預(yù)測(cè)地表位移值的方法來(lái)判斷礦山排土場(chǎng)滑坡的風(fēng)險(xiǎn)性.根據(jù)地表位移與其它特性指標(biāo)間的關(guān)聯(lián)度大小,選取地表位移(Mp)與土壓力(Dm),內(nèi)部位移(Ep),降雨量(Rg),土壤含水率(Smc),孔隙水壓力(St),溫度(Tpr)這7個(gè)特性指標(biāo)預(yù)測(cè)下一時(shí)刻地表位移的大小,預(yù)測(cè)效果如圖8所示,圖8中顯示的是通過(guò)LSTM對(duì)地表位移預(yù)測(cè)的結(jié)果和真實(shí)值的結(jié)果,從圖中可以看出通過(guò)多變量預(yù)測(cè)地表位移的效果是比較好的,通過(guò)多變量對(duì)地表位移的預(yù)測(cè),由于在前文對(duì)礦山排土場(chǎng)的數(shù)據(jù)分析當(dāng)中,得出地表位移在所有特性指標(biāo)當(dāng)中影響較大,同時(shí)與其它特性指標(biāo)間存在著較強(qiáng)的關(guān)聯(lián)性,對(duì)排土場(chǎng)地表位移的預(yù)測(cè),在一定程度上可以為礦山排土場(chǎng)的滑坡風(fēng)險(xiǎn)進(jìn)行預(yù)估.圖9中顯示的是在損失函數(shù)曲線的收斂狀況,從圖中可以看出LSTM模型在進(jìn)行數(shù)據(jù)訓(xùn)練和測(cè)試時(shí)效果都較好,收斂速度塊,訓(xùn)練集和測(cè)試集的擬合效果較好,均方根誤差RMSE=1.7156.

圖8 LSTM模型預(yù)測(cè)結(jié)果

圖9 LSTM損失函數(shù)
由2.3節(jié)可知,地表位移與土壓力(Dm)的關(guān)聯(lián)度最大,與濕度(Hum)的關(guān)聯(lián)度最小,為了驗(yàn)證各個(gè)特性指標(biāo)對(duì)預(yù)測(cè)下一時(shí)刻地表位移的精度影響,選取除土壓力(Dm)特性指標(biāo)以外的其它特性指標(biāo)通過(guò)LSTM模型預(yù)測(cè)下一時(shí)刻地表位移.預(yù)測(cè)效果如圖10所示,土壓力(Dm)與地表位移(Ep)的關(guān)聯(lián)度達(dá)到了0.8325,在缺失土壓力(Dm)這一指標(biāo)特性指標(biāo)的情況下,地表位移的預(yù)測(cè)精度會(huì)大幅度下降; 在加上濕度(Hum)這一特性指標(biāo)后,通過(guò)LSTM的模型訓(xùn)練,對(duì)地表位移預(yù)測(cè)的效果如圖11所示,其均方根誤差RMSE=1.6932濕度(Hum)這一特性指標(biāo)對(duì)地表位移的影響較小.

圖10 不含土壓力(Dm)的預(yù)測(cè)結(jié)果

圖11 含濕度(Hum)的預(yù)測(cè)結(jié)果
通過(guò)試驗(yàn)得知與待預(yù)測(cè)對(duì)象關(guān)聯(lián)度較大的特性指標(biāo)對(duì)預(yù)測(cè)結(jié)果的精度影響較大,而與待測(cè)對(duì)象關(guān)聯(lián)度較小的特性指標(biāo)對(duì)與檢測(cè)結(jié)果的精度影響很小,本文提出的PCA-LSTM模型對(duì)礦山排土場(chǎng)下一時(shí)刻地表位移預(yù)測(cè)效果較好.
本文針對(duì)礦山排土場(chǎng)的滑坡發(fā)生的動(dòng)態(tài)性、滯后性,多組指標(biāo)之間的高非線性,影響礦山排土場(chǎng)滑坡的因素很多,數(shù)據(jù)集中8個(gè)特性指標(biāo)都會(huì)或多或少地影響排土場(chǎng)滑坡通過(guò)對(duì)所有特性指標(biāo)進(jìn)行數(shù)據(jù)分析,在主成分分析當(dāng)中地表位移為第一主成分,同時(shí)由關(guān)聯(lián)性分析得知地表位移與其它指標(biāo)具有較大的關(guān)聯(lián)性,采用地表位移作為預(yù)測(cè)目標(biāo),主成分分析與關(guān)聯(lián)性分析結(jié)合有效減少了數(shù)據(jù)集的維度,加快了預(yù)測(cè)效率,主成分分析屬于無(wú)監(jiān)督學(xué)習(xí)算法,在確定將地表位移作為預(yù)測(cè)目標(biāo)時(shí)避免了人為選擇的主觀性.
本文提出采用以地表位移為顯著特性指標(biāo)對(duì)礦山排土場(chǎng)的滑坡風(fēng)險(xiǎn)進(jìn)行預(yù)測(cè),通過(guò)LSTM模型的多個(gè)特征指標(biāo)預(yù)測(cè)短時(shí)期內(nèi)地表位移的狀況,進(jìn)而提前預(yù)知排土場(chǎng)滑坡的可能性,預(yù)測(cè)結(jié)果穩(wěn)定性好,為利用將多個(gè)特性指標(biāo)綜合成單個(gè)顯著特性指標(biāo)對(duì)礦山排土場(chǎng)滑坡預(yù)測(cè)提供了新的思路.