徐 進,劉麗莎,章龍管,段文軍,劉綏美
1.西南交通大學經濟管理學院,四川 成都610031
2.中鐵工程服務有限公司,四川 成都610083
盾構是在可移動鋼結構護盾掩護下完成開挖、排碴、襯砌等掘進作業的機、電、液、傳感、信息一體化大型復雜裝備[1]。因其相對安全、快速、經濟、機械化程度高、勞動強度低、不受天氣影響等特點,被廣泛地應用于各類隧道和地下工程建設中。根據盾構機各組成部分的功能特征,可將其分為不同的子系統,如刀盤系統、驅動系統、排土系統、管片安裝系統等等。由于盾構系統構成十分復雜且工作環境惡劣,盾構在施工過程中經常會出現各種故障。這些故障不但會影響項目進度、造成經濟損失,嚴重時還會危及到工作人員及工地周邊的安全。因此,如何對盾構故障進行有效預測是目前盾構研究與應用中較為關注的問題。
隨著大數據技術的發展,一些企業通過盾構大數據云平臺采集了盾構施工運行的全過程數據,包括盾構機本身的運行參數、故障報警、工程進度、地質水文等數據,積累了海量的盾構施工過程數據。目前有關盾構故障的研究可以分為兩類,一類是關于盾構施工故障的成因分析,一類是關于盾構故障的診斷或預測。前者關注的是盾構機本身的運行機理,根據故障形成的原因,討論可行的改進方法[2,3]。后者從早期的神經網絡、專家系統等模型的應用逐步過渡到利用機器學習、深度學習對盾構故障進行建模分析的階段[4-10],建立了一些基于故障知識的專家系統和基于機器學習、深度學習的預測模型,取得了一定的成績。其中,深度學習已經成為學術界和工業界共同關注的焦點,因其在特征提取和模式識別方面的獨特優勢,被廣泛地應用于工業設備故障診斷領域[11]。綜合國內外的相關研究發現,雖然盾構施工受到地層類型、機器參數、工人技能等多方面因素的影響,但是盾構故障的發生依然是有跡可循的,盾構施工參數和盾構故障之間存在著密不可分的聯系。
但在現有的研究中,多數學者都只研究了盾構單一子系統的故障,如液壓系統故障、刀盤故障等等[9,10,12,13]。而在實際盾構施工中,往往是多個子系統同時存在故障。即某一個時刻的盾構施工數據可能對應著多個不同類型的故障,這就屬于多標簽數據類型[14],傳統的針對單一類型的故障預測方法難以對實時施工決策提供有效的幫助。另外,盾構施工是一個持續的動態的過程,這些施工時序數據反映了盾構各系統的運行狀態,包含了故障發生前后的全部信息。而目前很少有學者對施工序列數據進行挖掘分析。
因此,本文研究了盾構故障多標簽預測的問題,根據某大型城市地鐵A 期工程B 標段土壓平衡盾構機的實際施工數據和故障報警數據,針對經常發生故障的刀盤系統、排土系統和注漿系統,利用長短期記憶網絡(Long-Short Term Memory,LSTM)善于處理時序數據的優點,對盾構施工序列數據和這三類故障之間的關系進行監督學習,探索利用盾構施工序列數據對將要出現單類或多類故障進行預測的方法。
基于PCA-LSTM 的盾構故障多標簽預測模型的整體框架見圖1。

圖1 基PCA-LSTM 的盾構故障多標簽預測模型整體框架圖Fig.1 The framework of multi-label prediction model for shield faults based on PCA-LSTM
首先獲取盾構機施工數據,進行PCA 特征提取。然后將經過PCA 處理得到的盾構施工參數的主成分與地質、風險源數據進行集成,利用故障數據對集成后的施工數據進行標注,生成序列數據,并進行故障標簽位移,得到LSTM 模型的輸入數據,并劃分訓練集和測試集。然后進行LSTM 盾構故障多標簽預測,包括模型的網絡結構及超參數設置、模型的訓練和測試。最后用基于多標簽的模型評估指標對預測結果進行評估。
雖然深度學習在理論上能夠從原始數據中自動提取有用的特征,但是有著良好特征的輸入數據往往能達到更好的效果,減少深度學習模型在訓練時對其他資源的依賴[15]。主成分析法通過原有變量之間的線性組合代替原有變量,確保新組成變量間彼此互不相關,從而將高維數據進行壓縮,極少地損失原有信息。
首先對盾構機全部子系統采集的施工參數進行篩選,去掉記錄設備狀態以及有關各種耗材的累積量的相關參數,最后保留了166 個盾構機施工參數。這些參數雖然從不同方面反應了盾構的施工狀態,但是參數之間不可避免的會產生信息冗余和噪聲,因此需要對施工參數進行主成分分析。根據特征值和累計貢獻率對主成分進行選擇,將原來的166 個施工參數壓縮成20 個主元成分,保留了原始數據約89%的信息,得到部分主成分見表1。

表1 PCA 特征提取部分結果Table 1 Partial results from PCA feature extraction
地質類型指的是盾構掘進過程中所處的地質環境。盾構施工風險源主要是指盾構施工中通過重要建(構)筑物的情況。在現實環境中,地質和風險源都會影響盾構機施工參數的設置。首先將經過PCA 特征提取得到的盾構施工參數的主成分和地質數據、風險源數據進行集成,然后利用故障數據對集成的施工數據進行標注。其中,地質和風險源數據利用數據采集環號與盾構施工數據進行集成;故障數據則根據故障的起始和結束時間對盾構施工數據進行故障類型的多標簽標注,每類故障標簽的取值均為“0”和“1”,分別表示無該類故障和有該類故障。然后生成序列數據,進行故障標簽位移,得到LSTM 模型的輸入數據。
LSTM 是Hochreiter 和Schmidhuber 提出的一種循環神經網絡(RNN)的擴展模型[16]。它在原始的RNN 中引入了記憶塊的概念,在記憶塊中包括CEC(Constant Error Carrousel)單元、輸入門(Input gate)、輸出門(Output gate),通過自循環形成了可以使梯度長期流動的路徑,解決了RNN梯度消失的問題。后來Gers 等人擴展了記憶塊的思想,在記憶塊中加入了能夠控制CEC 的狀態的遺忘門(Forget gate),這讓網絡能夠丟棄不需要的信息,遠離飽和狀態[17]。因此,LSTM 模型克服了RNN 的缺點,解決了RNN 梯度消失和長期依賴的問題,能夠對時序數據進行有效學習。
基于LSTM 的盾構故障多標簽預測模型網絡結構如圖2 所示,整體可分為盾構施工序列數據的輸入層、包含LSTM 和多個全連接的隱藏層以及最后預測值輸出的輸出層。

圖2 LSTM 盾構故障多標簽預測模型結構示意圖Fig.2 Schematic diagram of LSTM shield fault multi-label prediction model
在該模型中,最重要的部分就是LSTM 層,通過LSTM 層對盾構施工序列數據和盾構系統故障之間的關系進行學習,將學習到的信息傳遞給后面的全連接層進行處理。全連接層的每個神經元都與上一層的全部節點相連接,因此它能夠將前面LSTM 層學習到的所有特征綜合起來,逐層傳遞給輸出層。編譯模型時選擇Adam 優化算法。為了適應對多故障標簽的學習,本文通過基于Sigmoid交叉熵的多標簽損失函數進行盾構故障多標簽損失的計算,用損失函數最小作為目標函數進行網絡權值的優化,其計算公式見式(1)[18]。其中,為模型輸出的第i個樣本第l個標簽的概率估計,Jml綜合考慮了全部標簽的損失,使模型在訓練階段能夠學習到故障標簽之間的關系,提高故障多標簽預測的準確度。

關于多標簽分類學習的評價方法主要有基于標簽的評估方法和基于樣本的評估方法。基于標簽的評估方法首先對每個標簽的預測結果進行評估,然后對整體結果進行評估[14]。其中,對單個標簽評價的常用的指標有查全率、查準率、F1 分數等等。對整體標簽的評價則是在單個標簽評價的基礎上進行的,評價指標有宏觀平均和微觀平均[14]。
基于樣本的評估方法將測試集中所有預測結果和實際值的差距取平均,差距越小說明模型預測結果越好。常用的指標是分類準確率(Accuracy),其計算公式見式(2)[19]。其中,Ypredi是第i個樣本的標簽的預測結果,Ytruei是第i個樣本的標簽的實際值,只有當Ypredi和Ytruei完全相等時,才有δ=0,否則δ=1。即對于多標簽數據樣本,只有當預測的多標簽集合和該樣本的真實標簽集合完全一致時,才算預測正確。

本文實驗數據來源于某大型城市地鐵施工項目,施工數據的采集頻率為3 次/min。本文針對經常出現故障的刀盤系統、排土系統和注漿系統(標簽依次為A、B、C)進行故障預測,圖3 展示了數據預處理后的盾構施工集成數據的分布情況,表2 統計了測試集上的樣本數量,其中Z 表示沒有故障發生。從圖3 可以看出,如果把每個標簽集合都看作單標簽來進行預測,不同標簽樣本差異量較大,部分多標簽數據量非常少,難以學到有效信息。

圖3 數據集故障標簽統計Fig.3 Data set fault label statistics

表2 測試集故障標簽統計Table 2 Test set fault label statistics
分別用基于標簽的方法和基于樣本的方法對預測結果進行評估。基于標簽的評估方法結果見表3。表3 分別統計了測試集上刀盤、排土系統、注漿系統以及這三類標簽整體的故障預測的查準率、查全率和F1 分數,即各標簽值為“1”時對應的評價指標情況。其中,這三類標簽整體的故障預測查準率、查全率、F1 分數的宏觀平均指標分別為0.8727、0.9345、0.8988,說明該模型對故障樣本的整體預測效果較好。
對多標簽樣本的預測結果進行統計(表4)。測試集上的多故障樣本完全預測正確的比例約為0.8135,并且大多數的多故障樣本都能至少預測到一類故障。用基于樣本的方法對預測結果進行評估,對于測試集上的全部樣本來講,包括單故障樣本和多故障樣本,模型的整體準確率約為0.7495。說明該方法能夠建立起從盾構施工序列數據到盾構機故障的映射關系,提高盾構故障處理的效率。

表3 基于標簽的整體評估結果Table 3 Assessment results based on label

表4 多標簽樣本的預測結果統計Table 4 Statistics of multi-label samples
本文從實際的盾構施工實踐出發,發現盾構在施工中經常出現多類故障同時存在的情況,只針對單一類型的故障診斷方法無法解決多類故障同時存在的問題,同時發現現有研究缺乏對盾構施工時序數據的挖掘分析。因此,本文針對盾構施工中的多故障問題,設計了基于PCA-LSTM 的盾構故障多標簽預測模型,利用某大型城市地鐵施工項目收集的施工數據進行實驗,結果表明該模型在單故障和多故障的預測中都有較好表現,可以幫助施工人員及時進行故障預警,合理進行盾構施工操作。未來進一步的研究可以考慮對盾構機故障進行詳細分析,建立盾構故障知識庫,輔助盾構故障預測,從而提高模型的準確率和泛化能力。