谷 晟,別鋒鋒,郭 越,彭 劍,趙 威
(常州大學 機械與軌道交通學院,江蘇 常州 213164)
管道作為重要的流體輸送工具,其在石油石化、供給排水、天然氣等其他流體輸送領域中占有非常重要的地位。一旦管道發生故障,將會造成巨大的經濟損失,甚至還會引發安全事故,因此對管道狀態進行檢測與診斷尤為必要[1-2]。但是由于現場環境的復雜性,采集到的管道振動信號往往是非線性,非平穩的。針對如何從非線性,非平穩的管道信號中提取表征管道缺陷類型的故障特征并進行有效的模式識別,國內外學者進行了大量的研究分析。目前,針對管道故障特征提取,最常用的方法是對振動信號進行時頻分析。一般,時頻分析方法主要包括經驗模態分解[3]、小波分析[4]、局部均值分解[5]、核主元分析[6]等。其中,經驗模態分解方法[3](EMD, empirical mode decomposition)是處理非線性振動信號的強有力的工具,但是該方法計算效率較低,易造成模態混疊和虛假分量等問題。為了降低模態混疊,文獻[7]提出了集合經驗模態分解(EEMD, ensemble empirical mode decomposition)方法,雖然該方法可以在一定程度上抑制模態混疊,但計算效率依舊相對較低。隨后,文獻[8]提出了一種帶有自適應白噪聲的完全集合經驗模態分解(CEEMDAN, complete ensemble empirical mode decomposition with adaptive noise)算法,該算法在EEMD的基礎上,既減少了模態混疊又提高了信號的分解效率。
深度學習理論作為機器學習領域的最新研究成果,自提出以來已經在圖像識別[9]、語音識別[10]、故障診斷[11]等領域得到了廣泛的應用。深度學習方法以數據為驅動,相比于傳統的機器學習方法具有更強的特征學習能力,對于分析復雜多變,非結構化的模型具有顯著的優勢[12]。其中,長短時記憶網絡(LSTM, long short term memory)作為一種特殊的循環神經網絡(RNN),它很好的彌補了一般RNN模型中的梯度爆炸及消失等不足,并且對于一些時間序列信息的處理具有較高的自適應性[13]。于洋等[14]針對不同工況下軸承故障聲發射信號的辨識問題,基于長短時記憶網絡與遷移學習方法構建模型,充分挖掘不同工況下軸承聲發射信號之間的關系,從而實現了多工況下軸承故障聲發射信號的智能辨識。王鑫等[15]從復雜系統的歷史故障數據出發,提出一種基于LSTM的故障時間序列預測模型,并且通過實驗證明,該模型在故障時間序列分析中具有更強的適用性以及更高的準確性。陳偉等[16]利用LSTM對時間序列優異的處理能力,將軸承的振動信號數據作為深層LSTM的輸入,取得了很好的辨識準確率。王維鋒等[17]提出基于LSTM的齒輪故障診斷模型,成功解決了在診斷過程中數據量大、提取特征困難等問題。
本文采用ICEEMDAN-LSTM深度神經網絡方法,改進的完全集合經驗模態分解方法[10](ICEEMDAN)通過對加入的噪聲作進一步優化,可有效的減少信號在分解過程中分量產生的殘余噪聲和虛假分量等問題。LSTM深度神經網絡算法則在分類過程中具有更強的學習和分類能力。因此,針對管道故障特征微弱難以提取的問題,本文提出了一種基于LSTM深度神經網絡的管道缺陷模式識別方法。首先利用ICEEMDAN對管道振動信號進行分解生成一系列本征模態分量(IMF),隨后根據相關峭度準則篩選有效IMF分量并計算近似熵作為特征向量集合,然后基于深度神經網絡的理論基礎構造LSTM深度神經網絡模型并對其進行參數優化,最后將特征向量集合導入進行訓練和識別。
ICEEMDAN作為CEEMDAN的改進算法,其主要在CEEMDAN的基礎上,在信號進行分解迭代時加入高斯白噪聲并且對生成的新的信號求平均。相比較CEEMDAN信號分解方法該方法極大的抑制了信號在分解過程中產生的殘余噪聲及虛假分量的現象并且有效提高了信號分解效率[18]。其具體的信號分解過程如下:
步驟1:原始信號加入高斯白噪聲
(1)
其中:x為原始信號;ω(n)為被添加的第n個高斯白噪聲;e1為第一次信號分解時信號的期望信噪比;E1(·)為計算信號的第1個IMF的算子。
步驟2:計算第一次分解的殘差r1
(2)
其中:[·]為計算N個信號平均的算子。
步驟3:計算原始信號的第一階模態分IMF1
IMF1=x-r1
(3)
步驟4:構造第k(k≥2)組加入高斯白噪聲的信號
(4)
其中:ek為第k次信號分解時信號的期望信噪比;Ek(·)為計算信號的第1個IMF的算子。
步驟5:計算第K階殘差rk
(5)
步驟6:計算K階模態分量
IMFk=rk-1-rk
(6)
步驟7:迭代終止條件
(7)
其中:σ為相鄰兩次IMF分量之間的標準差。令k=k+1,返回步驟4計算下一k值,直至殘差滿足迭代終止條件。本文采用Cauchy收斂準則,即當相鄰兩次IMF分量之間的標準差σ<0.2時,迭代終止。
LSTM是一種特殊的循環神經網絡(RNN),它很好地彌補了一般RNN模型中的梯度爆炸及消失等不足。LSTM的主要特征是包含3個門選擇結構和一個記憶存儲單元結構,其中3個門選擇結構分別是遺忘門、輸入門和輸出門。LSTM靠這些“門”結構讓輸入特征有選擇性的影響神經網絡每個時刻的狀態[19]。所謂的“門”結構就是使用一個sigmoid作為激活函數的全連接神經網絡輸出一個0~1間的數值。當一個特征向量輸入到LSTM神經網絡中訓練時,可以根據規則來判斷是否有用。只有符合算法認證的信息才會留下,不符的信息則通過遺忘門被遺忘。LSTM的網絡結構如圖1所示。

圖1 LSTM網絡結構圖
遺忘門用于判斷記憶單元內容是否保留,從而實現對記憶內容的篩選,其輸出為:
ft=σ(Wxfxt+Whfht-1+bf)
(8)
式中,ft為遺忘門的輸出;σ為激活函數sigmoid;wxf為輸入和遺忘門之間的權重;whf為歷史輸出和遺忘門之間的權重;bf為遺忘門偏置;xt表示t時刻的輸入向量;ht-1為前一時刻的輸出狀態。
輸入門用于特征導入并且更新單元狀態,當神經網絡的其他部分想要寫入存儲單元的時候,必須先通過輸入門。若輸入門關閉,則其他神經元就無法把值寫入。其輸出為:
it=σ(Wxixt+Whiht-1+bi)
(9)
式中,it為遺忘門的輸出;wxi為輸入和輸入門之間的權重;whi為歷史輸出和輸入門門之間的權重;bi為輸入門偏置。
另外,在獲得遺忘門的輸出和輸入門輸出之后,可以得到當前的記憶單元狀態為:
(10)
(11)

輸出門用于控制單元狀態的最終輸出,并且決定外界的神經元能否把值從存儲單元中讀出來。單元輸出由輸出門輸出和當前單元
狀態信息相乘并經過tanh激活函數得到。故,輸出門和單元輸出為:
ot=σ(Wxoxt+Whoht-1+bo)
(12)
ht=ottanh(ct)
(13)
式中,ot為遺忘門的輸出;wxo為輸入和輸出門之間的權重;who為歷史輸出和輸出門之間的權重;bo為輸出門偏置;ht為當前時刻的單元輸出。
本文提出基于LSTM深度學習模型對管道缺陷模式的識別方法,主要分為3個部分:首先,對管道振動數據進行特征提取;其次,建立LSTM模型并對其參數進行優化;最后,利用LSTM模型進行故障識別。具體故障診斷步驟如下:
1)通過多傳感器分別采集孔洞、凹坑、裂紋及正常4種不同類型管道在運行狀態下的振動信號。
2)對采集到的信號進行ICEEMDAN分解,并提取近似熵作為表征管道運行狀態的特征值特征構造特征向量集合。選取其中的80%作為訓練樣本數據,把剩余的作為測試樣本數據。
3)基于深度神經網絡理論基礎建立LSTM深度神經網絡模型,并運用該模型對訓練樣本數據進行訓練,不斷調整優化模型中的epoch、batch等參數使訓練準確率保持在較高的區間。
4)將測試樣本數據輸入到訓練好的LSTM深度神經網絡模型中,實現管道故障的識別。
為了驗證該方法的有效性,利用實驗室的管道故障模擬實驗平臺,分別對管道進行銼刀摩擦,打開泄漏閥,紗布摩擦來模擬工程實際中凹坑、孔洞、裂紋3種管道故障模式以及利用完整的管道來模擬正常模式,并利用水泵向管道通水,當管道處于穩定狀態時分別采集管道在這4種運行狀態下的振動信號數據。另外考慮到在實際工業過程中,因為長輸管線的缺陷位置一般不確定,所以在測試振動信號時傳感器的放置位置離缺陷處的位置往往是不確定的,進而導致傳感器在不同測點所采集到的管道振動信號特征也會有所不同。在遠離缺陷位置如在管道接頭處及管卡固定處,由于信號在傳遞過程中會受其影響,此時所采集到的振動信號特征就會比較微弱。因此,本次實驗充分考慮這些實際因素的影響,主要在靠近管卡處、離缺陷位置較遠處、靠近激勵處等位置布置測點,進行管道振動信號的采集。管道振動信號檢測如圖2所示。如圖所示,實驗儀器包括接觸式激振器,掃頻發生器,壓電式加速度傳感器、動態信號采集儀及相應的采集軟件。首先通過激振器和掃頻發生器加強管道運行工況下的振動情況,然后利用加速度傳感器在管道上隨機布置測點,通過動態信號采集儀及操作PC端采集軟件采集管道振動信號。實驗室管道系統及3種故障模式如圖3所示。

圖2 管道振動信號檢測示意圖

圖3 實驗室管道平臺及故障模式
本次實驗采集了凹坑,孔洞,裂紋和正常運行4種工況下的管道振動信號,對振動信號進行ICEEMDAN分解。以凹坑管道的一組振動信號為例,如圖4所示,為管道振動信號ICEEMDAN分解波形圖(前7個分量),從圖4中可以看出,將原始振動信號進行ICEEMDAN處理后的信號沖擊特征明顯,有利于故障特征的提取。

圖4 信號分解結果圖
基于ICEEMDAN方法對4種工況下的管道振動信號進行分解共得到12個IMF分量和一個余量。但是,一般在分解過程中得到的IMF分量可能會包含不能夠表征管道狀態的偽分量,若直接進行特征提取不僅會導致向量集合的維數過多,而且會影響最終的辨識準確率。因此,篩選有效的IMF分量是特征提取的關鍵。本文根據峭度準則計算峭度值以此來篩選出最能表征不同工況下管道運行狀態的IMF分量。如圖5所示,為各階IMF分量峭度值變化趨勢。一般,正常平穩運行且噪聲干擾小的信號,其峭度值大于3。從圖5中可以看出,前七階IMF分量的峭度值呈逐漸降低的趨勢且數值大小都大于3,因此選取IMF1-IMF7分量進行后續的特征提取分析。

圖5 各階IMF峭度值變化趨勢
針對管道缺陷信息的特征提取,本文預從時頻域特征進行分析處理,從而構造特征樣本集合。信息熵是一種非線性估計方法,主要通過量化的熵值對非穩態信號的復雜性程度進行衡量。信息熵理論作為特征提取的方法之一,廣泛應用在對有噪聲夾雜信號中有效信息的提取。它實際上是一個描述如設備運行的復雜程度、診斷的難易程度等無法明確量化確定的指標。故本文最終選取信息熵論中的近似熵作為表征4種工況下管道狀態的特征集合。另外,本次實驗所采集的管道振動信號樣本共計4個類別,分別為正常、裂紋、孔洞及凹坑。在樣本數據采集過程中,采樣時間設置為60 s。每種工況下的管道振動信號為1 000組,總樣本數為4 000組。以每種工況下管道振動信號樣本數據中的一組數據為代表,圖6分別展示了4種工況下管道振動信號的近似熵在空間上的特征分布情況。
為了直觀地顯示特征提取的效果,選取ICEEMDAN分解的前3個IMF分量來分析特征向量在三維空間上的聚類情況。選取特征近似熵的三維空間特征分布如圖6所示,從圖中可以看出4種工況下管道振動信號的特征分布均呈現云狀分布,其中有部分樣本特征發生重疊現象。這是因為近似熵作為信息熵的一種,主要用來對信號特征的無序性與復雜性進行描述。一般正常運行的管道其在運行過程中受到的沖擊較少,因此正常管道的振動信號的熵值較大,無序性也較高。當管道中出現諸如孔洞、凹坑、裂紋等缺陷時,其在運行過程中的沖擊特征就會增強,相應的管道振動信號的無序性就會變低。反應到特征值的空間分布上,雖然可以初步達到聚類的效果,但是樣本特征重疊較多,尤其是針對凹坑、裂紋、孔洞管道的樣本特征值。因此,對管道振動信號進行特征提取后,需要做進一步的深層次的分析處理才能實現對管道狀態的有效識別。
針對不同缺陷類型管道微弱特征難以識別的問題,本文建立了LSTM深度神經網絡分類模型。整個神經網絡由輸入層(Input);隱含層(LSTM層,full connect layer層)和輸出層(Loss)組成。數據由輸入層流入,經過LSTM神經網絡并使用Tanh激活函數非線性化,再流入全連接層并使用Sotfmax函數激活,最后輸出。本文主要按照以下3個步驟設計網絡結構。
第一步:構建LSTM深度神經網絡模型。LSTM深度神經網絡結構設計如圖7所示,LSTM層激活函數(activate function)選擇Relu函數,全連階層激活函數選取Softmax函數,輸入層即特征處理的特征向量。

圖7 基于LSTM的深度神經網絡結構設計
第二步:計算損失函數(loss function)大小。損失函數描述的是神經網絡計算結果和實際結果之間的誤差,最終的目標是通過梯度下降使得找到一組合適的權值和偏置值使得損失函數的值最小。常見的損失函數有均方差損失函數和交叉熵損失函數[20-21]。本文將會比較均方差損失函數和交叉熵損失函數的訓練結果,最后選擇適合管道缺陷深度學習模型的損失函數。
第三步:尋找一種方法快速確定各個神經元的權值和偏置值,即通過優化器(optimiter)確定合適的參數,使得整個網絡模型得到一個相對滿意的結果。在損傷識別過程中,本文比較了4種優化器(adagrad、adadelta、mini batch gradient descent、momentum)對于損失函數收斂性和最后識別準確率的影響,最后選擇出合適的優化器。
本文針對對凹坑、孔洞、裂紋和正常4種狀態的管道振動信號各提取了1 000組,共4 000組數據。每組數據采樣2 048個點。訓練樣本為在每種狀態中選取800組樣本數據,剩余的200組作為測試樣本。另外,比較均方差損失函數與交叉熵損失函數對于訓練模型的影響,最終分析選擇交叉熵損失函數。為了防止訓練過程中出現過擬合問題加入了Dropout。其他的具體參數如表1所示。

表1 編程參數
圖8和圖9分別展示了深度神經網絡的識別準確率和損失函數的大小。從圖8及圖9中可以看出,損失函數的值前20步迅速下降,此時模型距離全局最小值較遠,梯度快速下降,反應到準確率圖上就是前20步迭代過程準確率迅速提高,迭代了20步左右整個神經網絡模型就有一個不錯的識別準確率,損失函數逼近于全局的最小值,此時梯度下降變緩,在整個模型的全局最小值附近做一個緩慢的調整,在準確率識別圖的反應就是迭代多個周期以后準確率才有一個緩慢的提升。當迭代80步時整個模型相對穩定趨于全局最小值處,因此本模型的迭代步數設置為100。另外,單獨從圖8中可以看出參數優化過后的神經網絡識別準確率達到了95%。而且分類的準確率隨著訓練不斷提高的過程中沒有出現明顯的振蕩,這說明本模型的學習率設置合理。從圖9中可以看出,損失函數在快速下降后趨于一個收斂的值,說明模型結構和參數設置合理。

圖8 LSTM深度學習模型準確率

圖9 LSTM深度學習模型損失函數
將特征樣本集輸入LSTM深度神經網絡分類模型中,得到如圖10所示的分類結果圖,其中1、2、3、4分別代表孔洞、凹坑、裂紋、正常4類標簽。從圖10可以看出,訓練集、測試集及驗證集對4種不同缺陷類型的管道識別準確率基本達到了95%左右。而且該模型總的分類效果從圖10中所有混淆矩陣中可以看出達到了95.3%,其中對于標簽4即正常管道運行狀態的辨識準確率達到了100%,標簽1的識別率達到了99.2%,因此本模型的誤差主要集中在標簽2(識別準確率為92.5%)和標簽3(識別準確率為89.6%)的分類識別上。

圖10 訓練集、測試集和驗證集混淆矩陣
本模型的誤差的區間為[-1,1],將誤差區間均分為20份,作出模型的數據誤差直方圖,如圖11所示。圖中展示了模型訓練完后樣本訓練集、樣本測試集和樣本驗證集的誤差。從圖11中可以看出誤差主要分布在[-0.05,0.05],這說明了該神經網絡模型對于分類識別處于一個較小的誤差水平,同時也進一步表明所提出模型的結構穩定且對不同工況下管道故障檢測具有很好的識別效果。

圖11 誤差分析
針對管道振動信號特征微弱難以提取的問題,本文提出了一種基于LSTM的深度學習神經網絡模式識別方法。首先利用ICEEMDAN信號分解方法分解管道振動信號,該方法很好地克服了管道振動信號在分解過程中產生虛假分量和模態混疊的問題,對復雜的振動信號具有很好的分解效果。然后根據峭度準則選取前7階IMF分量并且構造近似熵特征向量集合。最后根據LSTM深度學習理論構造LSTM分類模型并對該模型中的參數進行優化,將特征向量集合導入LSTM深度神經網絡中進行模式識別。實驗結果表明:基于LSTM的深度神經網絡模型能夠較好的應用于管道故障檢測領域,而且故障識別準確率可達95%,顯著提高了對不同工況下管道故障檢測的辨識準確率。