周明珠,張藝寶,吳 雙,孔麗軍,王梓齊
(1.內蒙古霍煤鴻駿鋁電有限責任公司,內蒙古 通遼 029200;2.湖南中融匯智信息科技股份有限公司,湖南 長沙 410221;3.浙江大學 控制科學與工程學院,浙江 杭州 310027;4.浙江大學 湖州研究院,浙江 湖州 313002)
隨著煤化工產業的大規模發展,在環保技術方面的升級改造迫在眉睫。凈化分廠的持續高效運行取決于設備的可靠性和智能化程度。針對設備的各類隱性及顯性故障,需要開發智能監測預警及運維系統以指引設備的預防性維修。
滾動軸承作為旋轉機械中的關鍵基礎零件,其在凈化分廠中得到了廣泛的應用。滾動軸承將運轉的軸與軸座之間的滑動摩擦轉變成滾動摩擦以減小摩擦損失,軸承的健康狀況將直接影響旋轉機械的安全運行。為了提高設備的可靠性,對導致設備失效的故障隱患進行預測是至關重要的。故障預測與健康管理(prognostics and health management,PHM)是實現這一目標的有效技術,而RUL預測作為PHM的核心技術,是后續進行健康管理決策的基礎。
RUL預測方法主要分為兩類,即基于模型的方法和基于數據驅動的方法[1,2]。1)基于模型的方法是通過分析物理失效機制,建立描述機器退化過程的數學模型。但實際案例中,通常難以將其用于準確描述設備的物理失效機制,從而影響了退化模型RUL預測的準確性。2)數據驅動方法的預測準確性依賴于訓練數據的數量和質量,受模型結構的限制較少。其中,深度學習方法由于具備處理復雜非線性數據的能力,得到了越來越廣泛的應用[3]。
盡管基于深度學習的RUL預測研究取得了很大進展,但現有的大部分方法僅關注了RUL的點估計問題。在復雜的運行工況下,RUL預測可能會受到傳感器噪聲、建模不確定性及未來環境和工況的隨機變化等因素的影響[4],這些因素帶來的不確定性將大幅度降低點預測的可信度。因此,有必要對RUL預測中的不確定性量化問題展開深入研究[5]。
解決不確定性量化問題的傳統方法是采用貝葉斯方法,即結合先驗信息和新的觀測內容進行后驗推理。例如,將卡爾曼濾波器、粒子濾波器應用于RUL預測[6]。于震梁等人[7]采用支持向量機和非線性卡爾曼濾波相結合的方法預測了機械零件的RUL,得到了一定置信度的置信區間;但是狀態更新方程的建立需要假設狀態量與噪聲項相互獨立,在實際情況中往往難以滿足該條件。焦自權等人[8]采用改進的粒子濾波方法,預測了鋰離子電池的RUL,通過在狀態方程中引入噪聲項,進而考慮不確定性;但是由于方程中噪聲項跟隨狀態量,無法直接考慮最終預測值中的不確定性。
傳統的貝葉斯方法適用于較簡單的系統,隨著工業系統的結構日漸復雜,多工況、故障耦合等情況在實際運行過程中頻繁發生,傳統方法中構造的健康指標無法充分描述系統的特征信息。
近年來,由于深度學習方法具有強大的非線性擬合能力,將傳統貝葉斯方法融入深度學習的BNN[9]這一研究方向受到了廣泛關注。PENG Wei-wen等人[10]提出了BNN模型,在設計模型時將網絡中的參數從數值轉變為參數分布,從而進行了不確定性量化;但是計算過程中其采用變分推斷進行簡化,導致模型的準確度較低。胡城豪等人[11]通過引入高斯分布作為先驗信息,使模型的準確性得以提升;但是其仍未解決計算量大的問題。較高的計算成本是限制BNN實際應用的主要因素。
另一類常用的不確定性量化方法是Bootstrap集成方法[12]。HUANG Cheng-geng等人[13]采用Bootstrap與深度卷積網絡相結合的方法,對RUL預測中的不確定性進行了捕捉;但是該方法只考慮了數據不確定性,未對RUL預測過程中的模型不確定性進行分析。
筆者提出一種考慮不確定性量化的RUL區間預測方法,采用CNN構造預測模型,在模型中同時考慮數據不確定性與模型不確定性的量化;最后,采用軸承退化公開數據集進行實驗,以證明該方法的有效性及優越性。
卷積神經網絡(CNN)最早應用于圖像處理領域,具有局部感知、權重共享和池化3個特征。CNN在許多領域得到了應用,并獲得了優越的性能,包括計算機視覺、自然語言處理、語音識別等。CNN是將卷積核與原始輸入數據運算后提取特征,經過池化操作壓縮數據和參數量、減小過擬合,從而通過交替堆疊來學習抽象的特征表示。
模型的輸入為二維數據,其中,一維是特征參數,另一維是每個特征的時間序列。預測問題中的特征維信息來自軸承振動信號的時域特征,由于數據樣本中空間相鄰特征的關系不緊密,因此,筆者采用一維卷積操作[14]。
一維卷積操作的計算公式如下:
ci=f(ω·xi:i+FL-1+b)
(1)
式中:f為非線性激活函數;b為偏置項;ω為卷積核權重矩陣;xi:i+FL-1為經過長度為FL的滑窗得到的數據;ci為卷積核與某個滑窗內的序列數據計算后得到的特征。
筆者將卷積核應用于全數據序列的各個滑窗數據后,計算得到整體特征圖c。具體計算公式如下:
c=[c1,c2,…,cn-Fc+1]
(2)
式中:Fc為卷積核大小;n為全數據序列經滑窗后的總數。
通常情況下,Fc越大,獲得的結果越好,但是計算負擔也更大。實驗中,筆者折中選取Fc=10。
在CNN中,池化層通常緊隨卷積操作之后,被用于提取每個特征圖中重要的局部信息,并可顯著降低特征維數,減少模型參數的數量。池化非常適合應用于高維問題,例如圖像處理,但是這種操作在提高計算效率的同時過濾了部分有用信息。
實驗中,由于RUL預測問題中原始特征的維度相對較低,CNN中將不采用池化層[15]。
實際應用中,由于數據質量參差、模型存在預測誤差等原因,RUL預測問題往往存在一些不確定性,可將其劃分為兩類,即數據不確定性與模型不確定性。
數據不確定性又叫任意不確定性[16],它產生于觀測中固有的噪聲。數據不確定性來源于噪聲污染、測量誤差和傳感器技術限制等因素。這些因素一般是不可控的,所以數據不確定性無法隨著數據量的增加、訓練次數的提高而減小或消除[17]。
模型不確定性又叫認知不確定性,主要來源于模型結構和模型參數的不確定,本質是缺乏對模型的認識。不同于數據不確定性,其可以通過增加數據量和訓練次數而使模型不確定性減小。
在確保達到一定RUL預測準確率的同時,為了對預測過程中捕獲的數據不確定性與模型不確定性進行量化,實驗中采用區間形式輸出預測結果。筆者選取以下3個指標對預測結果進行性能評估:
1)采用RMSE評價點預測的準確率。RMSE的計算公式如下:
(3)
式中:RULpred為RUL預測值;RULtrue為RUL真實值;i為預測點;N為預測點總數。
2)采用PICP評價區間預測的結果。PICP表示真實值落在預測區間上下界內的比率,計算公式如下:
(4)
式中:Ui為區間上界;Li為區間下界;當yi∈[Li,Ui]時Ci=1,否則Ci=0。
3)采用平均預測區間寬度(mean prediction interval width,MPIW)評價區間預測的結果。MPIW用于衡量預測區間的狹窄程度,較窄的區間相對較寬的區間具有更高的價值,計算公式如下:
(5)
深度神經網絡方法的特點是:根據網絡結構,通過參數的學習與優化,逼近復雜的非線性函數,可以自適應地從原始輸入信號中捕獲信息。
模型的輸入為包含時間維度和特征維度的二維數據,其中,特征是從軸承原始振動信號中提取的趨勢性時域特征。筆者提出的RUL預測基礎模型是一個5層的一維卷積網絡。
模型的具體結構如表1所示。

表1 卷積神經網絡模型結構
CNN預測模型通過堆疊4個相同的卷積層進行特征提取,其采用全零填充方法保持特征維度不變,可得到多個與輸入相同維度的特征圖。該模型采用一個卷積核為3×1的網絡層組合多個特征圖,可獲得原始特征的高級表示;之后,二維特征圖被展平,并與全連接層連接,展平過程采用dropout方法以緩解過擬合;最后,在網絡末端放置高斯層,并采用2個輸出神經元,分別用于輸出預測值及相應的不確定性。
數據不確定性的量化是通過在網絡輸出層放置RUL的概率分布來實現的。筆者設RUL服從正態分布,設置網絡的輸出參數為(μ,σ),分別表示RUL的點預測值與不確定性大小。不同于點預測中僅輸出最佳的預測值y*,基于CNN的區間預測方法的輸出參數(μ,σ)是當RUL=y*時概率密度的最大值。
模型的訓練過程是通過最大化似然函數調整網絡權重和偏置項,從而獲得最優輸出。模型中RUL的概率分布表示如下:
(6)

訓練目標是最大化上述概率分布函數。
在模型訓練的初始階段,由于參數離最優值較遠,似然函數的變化相對較小,導致整體訓練速度較慢。因此,筆者在實驗中采用對數似然函數進行訓練,使參數的變化率在最優值附近較小,遠離最優值時較大,從而加快模型的收斂速度;同時,對數運算能夠將分布中的乘法運算轉換為加法運算,有利于反向傳播過程的求導操作。
在執行上述優化操作后,模型的損失函數如下:
(7)
LI Gao-yang等人[4]發現,模型不確定性可以采用模型方差表示;HU Chao等人[18]發現,采用更多數據訓練基礎學習器有助于減少預測偏差,而采用集成方法則有助于減少模型方差,即減小模型不確定性。
根據以上結論,基于CNN的區間預測方法,在整個數據集上采用均勻加權混合對模型進行集成,預測值和方差分別如下:
(8)
(9)
式中:M為集成模型的個數,實驗中取M=10。
為了驗證基于CNN的區間預測方法的一般性與有效性,筆者采用IEEE PHM 2012挑戰賽提供的軸承加速壽命實驗數據進行驗證分析。
實驗數據來自PRONOSTIA實驗臺,該試驗臺如圖1所示。

圖1 軸承加速退化PRONOSTIA實驗臺
軸承箱上裝有2個加速度計,分別測量垂直和水平方向的振動。數據采樣間隔為10 s,采樣率為25.6 kHz,采樣持續時間為0.1 s,即每次采樣2 560個數據。
實驗數據涉及3種不同的工況,且已完成訓練集與測試集的劃分。
PHM 2012軸承退化數據集如表2所示。

表2 PHM 2012軸承退化數據集
在數據集中,傳感器采集到的原始振動信號趨勢性不強、特征不明顯,且含有大量噪聲,直接采用原始數據進行RUL預測的難度較大。因此,筆者對單個采樣周期內的數據點進行時域計算,提取原始振動信號的7個時域特征作為RUL預測模型的輸入。
筆者采用的時域特征分別為:裕度指標、峰峰值、均方根值、偏度、峰值因子、峭度指標和波形因子。相比于原始振動信號,提取后的時域特征呈現出更明顯的變化趨勢。
首先,筆者對原始振動數據進行了預處理,提取相應的時域特征,然后將其輸入CNN模型;其次,CNN模型的高斯輸出層將輸出RUL的點預測值μ和表示不確定性的參數σ2,實現RUL的點預測和數據不確定性的量化目的;最后,筆者采用集成方法進行了M次訓練,得到M個CNN預測模型,均勻加權后得到了最終的預測結果,實現了模型不確定性的量化目的。
算法的整體流程如圖2所示。

圖2 算法流程框架圖
數據預處理過程中,筆者對振動信號的時域指標進行最大最小歸一化操作,計算公式如下:
(8)
式中:xmin為特征的最小值;xmax為特征的最大值。
在PHM2012數據集上,筆者對基于CNN的區間預測方法進行實驗。采用表2中工況1的訓練集和測試集進行實驗,選擇x軸振動數據,并對其進行研究。
工況1中,軸承的轉速恒定為1 800 r/min,通過徑向施加4 000 N的載荷加速軸承損壞;當加速度計幅值超過20 g時認為軸承失效,停止采集數據。
在測試集上,僅考慮數據不確定性量化的預測結果如圖3所示。

圖3 僅考慮數據不確定性量化的預測結果
圖3中:實線為RUL的點預測結果,虛線為真實RUL值,陰影區域描述了僅考慮數據不確定性量化的區間預測結果。
圖3所示實驗中,RUL點預測的RMSE值為0.209 6,區間預測的PICP值與MPIW值分別為0.533 2和0.213 4。
從圖3中可以觀察到:隨著軸承退化接近末期,數據不確定性呈現減小的趨勢。
在數據不確定性量化的基礎上,預測模型增加了對模型不確定性的量化??紤]兩種不確定性量化的預測結果如圖4所示。

圖4 考慮兩種不確定性量化的預測結果
如圖4所示:由于考慮了兩種不確定性的共同作用,RUL的預測區間相較于圖3寬度小幅增加,MPIW值為0.237 2。
圖4中區間預測的PICP值為0.620 2、相較于圖3有大幅提升,說明RUL的真實值落在預測區間內的百分比更大,對不確定性的描述更為準確,對實際的維護策略更有指導意義。同時,圖4中的點預測結果也更為精確,RMSE值為0.199 7。
為進一步證明基于CNN的區間預測方法的優越性,在模型結構和參數相同的條件下,筆者將基于CNN的區間預測方法與貝葉斯不確定性量化方法得到的結論進行對比。
貝葉斯神經網絡的預測結果如圖5所示。

圖5 貝葉斯神經網絡結果
圖5中:模型的RMSE、PICP、MPIW值分別為0.206 7,0.378 5,0.225 0。由于貝葉斯方法在不確定性量化過程中僅考慮了模型不確定性因素,盡管MPIW值小幅降低,但是其PICP值遠小于基于CNN的區間預測方法的值。
上述結果說明:貝葉斯方法得到的預測區間范圍對實際維護策略的指導意義相對較弱,點預測的準確率也相對較低。
不同區間預測方法結果匯總如表3所示。

表3 不同方法結果匯總
如表3所示:基于CNN的區間預測方法在保證點預測效果的同時,能夠準確描述軸承退化過程中的不確定性,相比常規的不確定性量化方法有著更優越的性能。
筆者基于CNN模型,提出了一種量化RUL預測不確定性的區間預測方法,并采用PHM2012軸承退化公開數據集證明了該方法的有效性。
研究結果如下:
1)CNN可以充分提取軸承振動數據中的退化信息,為RUL預測提供了良好的基礎,在輸出層放置正態分布,可以在實現不確定性描述的同時,保證點預測的精度;
2)通過構建新型的損失函數,并采用集成方法,能夠有效融合RUL預測過程中的數據不確定性和模型不確定性,可以得到良好的區間預測結果,更符合實際物理含義;
3)與現有的不確定性量化方法相比,基于CNN的區間預測方法的區間預測和點預測能力均更強,對于實際工程應用的指導意義更顯著。
在下一階段的工作中,筆者將進一步提升不確定性量化的準確程度,深入優化算法的結構和訓練過程,以節約計算資源。