朱建新 , 呂寶林, 喬 松, 王溢芳, 陳嘉宏
(1. 合肥通用機械研究院有限公司,安徽 合肥 230031;2. 國家壓力容器與管道安全工程技術研究中心,安徽 合肥 230031)
流程行業設備在長周期運行過程中,受部件之間、設備之間以及設備與工藝介質之間的耦合影響,發生的失效或故障十分復雜,故障一旦發生往往導致流程中斷,因而行業對設備的可靠性具有很高的要求。傳統的設備失效或故障診斷往往從機理出發,利用材料力學、結構力學、流體力學以及腐蝕理論等開展失效或故障的分析,這種方法對于結構單一、影響因素簡單、失效或故障模式清晰的失效往往十分有效[1]?;跈C理的分析方法在傳統的設備失效或故障診斷中發揮了重要作用,如依據振動頻譜分析轉子可能發生的不平衡、不對中及磨碰等故障,依據潤滑油成分分析設備可能的故障等[2],采用化學成分、力學性能、金相等分析設備的失效[3],采用動力學及振動響應分析方法研究轉子-支承-機匣耦合系統碰摩故障、滾動軸承故障等[4~6]。然而隨著設備復雜程度的提高,部件之間、設備之間、設備與工藝之間耦合關聯,設備發生失效或故障往往受多種因素影響,在這種情況下設備主導失效或故障機理的分析需要設計、材料、制造、使用管理等多專業配合[1]。傳統的以機理分析為主的故障診斷方法需要全面考慮這些相互影響,并在做大量簡化的前提下選擇部分主導因素開展分析,因而分析過程復雜且準確性難以保證。若將所有影響因素全部考慮在內又會因系統的復雜程度太高而無法求解。為解決這一問題,研究者將主要影響因素及其相互關系進行一定的簡化后,提出了基于貝葉斯網絡的可靠性分析方法[7,8]。貝葉斯網絡是不確定知識表達和推理領域最有效的理論模型,該方法考慮了影響因素的相互關系后,以貝葉斯理論為基礎開展故障的診斷,在一定程度上解決了復雜系統的可靠性分析與故障診斷難題。如將貝葉斯網絡用于機械系統的剩余壽命預測,大型回轉設備故障診斷,水電機組的振動故障診斷、機械設備轉子系統的故障診斷等[9~13]。
貝葉斯網絡通過建立表示事件之間因果關系的有向無環圖,并利用一系列條件概率來分析事件發生的依存關系及可能性,因而應用貝葉斯網絡時,首先要建立表示事件因(父節點)與果(子節點)之間的相互關系。實際應用時,若無法明確狀態之間的因果關系,貝葉斯網絡構建就存在困難,此外當存在多個影響因素時,影響因素之間的獨立性也難以保證。
近年來隨著數據科學的發展,將大數據分析方法用于多種影響因素耦合作用的設備故障分析與診斷已成為可能,該方法以發生失效的原始數據為基礎,通過對數據背后的統計規律進行深入研究,分析影響因素與故障狀態之間的相互關系,用概率分析方法判斷在多種因素交互作用下的設備失效或故障可能性。與傳統的方法相比,由于無需進行任何簡化,避免了先入為主的主觀因素可能帶來的不足,對影響因素的獨立性沒有特殊要求,因而可以最大程度避免不必要的簡化帶來的問題。
在眾多的大數據的分析方法中,通過貝葉斯理論把現象發生的可能性與原因(故障)聯系起來,描述了設備故障診斷的一般規律,因而貝葉斯模型在實際設備的故障診斷中具有廣泛應用[7]。依據樣本的特點,貝葉斯又分為樸素貝葉斯、高斯貝葉斯等不同類型。本文采用多維高斯貝葉斯模型為基礎,研究了模型在故障智能診斷中的應用,以公開發表的超聲流量計診斷數據庫為例,對方法應用流程及效果進行分析,并將分析結果與k-最近鄰(k- nearest neighbors,KNN)聚類分析算法結果進行比較。
設備的故障診斷,是通過觀測設備運行的特征來判斷發生特定故障的可能性。通常設備發生故障時往往伴隨一個或多個特征,其完全符合貝葉斯理論有關條件概率的描述:當設備發生Ck類故障模式時,該故障會使設備表現出若干特征,如壁厚的減薄、振動振幅、頻率、流量或壓力的變化等。當觀測的對象具有N個特征時,用X表示N個特征構成的特征向量。則當設備有K個可能的故障模式時,可以計算出Ck故障模式下X中N個特征的先驗聯合分布概率:
(1)
當發生Ck故障模式時,對應特征X的先驗聯合分布概率P(X|Ck)最大。這樣可以通過計算不同故障模式下特征的聯合分布概率,概率最大時對應的故障模式即為最可能的故障模式。
對于特征X中任一子特征x,若特定故障模式Ck下的子特征x的條件概率密度函數服從參數為μ和σ的高斯分布,即:
(2)
則認為特定的失效模式下任一子特征服從高斯分布,相應地滿足該條件的全部子特征組成的聯合分布稱為多維高斯貝葉斯分布。
對于一個包含N個特征,共有K種故障模式(或稱為分類)的系統,對特定的分類Ck,全部子特征組成的聯合分布概率密度函數為[14,15]:
(3)

采用極大似然估計方法可以估計N個特征同時發生時系統隸屬于Ck故障模式的似然函數值:
lnL= ln (P(x1,x2,…,xN|Ck))=
(4)
對特定的故障模式,式(4)中 ln (|ΣK|)和Nln (2π)均為常數。
對特定的待檢樣本,可以通過多維高斯貝葉斯求解不同故障模式下全部特征的聯合分布概率密度,概率密度越大表明發生該故障模式的可能性越大。這樣就可以利用極大似然對設備的故障進行智能診斷,通過排序篩選設備最可能的失效或故障模式,從而為維護維修提供依據。
基于多維高斯貝葉斯分類模型,可以整理出相應的智能診斷算法流程如圖1所示。

圖1 基于多維高斯貝葉斯的智能診斷算法流程Fig.1 Flowchart of smart diagnosis method based on multivariate Gaussian Bayesian model
智能診斷流程主要包括以下幾個步驟:
1) 數據集準備。設備的故障數據樣本是多維高斯貝葉斯智能診斷方法的基礎,要針對特定的研究對象,篩選所有與故障有關的參數做為特征,并標記特征所對應的故障分類作為數據集。數據的收集過程中可能會由于偶發因素(如傳感器損壞)導致數據缺失,故需要對數據集進行完整性分析,舍棄特征數據缺失的樣本,或采用一定的策略補充缺失的數據,形成結構化的數據。
2) 數據的降維與數據集劃分。當樣本數量較少而特征數量較多時,可能導致建立的協方差矩陣為奇異矩陣而無法求逆,此時需要對數據進行降維處理,降維的作用一是通過特定的變換,使各特征參數投影到正交空間上,確保變換后的特征相互獨立;二是通過保留變換后方差最大的若干個特征,舍棄方差小的特征,來實現參數降維。常見的降維算法有主成分分析(primary component analysis,PCA),奇異值分解等。降維后的數據需要將數據集依據一定的比例分成訓練集與檢驗集,訓練集用于分析檢驗集用于檢驗。
3) 不同故障模式的多維高斯貝葉斯模型的建立。在訓練集中將相同故障模式的特征分別篩出,依據第2.1節的分析方法建立各故障模式的多維高斯貝葉斯模型。
4) 模型的檢驗。將檢驗集中除故障模式外的特征數據分別用不同故障模式的多維高斯貝葉斯模型進行計算,計算得到的似然函數最大的故障模式即為診斷結果。將該診斷結果與檢驗集樣本中實際故障模式進行比對,判斷模型的準確性。
5) 降維模型修正與模型的輸出。由于降維后的特征數少于原始特征數量,不可避免會導致表征設備故障信息的丟失,為避免降維對診斷結果的影響,需要適當調整降維深度,使診斷識別率達到最佳。當通過多次檢驗達到最佳的效果時,將模型參數固化下來,用于后續故障的智能診斷。
本文方法僅通過特征的先驗聯合分布概率來進行故障的診斷,診斷過程并未涉及復雜的機理分析,以及為開展機理分析所做的簡化,當設備故障機理復雜但數據量大時,該方法可以較好地滿足大數據條件下設備故障的智能診斷要求。
若故障數據收集共有M個樣本X=[x1,x2,…,xM]T,其中第i個樣本的W個的特征數據為xi=(xi,1,xi,2,…,xi,W),則各特征的協方差矩陣Σ如式(5)所示,協方差矩陣反映了各特征之間的相互關系。
(5)
式(5)中μ=[μ1,μ2,…,μW]為全部W個特征的均值。
若存在矩陣A∈RW×W,使(X-μ)·A=y,且y的協方差矩陣Σy滿足:
=AT·Σ·A=Λ
(6)
式中:Λ為對角陣,其對角線元素λi為一個大于0的數,則說明變換得到的y中各特征相互獨立,λi越大表明y中第i個特征的方差越大,即數據的分散性越好。
式(6)中的變換矩陣A即為由協方差矩陣Σ的特征值所對應的特征向量(列向量)組成的矩陣。當將特征值由大到小排列,取全部特征值之和中一定比例的前N個特征值,并將對應的N個特征向量(列向量)組成新的變換矩陣B∈RW×N,則通過計算(X-μ)·B即可將全部樣本中的特征參數由W維降為N維。
降維時特征值的比例越小,降維深度越深,則保留的特征值個數N越小,即降維后的維數越小,信息丟失的越多。
超聲波流量計是一種以速度差法為原理的非接觸測量儀表,測量準確度高,廣泛應用于石油、化工、冶金、電力、給排水等領域。實際使用中超聲波流量計存在空氣侵入、蠟沉積等故障,需要定期進行校準。在英國的石化等流程行業中超聲波流量計使用量大,但校準成本高昂[17]。為避免設備過度檢驗與校準,英國研究機構采集了流量計相關參數并建立了設備健康數據庫,擬采用機器學習方法開展流量計健康診斷。

圖2 超聲波流量計檢測通道Fig.2 Test paths of ultrasonic flowmeters
本文使用的超聲波流量計故障診斷數據庫(Ultrasonic flowmeter diagnostics Data Set,http:// archive.ics.uci.edu/ml/datasets/Ultrasonic+flowme-ter+diagnostics)是由英國考文垂大學(Coventry University)和國家工程實驗室(National Engineering Laboratory,TUV-NEL)采集,數據庫由加州大學歐文分校提供[18]。該數據庫收錄了4類流量計共540個樣本,4類樣本中,B型流量計的樣本數92個,故障分類包括無故障(Healthy)、氣體侵入(Gas injection)及蠟沉積(Waxing),C型流量計的樣本數181個,故障分類除上述3種外,還包括安裝影響(Installation effects)故障模式。2個子數據庫中檢測的項目分別如表1、表2所示。
利用多維高斯貝葉斯模型,本文對兩類超聲波流量計開展健康狀態智能診斷。并利用k-最近鄰(KNN)聚類分析工具,對2種分析方法的效果進行了比對。

表1 B型流量計故障診斷檢測項目Tab.1 Test items for failure diagnosis of type B flowmeter

表2 C型流量計故障診斷檢測項目Tab.2 Test items for failure diagnosis of type C flowmeter
超聲波流量計故障診斷數據庫是一個標準的結構化數據庫,數據中不存在缺失數據,但數據庫中原始的特征數分別為51和43個,多數特征存在明顯的相關性,如4個通道中通道兩端信號強度、信號質量,通道內流速與聲速等。由于數據庫的樣本數偏少,僅為92和181個,為避免特征的協方差矩陣為奇異矩陣帶來的求解困難,需要對樣本數據進行降維處理,剔除相關的因素。
為更好地檢驗診斷效果,對樣本進行隨機排列后采用相同的方法進行10次不重復的診斷,相同的數據同時利用開源的聚類分析工具Scikit-learn中的KNN聚類分析算法進行診斷,并對結果進行比對。
利用本文提出的方法及流程,對超聲波流量計進行故障智能診斷。B型和C型流量計分別保留70.0%和99.7%的特征值進行降維,在全部樣本中選擇70%(B型64個,C型126個)用于訓練,30%(B型28個,C型55個)用于檢驗,2種診斷方法得到的結果如表3所示。

表3 流量計的檢驗結果Tab.3 Test results of flowmeters
為分析數據特征及降維深度對診斷結果的影響,采用不同的PCA降維策略,對B型和C型流量計進行診斷分析,得到結果如圖3所示。圖中可以發現B型流量計和C型流量計的診斷結果存在較大區別。對B型流量計采用PCA降維后,降維時特征值保留比例由0.4上升至0.9時,本文算法的診斷識別率98.5%附近波動,總體較佳但進一步增加特征值的保留比例會使維數增加過多,反而使識別率有所降低。而對于KNN算法,提高PCA降維特征值保留比例時,正確識別率會發生顯著下降。C型流量計樣本數量相對較多,當特征值保留比例由0.9上升至0.999時,本文算法計算得到的識別率顯著增加,特征值保留比例達到99.9%時全部55個待檢樣本共550次診斷的故障識別率為96.9%,這一數據明顯高于KNN聚類分析75.3%的診斷結果。

圖3 兩型流量計的PCA降維深度對故障識別率的影響Fig.3 Influence of PCA dimensionality reduction depth on failure diagnosis rate for two types of flowmeters
1) 提出了基于多維高斯貝葉斯的設備故障智能診斷流程,將該方法用于某超聲波流量計的故障智能診斷,故障的正確識別率達到95%以上,該診斷效果總體優于k-最近鄰(KNN)聚類分析算法;
2) 多維高斯貝葉斯分類算法克服了復雜設備系統故障診斷分析中需要對故障模式及影響進行機理研究,對耦合影響因素進行簡化分析等不足,可將全部影響設備失效或故障的因素考慮在內,避免了為開展機理分析需要進行簡化帶來的不足;
3) 用多維高斯貝葉斯方法進行設備的故障診斷時,需要綜合考慮樣本及特征的數量、特征與失效或故障的相互關系,可以通過分析選擇恰當的降維深度,以達到最佳的診斷效果;
4) 樣本中不同特征對故障識別率的影響存在較大區別,應用降維技術進行分析時,不同的降維深度可能對診斷結果產生較大影響。由于PCA降維后的復合特征與初始特征存在一定的線性關系,如何利用復合特征來分析原始特征對診斷結果的影響,這是后續值得進一步開展的研究方向。