郭文強, 李建望, 黃梓軒, 肖秦琨
(1.陜西科技大學電子信息與人工智能學院, 西安 710021; 2.西安工業大學電子信息工程學院, 西安 710021)
隨著現代工業過程的大規模和復雜化發展,以及計算機和傳感器技術的廣泛應用,大量重要的過程數據被收集和存儲,操作人員應及時檢測異常情況。故障檢測與診斷(fault detection and diagnosis,FDD)可以及早識別異常過程偏差,并幫助操作員采取適當的措施來防止故障傳播。因此,開發一種安全穩定的FDD方法具有重要的意義[1]。
目前基于多元統計的FDD方法在化工生產中得到了廣泛的應用。多元統計方法包括主成分分析法(principal component analysis,PCA)、部分最小二乘法(partial least squares,PLS)、獨立成分分析法(independent component analysis,ICA)、Fisher判別分析法等[2]。這些單一的方法,都有其各自的優缺點,在化工故障診斷中存在一定的局限性。例如,多元統計方法隨著數據維度的增加,計算負荷增大,難以有效提取故障特征信息,而深度學習的方法往往缺乏專業知識和實踐經驗。例如,文獻[3]提出了基于深度信念網絡(deep belief network,DBN)的故障診斷與識別方法,用于解決化工非線性數據難以提取的問題,但對高維數據處理存在一定的局限性。針對數據具有非線性和高維的時間序列,文獻[4]引入了兩個多尺度卷積模塊來融合和提取不同尺度下的時空信息,但算法存在建模復雜、難以識別故障根源等缺點。許多研究人員將兩種或兩種以上的技術組合在一起,以避免單一方法的局限性,這些方法稱為混合方法[5-8]。例如,文獻[6]提出了一種基于主成分分析和支持向量機結合的故障診斷方法來提高滾動軸承故障診斷的效率。文獻[7]提出PCA與T2統計量統計和貝葉斯網絡相結合的方法來處理多變量貢獻圖產生的不確定性問題。為了提高故障檢測效率,文獻[8]介紹一種基于主成分增強矩陣的支持向量機(support vector machine, SVM)故障診斷方法。上述幾種方法,均單獨采用主成分分析法作為降維工具,計算負荷大,難以剔除冗余故障信息,且SVM算法對缺失數據敏感。所以,開發一種既要充分剔除引起故障的無關信息又要保證在面對傳感器、數據通信證據缺失等不確定性因素情況下的混合方法具有重要的實際意義。
因此,現提出一種新的混合方法,利用互信息(mutual information,MI)和PCA相結合來確保對故障特征信息的充分提取,再結合貝葉斯網絡(Baye-sian network,BN)在不確定性環境下的獨特優勢,來保持故障的診斷性能及效果。針對化工過程中存在變量眾多、特征提取難等問題,建立互信息-主成分分析-貝葉斯網絡(mutual information-PCA-Baye-sian network,MPBN)故障診斷模型,為面對復雜化工過程等不確定性環境情況下提供一條新途徑。
工業過程的監測往往涉及大量的過程變量,為了盡可能簡化網絡模型結構并降低學習的復雜度,檢驗變量之間的相關性強弱是其中關鍵一步。通過互信息檢驗可以檢驗相關性較強的變量?;バ畔⑹且粋€可以反映兩個變量相互依賴程度的量,以變量x,y為例,互信息計算表達式[9]為

(1)
式(1)中:P(x,y)為(x,y)的聯合概率分布;P(x)和P(y)分別為x、y的邊際分布函數。
主成分分析是一種簡單的線性變換技術,主要用于降維。它是通過一組被稱為加載向量的正交向量來完成數據降維的,它是描述數據中最主要的特征[10]。所以在實際應用中常用來對數據降維、消除變量的相關性等。
(1)對樣本數據進行Z-Score標準化;采樣m組數據,每次采樣的數據包含n個變量(傳感器等)的信息,組成數據矩陣X=(x1,x2,…,xm),其中xi是行向量,包含n個參數。然后,對數據矩陣標準化得到Y為

(2)
式(2)中:J為均值矩陣;D(σ1,σ2,…,σn)為X的標準差矩陣。
(2)根據Y求解協方差矩陣S,且通過S計算特征值l。通常而言,l按從大到小的順序排列,即:l1≥l2≥l3≥…≥ln≥0。最后根據累計主元貢獻率法來確定主元個數num(1≤num≤52),公式為

(3)
式(3)中:C為貢獻率。
(3)計算SPE(Q)統計量及其控制界限。T2統計量方程主要用來檢測主元子空間,統計量SPE用于監測剩余殘差子空間[11]。主要通過貢獻率Q來反映各變量的重要度,其數學表達式[12]為
Q=xT(I-llT)x
(4)

(5)
式中:
Zα為標準正態分布下在置信水平為1-α下的閾值。如果Q (4)統計主要變量。計算每個變量對Q統計量的貢獻率并根據貢獻率的大小來確定主要特征變量。 一般而言,貝葉斯網絡由一個二元組B(G,θ)表示。第一個元素G代表一個有N個節點的有向無環圖,每個節點均代表一個隨機變量。BN的第二個元素θ表示一組參數θi,它量化了子節點Ni與其父節點Πi之間的依賴性強度[13],即 (6) 式(6)中:Πi為Ni的父本集合;P( )為Ni分別為離散或連續時的概率質量函數或概率密度函數。 一般地,貝葉斯網絡的參數學習是在網絡結構拓撲已知,根據樣本按照某一特定準則,來計算BN的參數分布。通常來說,在數據樣本充足或者分布函數比較簡單的條件下,一般選擇最大似然估計(maximum likelihood estimation, MLE)的方法。 由文獻[14]可知,參數θijk的最大似然估計值為 (7) 式(7)中:Nijk為數據樣本中父節點狀態為j時,第i個節點狀態為k的統計值;ri為節點i的組合取值狀態值總數。 在處理多變量的問題時,變量數量過多以及變量之間的強關聯性,會導致數據所代表的信息有所重復[15]。實際化工過程中的變量節點過多、節點信息冗余等特點,導致整個模型復雜,從而影響整個過程的診斷精度。因此,提出MPBN算法通過互信息、PCA“降維”的思想與BN模型相結合的算法來對化工故障進行檢測,具體的流程如圖1所示。 圖1 基于MPBN的化工故障診斷模型流程 步驟1初始化參數。包括貢獻率(C)、采樣周期(T)、SPE控制界限(QU)診斷信度(Φ)以及互信息閾值Ω的設置。 步驟2數據預處理。包含數據分割和數據離散化。數據分割:需要將原始數據集合劃分為訓練集和測試集并按照(10-P)∶P的比例提取出來,P取3;數據離散化:對數據集按照黃金分割的方式進行數據集歸一化。 采用黃金分割離散化方法,將每個數據集的最大值記為Dmax,并把數據量離散化為M個離散特征值。 (8) 式(8)中:參數M取3;a取0.618。根據對應過程數據集的幅度,分別按大小離散化并量綱化后的取值為1、2、3。 步驟3判斷是否完成BN建模;如果已經建模完成,則跳轉至步驟8,將測試樣本集輸入MPBN診斷模型進行推理;若未建模,則繼續步驟4,進行BN結構建模。 步驟4互信息檢驗。通過設定的互信息閾值Ω(平均互信息值)篩選出各故障相關性較強的變量,以去除變量之間的冗余信息。 步驟5PCA變量提取。主要分為4個步驟:①按式(2)對n維數據進行標準化;②按式(3)求主元個數;③按式(4)和式(5)分別計算SPE(Q)統計量、控制界限Qα的大小;④統計主要變量,形成BN特征向量。 步驟6BN結構建模;經步驟4和步驟5確定的故障變量節點,按照文獻[16]方法構建樸素BN故障診斷結構。 步驟7BN參數建模;確定了BN故障診斷結構之后,利用MLE算法對訓練樣本集進行BN參數學習,最后建立基于MPBN故障診斷模型。 步驟8故障的診斷與推理。利用聯合樹算法,輸出故障診斷結果概率最大的狀態;若不滿足閾值Φ,則返回(步驟2)數據預處理過程。反之,直至完成整個測試樣本診斷過程。 以田納西伊士曼(Tennessee Eastman,TE)故障數據源為例,選用MIT的Braatz Groups實驗室生成的數據,可以從網站http://web.mit.-edu/braatzgroup/links.html下載獲得。 為分析所提出的單故障診斷模型性能,且能讓測試集的實驗結果能夠準確描述模型的泛化能力,測試集不參與模型的調優過程。經過實驗,訓練集和測試集比例為7∶3時能得出最優的診斷效果。因此,選擇正常工況350個樣本與各故障工況的350個故障樣本組成700個訓練樣本數據集,將正常工況150個正常樣本加上各故障工況的150個故障樣本組成300個測試樣本數據集,共1 000組數據,具體大小如表1所示。采樣周期設置為3 min,每一個帶故障的數據樣本,在第161個數據植入故障。 表1 TE過程數據集 首先通過互信息對過程變量進行互信息檢驗,篩選出相關性較小的變量用以BN建模。其具體步驟如下:首先,設定各變量之間的互信息閾值Ω,其次,計算TE各變量之間的互信息值V,若V<Ω,則將列入最佳屬性候選子集中,反之剔除,子集可作為BN建模所需的特征向量。初步提取的變量相對于TE過程變量(52個)減少了一部分,此過程為篩選變量的第一步。 取TE過程中的故障4作為故障診斷分析,分析結果如圖2所示。由于故障數據是從第161個數據開始引入的,從圖2中可以清晰地看到SPE統計量能夠較好地反映故障數據的變化。圖2(a)和圖2(b)縱坐標分別表示T2和SPE(Q)統計量的變化,橫虛線表示各控制限的大小。圖2(c)和圖2(d) 橫虛線表示平均貢獻率的大小,橫軸表示各個變量(1~52號),縱軸TC和SC分別表示每個變量對故障(T2、SPE)貢獻率的大小。由圖2可知,每個故障對SPE和T2貢獻率大小不同,其中引起故障4的主要變量為變量9和51。 圖2 故障4經PCA分析結果 通過圖2和表2中PCA-T2方法的對比發現,利用T2貢獻率統計出來的變量比通過SPE貢獻率統計的要多。通過實驗SPE貢獻率提出來的變量少且具有不錯的診斷效果,因此選取SPE貢獻率作為提取主要變量的觀察指標。通過互信息與PCA相結合過程為篩選變量的第二步。 表2 不同方法特征變量提取的對比 經互信息與PCA方法統計選取出來的各故障特征變量如圖3所示,從圖3中可以看出,經過互信息與PCA相結合(MP)較一次互信息(MI)提取出的變量要少,相差最大的為變量6和18,最小的為變量1、15、21。從圖3可以看出,故障10相關變量最多為15個,而故障1、6、7相關變量最小為1個。 圖3 MI(一次)與MP(兩次)提取變量數目的對比 圖4表示經互信息一次與PCA結合兩次篩選出來的變量構建的故障4診斷模型。從圖2和圖4可以看出,故障4與變量9和51相關。分析原因:反應器溫度升高變量9,導致旁邊的冷凝器嘗試控制冷卻水的流量變量51來降低反應器的溫度,這與故障4的描述相符合。 圖4 經互信息與PCA結合后構建的MPBN故障4診斷模型 為了驗證本文方法的有效性與魯棒性,在完整證據條件分下,分別與經典方法SVM[17]、NB(Naive Bayes)及深度學習方法DBN[3]、GASF-MSNN[4]進行結果對比;在不完整證據下,對TE過程中的5種故障類型進行了推理實驗。主要參數設置:累計貢獻率設置為90%,SPE及其統計控制界限(QU)設為99%,診斷信度Φ=0.5。 田納西伊士曼(TE)流程是過程監測領域廣泛應用的比較不同故障檢測和故障診斷方法的基準試驗,該平臺由41個測量變量(連續變量XMEAS1~XMEAS22、XMEAS23~XMEA~S41,過程色譜測量變量、1~41)和12個操縱變量(XMV1~XMV12,42~53)組成,但由于XMV12為常數值,所以不考慮。該過程擁有21種故障,TE整個過程中主要包含5個操作單元,分別命名為反應器、冷凝器、分離器、壓縮機及汽提塔[18]。 在機器學習領域中,F1分數可以作為評估故障診斷性能指標之一[19]。用F1分數為模型的精確度和召回率的調和平均數。它的取值范圍區間為[0,1],數值愈接近于1,則表示屬于此類故障的可能性越大,反之接近于0,表示屬于此類故障可能性越低。 為了驗證本文方法的有效性,在相同數據集和評價指標下利用本方法與SVM、DBN、GASF-MSNN、NB以及MP(T2)BN方法進行對比。不同診斷方法的實驗結果如表3所示。可以看出,本文方法的F1分數平均識別率為83.03%,均高于基于深度學習的DBN、GASF-MSNN方法及經典方法SVM、NB。前20種故障類型F1分數均值比DBN、SVM、GASF-MSNN、NB及MP(T2)-BN模型分別高了7.97%、17.62%、4.47%、3.6%、4.88%。全部21種故障類型F1分數均值比SVM、GASF-MSNN、NB及MP(T2)-BN模型分別高了15.82%、3.69%、3.5%、5.03%。對于難以識別的故障3、9、15,因為其不會引起標準差和均值變化[20],也具有50%以上的診斷效果。與通過T2統計量貢獻率選取的特征變量相比,只有故障3、15略低。進一步驗證了通過SPE統計量方法具有較強的穩定性和適用性。相較于其余5種方法,本文方法提取的變量具有與故障相關性高、變量間耦合性低特點,因此,表現出較好的診斷性能。 表3 不同診斷方法下的實驗結果 假設由于真實場景中可能無法獲取到全部變量,即存在證據缺失的情況。而經典的SVM或者PCA無法進行故障的診斷識別,故對本文方法進行不完全證據的推理實驗。由于TE過程故障類型主要有5種,因此選取故障4、11、13、14、18作為研究對象,涵蓋了階躍、隨機變化、黏滯及未知的故障類型,利用本文方法進行不完全證據推理的實驗結果如圖5所示。 圖5 故障4、11、13、14、18不完全證據推理 圖5橫坐標代表證據缺失程度,在實驗設置為隨機掩蓋對應程度的證據??梢钥闯?在證據不完全的情況下,隨著證據缺失的程度加深,在F1分數指標上都呈現不同程度的下降。按照圖例順序(從上至下)出現轉折點(F1分數等于50%)分別為62%、72%、92%、73%、和68%。由此推斷,其對證據缺失敏感度由弱至強的順序為故障13、14、11、18及4。它們均在證據缺失程度為50%的情況下仍具有50%以上的推理效果??梢?提出的MPBN模型對這5種類型的故障均具有一定的診斷能力,且進一步驗證了本文方法在面對可能由傳感器缺失、通信手段等因素導致的證據缺失復雜環境情況下仍然具有一定的故障診斷效果。 針對化工過程存在傳感器數據缺失、故障識別難等不確性環境問題,提出了一種基于MPBN混合建模的TE故障診斷方法。 主要工作內容及研究成果如下。 (1)對于故障特征變量提取方面,提出互信息與PCA相結合的方法,有效地保持了對故障特征信息的充分提取。 (2)對于方法的有效性與魯棒性方面,驗證了本文方法較經典方法SVM、NB及深度學習方法DBN、GASF-MSNN具有更穩定的性能,進一步也驗證了通過SPE統計量較T2統計量具有更好的故障表征能力。 (3)對于證據缺失不確定性問題,驗證了所提的MPBN故障診斷模型仍具備一定的診斷效果。 本文方法還存在不足,如未考慮數據時間序列的影響,對未知故障類型診斷效果較低等。未來的工作可能包括將所提出的方法用于工業系統,并將BN與非線性多元統計方法工具結合起來,以捕捉非高斯特征使其具有更好的檢測能力。1.3 貝葉斯網絡

1.4 貝葉斯網絡的參數學習

2 基于MPBN算法的故障診斷模型構建


2.1 案例應用與數據預處理

2.2 互信息檢驗
2.3 PCA選取變量



2.4 故障診斷模型的建立

3 實驗與分析
3.1 實驗設置
3.2 評價準則
3.3 不同方法的實驗結果對比

3.4 不完整證據下的推理

4 結論