張謙謙, 王文標(biāo), 郝友維
(大連海事大學(xué)船舶電氣工程學(xué)院, 大連 116026)
隨著生產(chǎn)需求的快速增長,現(xiàn)代化工業(yè)蓬勃發(fā)展,生產(chǎn)過程越來越集成化和復(fù)雜化。而復(fù)雜系統(tǒng)各環(huán)節(jié)緊密相連,即使發(fā)生微小的故障都可能會造成巨大的財(cái)產(chǎn)損失和人員傷亡,因此故障檢測技術(shù)在現(xiàn)代工業(yè)生產(chǎn)中具有重要意義[1-4]。以主成分分析[5-9](principal component analysis, PCA)為代表的數(shù)據(jù)驅(qū)動方法,已經(jīng)廣泛應(yīng)用于工業(yè)系統(tǒng)的過程監(jiān)控和故障檢[10-15]。然而使用PCA方法進(jìn)行故障檢測的前提是數(shù)據(jù)為單模態(tài)且樣本之間相互獨(dú)立,對于具有多模態(tài)特性和動態(tài)特性系統(tǒng)故障檢測效果不佳。
多模態(tài)數(shù)據(jù)通常具有中心漂移、方差差異明顯等特征。對于這一問題,可建立多個局部模型或全局模型來解決。李元等[16]采用基于K均值聚類方法對數(shù)據(jù)進(jìn)行分類,為各個模態(tài)單獨(dú)建立模型。由于故障檢測效果與模型劃分結(jié)果緊密相關(guān),因此該方法對模型劃分精度要求較高。張成等[17]提出了基于k近鄰主元得分差分的故障檢測方法,采用得分差分方法降低了數(shù)據(jù)多模態(tài)特性對故障檢測的不利影響,但其未考慮不同特征對評價指標(biāo)的貢獻(xiàn)差異。馮立偉等[18]提出了基于權(quán)重k近鄰的故障檢測方法(fault detection of weightedknearest neighbor,FD-wkNN),通過尋找樣本的k近鄰并利用其加權(quán)近鄰距離信息,解決樣本中心漂移問題。但當(dāng)樣本不均勻時,對稀有樣本的故障檢測精度會降低。顧幸生等[19]采用局部近鄰標(biāo)準(zhǔn)化(local neighborhood standardization, LNS)方法對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,消除了數(shù)據(jù)的多模態(tài)特性。但當(dāng)故障數(shù)據(jù)的鄰域信息來自多個模態(tài)時,經(jīng)該方法處理后會造成故障數(shù)據(jù)與正常數(shù)據(jù)混疊,降低了故障檢測精度。
對于動態(tài)系統(tǒng),各參數(shù)的變化需要經(jīng)過一定的滯后時間才會影響到其他變量的變化,且運(yùn)行數(shù)據(jù)是根據(jù)時間采樣的時間序列數(shù)據(jù),因此在進(jìn)行故障檢測時要考慮數(shù)據(jù)的時序特性。對此,來顏博等[20]使用動態(tài)主元分析法(dynamic principal component analysis, DPCA),通過增加延時測量值構(gòu)成增廣矩陣提取系統(tǒng)動態(tài)特性,但其無法描述樣本的自相關(guān)性且增大了數(shù)據(jù)維度,降低了計(jì)算效率。李元等[21]提出了時空近鄰標(biāo)準(zhǔn)化(time-space nearest neighborhood standardization, TSNS)方法,通過尋找樣本的時間和空間的局部近鄰并進(jìn)行標(biāo)準(zhǔn)化處理,消除了數(shù)據(jù)的動態(tài)特性。
針對系統(tǒng)的多模態(tài)和動態(tài)問題,提出動態(tài)加權(quán)差分主成分分析法 (dynamic weighted differential principal component analysis, DWDPCA)。設(shè)置合理長度的時間窗描述系統(tǒng)的動態(tài)特性,并尋找時間窗中樣本在空間上的第一近鄰和第一近鄰的近鄰集,利用加權(quán)差分方法解決數(shù)據(jù)中心漂移的問題,使用PCA進(jìn)行異常檢測。該方法兼顧了樣本的時序特性和空間特性,適用于具有動態(tài)特性和多模態(tài)特性的系統(tǒng),可提高系統(tǒng)的故障檢測率。
選取系統(tǒng)在正常工況下運(yùn)行產(chǎn)生的歷史數(shù)據(jù),構(gòu)建樣本矩陣X=(Xij)n×m,其中,m為樣本的變量數(shù)量,n為樣本數(shù)量。使用z-score法將數(shù)據(jù)標(biāo)準(zhǔn)化,并計(jì)算其協(xié)方差矩陣S,計(jì)算公式為
(1)
主元個數(shù)由累計(jì)方差貢獻(xiàn)率(cumulative percent variance, CPV)確定,其表達(dá)式為
(2)
式(2)中:λj為S的特征值。
(3)
Ti=XiPi
(4)
式中:XP為主元子空間中樣本向量X的投影;Ti為得分矩陣;Pi為負(fù)荷矩陣;E為殘差子空間。
T2和SPE統(tǒng)計(jì)量是PCA進(jìn)行故障診斷的兩個重要指標(biāo)。T2統(tǒng)計(jì)量的控制限CLT2可表示為
(5)
式(5)中:α為顯著性水平;1-α為置信度;Fα(α,n-α)為F分布,其第一自由度為α,第二自由度為n-α。
SPE統(tǒng)計(jì)量的控制限CLSPE可表示為
(6)
(7)
(8)
式中:cα為標(biāo)準(zhǔn)正態(tài)分在布置信水平為α?xí)r的置信限;h0為閾值;θ1和θ3為數(shù)據(jù)集的一分位數(shù)和三分位數(shù);θi的定義如式(7)所示;λ為特征值。
傳統(tǒng)的PCA方法適用于數(shù)據(jù)服從獨(dú)立同分布的單模態(tài)系統(tǒng),對具有時序特性或多模態(tài)特性的系統(tǒng)檢測效果并不理想。為提高PCA對具有的動態(tài)特性和多模態(tài)特性系統(tǒng)的故障檢測性能,提出動態(tài)加權(quán)差分主成分分析法。通過時間窗描述樣本間的時序關(guān)系,利用加權(quán)差分法解決數(shù)據(jù)中心漂移問題,使用PCA方法進(jìn)行故障檢測。具體方法如下。

(9)

(10)
權(quán)值公式的約束條件如式(11)所示。
(11)
DWDPCA法故障檢測流程圖,如圖1所示。

圖1 故障診斷流程圖Fig.1 Flowchart of fault diagnosis
利用動態(tài)加權(quán)差分主成分分析法進(jìn)行故障檢測主要分為:離線建模和在線診斷,具體步驟如下。
1.3.1 離線建模
步驟1獲取正常工況下的歷史數(shù)據(jù)作為訓(xùn)練集X。
步驟2對訓(xùn)練集中的每個樣本xt設(shè)置合理的時間窗,再對時間窗中的樣本尋找其空間上的第一近鄰和第一近鄰的K近鄰集。

步驟4構(gòu)建PCA模型,計(jì)算控制限CLT2和CLSPE。
1.3.2 在線診斷
步驟1獲取要檢測的樣本作為測試集X*。
步驟2對測試集樣本x*構(gòu)造時間窗,并對時間窗中的樣本在訓(xùn)練集中尋找第一近鄰和第一近鄰的K近鄰集。


步驟5判斷T2和 SPE統(tǒng)計(jì)量與控制限CLT2和 CLSPE的關(guān)系,若超限則說明此時系統(tǒng)發(fā)生故障,否則認(rèn)為系統(tǒng)運(yùn)行正常。
分別利用數(shù)值仿真系統(tǒng)和Tennessee Eastman(TE)仿真平臺模擬工業(yè)系統(tǒng)運(yùn)行過程,并對其進(jìn)行故障檢測來驗(yàn)證該方法的有效性。
使用具有時序特性的數(shù)值仿真系統(tǒng)模擬多模態(tài)數(shù)據(jù),仿真過程為
(12)
式(12)中:x1和x2為輸出變量;t為時間變量;θ為角度;e1、e2為服從[0 ,0.01]的隨機(jī)噪聲;a、b為過程參數(shù),通過改變其值來產(chǎn)生多模態(tài)數(shù)據(jù),模態(tài)一中設(shè)置a為0.2;b為0.2,模態(tài)二中設(shè)置a為0.1,b為-2。
系統(tǒng)在模態(tài)一下運(yùn)行4π時間后切換到模態(tài)二繼續(xù)運(yùn)行4π時間,每個模態(tài)生成500組數(shù)據(jù),構(gòu)成1 000組訓(xùn)練數(shù)據(jù)。再次讓系統(tǒng)重新運(yùn)行,每個模態(tài)各生成250組校驗(yàn)數(shù)據(jù)和250組故障數(shù)據(jù),其中故障數(shù)據(jù)為在變量t上添加幅值為-6的階躍信號所造成。系統(tǒng)產(chǎn)生的多模態(tài)數(shù)據(jù)散點(diǎn)圖如圖2所示。可以看出,正常數(shù)據(jù)的中心隨時間逐漸變化,故障樣本偏離正常軌跡,靠近前半段正常數(shù)據(jù)。

x1、x2為仿真模擬系統(tǒng)模擬出的數(shù)據(jù)圖2 數(shù)值例子散點(diǎn)圖Fig.2 Scatter plot of numerical examples
圖3和圖4分別為原始數(shù)據(jù)和經(jīng)LNS方法處理后的測試集數(shù)據(jù)散點(diǎn)圖和分布圖。由圖4可知, LNS方法均可將數(shù)據(jù)化為單模態(tài)且近似服從單峰高斯分布,符合使用PCA方法進(jìn)行故障檢測的前提條件,降低了多模態(tài)結(jié)構(gòu)對故障檢測性能的影響。但LNS方法并未考慮數(shù)據(jù)的時序特性,對具有動態(tài)特性的系統(tǒng)進(jìn)行故障檢測時存在不足。使用可以解決時序問題的動態(tài)加權(quán)差分(dynamic weighted differential, DWD)方法對數(shù)據(jù)進(jìn)行處理,處理后的數(shù)據(jù)散點(diǎn)圖及校驗(yàn)數(shù)據(jù)直方圖如圖5所示。

圖3 原始數(shù)據(jù)散點(diǎn)及分布圖Fig.3 Original data scatter and distribution map

圖4 LNS處理后數(shù)據(jù)散點(diǎn)及分布圖Fig.4 Data scatter and distribution after LNS processing

圖5 DWD處理后數(shù)據(jù)散點(diǎn)及分布圖Fig.5 Data scatter and distribution after DWD processing
同一數(shù)據(jù)分布區(qū)域內(nèi),故障數(shù)據(jù)與正常數(shù)據(jù)在空間上分布相近,但在時序上其分布卻存在明顯差距。因此設(shè)置時間窗可有效描述樣本間的時序關(guān)系,實(shí)現(xiàn)正常樣本與故障樣本的有序排列,避免了只尋找樣本的空間近鄰,而忽略了樣本間的時序特性。解決了樣本時序特性對故障檢測的影響后,再尋找樣本的第一近鄰和第一近鄰的近鄰集對數(shù)據(jù)進(jìn)行加權(quán)差分處理,消除了數(shù)據(jù)的多模態(tài)特性。經(jīng)DWD方法處理后,故障樣本遠(yuǎn)離坐標(biāo)原點(diǎn),可將故障樣本從正常樣本中分離出來。
經(jīng)DWD方法處理后的數(shù)據(jù)具有正態(tài)特性,即樣本間是相互獨(dú)立的,消除了數(shù)據(jù)的時序特性。因此要選取合適的時間窗長度L,若數(shù)據(jù)選擇過大,則會增加計(jì)算復(fù)雜度。若選擇過小,則無法對當(dāng)前時間段系統(tǒng)的動態(tài)特性進(jìn)行準(zhǔn)確描述。本實(shí)驗(yàn)使用交叉驗(yàn)證的方法選取最佳L和K,設(shè)置時間窗長度L為5,近鄰數(shù)K為5。使用DWD方法進(jìn)行數(shù)據(jù)處理,由圖5可以看出,該方法可有效處理具有動態(tài)特性的多模態(tài)數(shù)據(jù),將其轉(zhuǎn)化為單模態(tài)數(shù)據(jù)且服從高斯分布,并將故障樣本與正常樣本分離。使用PCA和DWDPCA方法對測試集數(shù)據(jù)進(jìn)行檢測,設(shè)置置信度為99%,累計(jì)貢獻(xiàn)率為85%,檢測結(jié)果如圖6和圖7所示。

圖6 數(shù)值例子PCA故障檢測圖Fig.6 PCA fault detection diagram for numerical examples

圖7 數(shù)值例子DWDPCA故障檢測圖Fig.7 DWDPCA fault detection diagram for numerical examples
由圖6可以看出,使用PCA方法進(jìn)行故障檢測檢測效果很不理想,T2統(tǒng)計(jì)量的故障檢測率為0,SPE統(tǒng)計(jì)量的故障檢測率為6.2%。這是由于數(shù)據(jù)具有動態(tài)特性和多模態(tài)特性,使用全局建模方法計(jì)算得到的控制限指標(biāo)過高,無法檢測到故障。從圖7可以看出,使用DWDPCA方法可基本將故障數(shù)據(jù)完全檢測出來,T2統(tǒng)計(jì)量的故障檢測率為96.4%,SPE統(tǒng)計(jì)量的故障檢測率為98.8%,相比于PCA故障檢測率提高了92.6%,具有較高的檢測率。
TE平臺是根據(jù)多變量的復(fù)雜化工反應(yīng)過程模擬的仿真平臺,已被大量應(yīng)用于檢測故障診斷算法有效性的實(shí)驗(yàn)中。TE過程有5個操作單元和8種氣體成分,共53個變量,由12個控制變量和41個測量變量組成,本實(shí)驗(yàn)選取41個測量變量用于故障檢測。
TE過程根據(jù)生產(chǎn)物G/H的比例將生產(chǎn)過程分為4種模式,本實(shí)驗(yàn)選取模態(tài)1和模態(tài)3進(jìn)行故障檢測,具體如表1所示。系統(tǒng)先在模態(tài)一下運(yùn)行48 h,然后再在模態(tài)三下運(yùn)行48 h,期間以3 min為間隔進(jìn)行采樣,共采集訓(xùn)練樣本1 920組。測試集數(shù)據(jù)的采集和上述方法相同,但均在每個模態(tài)運(yùn)行8 h時加入不同類型的故障,直至本模態(tài)運(yùn)行結(jié)束,故障說明如表2所示。

表1 TE過程生成模式Table 1 TE process generation models

表2 TE過程故障說明Table 2 TE process fault description
如圖8和圖9所示,任取兩個變量分別繪制原始數(shù)據(jù)和經(jīng)DWD方法處理后的數(shù)據(jù)散點(diǎn)圖和分布圖。由圖8可知,原始數(shù)據(jù)為多模態(tài)結(jié)構(gòu),方差差異明顯。經(jīng)DWD方法處理后數(shù)據(jù)轉(zhuǎn)化為單模態(tài)且近似服從單峰高斯分布,如圖9所示。

圖8 TE過程數(shù)據(jù)散點(diǎn)圖及分布圖Fig.8 Scatter plot and distribution diagram of TE process data

圖9 TE過程DWD方法處理后數(shù)據(jù)散點(diǎn)圖及分布圖Fig.9 Scatter plot and distribution diagram of data after TE process DWD method
使用PCA和DWDPCA方法進(jìn)行故障檢測,置信度為99%,累計(jì)貢獻(xiàn)率為85%,通過交叉驗(yàn)證方法確定DWDPCA的時間窗長度L為5,近鄰數(shù)K為5。使用這兩種方法對不同故障的故障檢測率如表3所示。由表3可知,DWDPCA方法對6種故障的故障檢測率均高于PCA方法,DWDPCA的故障檢測性能得到驗(yàn)證。

表3 測試集故障檢測率Table 3 Test set fault detection rate
以故障2為例,A/C進(jìn)料流比不變,組分B含量發(fā)生階躍變化,致使總進(jìn)料發(fā)生改變,使系統(tǒng)無法正常運(yùn)行而發(fā)生故障。使用PCA和DWDPCA方法對此故障進(jìn)行診斷,診斷結(jié)果如圖10和圖11所示。PCA的T2統(tǒng)計(jì)量的故障檢測率為10.8%,SPE統(tǒng)計(jì)量的故障檢測率為55.9%,DWDPCA的T2統(tǒng)計(jì)量的故障檢測率為98.9%,SPE統(tǒng)計(jì)量的故障檢測率為98.6%,相比于PCA故障檢測率提高了42.7%。DWDPCA方法的故障檢測效果明顯高于傳統(tǒng)PCA方法。這是由于DWDPCA方法首先對數(shù)據(jù)進(jìn)行處理,消除了數(shù)據(jù)的時序特性和多模態(tài)特性,使數(shù)據(jù)符合使用PCA進(jìn)行故障檢測的前提條件,再使用PCA方法進(jìn)行故障檢測,使得檢測性能得到提高。

圖10 TE過程PCA故障檢測圖Fig.10 PCA fault detection diagram of TE process

圖11 TE過程DWDPCA故障檢測圖Fig.11 DWDPCA fault detection diagram of TE process
針對工業(yè)系統(tǒng)中存在的動態(tài)特性和多模態(tài)特性問題,提出了DWDPCA故障檢測方法。通過使用數(shù)值仿真例子和TE仿真平臺進(jìn)行故障檢測可得出如下結(jié)論。
(1)使用動態(tài)加權(quán)差分方法,克服了動態(tài)系統(tǒng)多中心結(jié)構(gòu)的缺陷,消除了數(shù)據(jù)的時序特性,并將數(shù)據(jù)轉(zhuǎn)化為單一模態(tài)且近似服從單峰高斯分布。
(2)針對具有動態(tài)特性和多模態(tài)特性系統(tǒng),所提出的DWDPCA方法可顯著提高其故障檢測率,并通過實(shí)驗(yàn)驗(yàn)證了該方法的有效性和優(yōu)越性。