劉麗云 國 蓉 牛魯娜 栗月姣 胡海軍
(1.西安工業(yè)大學(xué)光電工程學(xué)院;2.中國石化青島安全工程研究院;3.西安交通大學(xué)化學(xué)工程與技術(shù)學(xué)院)
石油煉化等化工行業(yè)是我國國民經(jīng)濟(jì)的支柱產(chǎn)業(yè),但每年化工企業(yè)大小事故頻發(fā),引發(fā)的火災(zāi)、 爆炸及泄漏等事故造成社會經(jīng)濟(jì)損失嚴(yán)重,甚至?xí)<叭藛T健康安全[1],如2018年3月12日,江西九江某石化企業(yè)未及時發(fā)現(xiàn)柴油加氫裝置原料緩沖罐的泵出口單向閥失效引發(fā)爆炸著火事故,造成2人死亡、1人輕傷。 為了減少事故的發(fā)生,需要對化工設(shè)備進(jìn)行在線、離線監(jiān)控,當(dāng)監(jiān)控量偏離設(shè)定范圍時及時預(yù)警,從而使企業(yè)能及時調(diào)整設(shè)備工況或停機(jī),保證設(shè)備安全。 企業(yè)通常選擇動態(tài)監(jiān)測生產(chǎn)過程的方法, 如監(jiān)測孔法、掛片法、電阻探針法及電化學(xué)法等[2]。 但是,國內(nèi)企業(yè)由于技術(shù)條件和經(jīng)濟(jì)條件限制,很難建立集成化、 網(wǎng)絡(luò)化且較全面的故障診斷與識別系統(tǒng),對于故障發(fā)生的診斷與識別能力不足,化工過程故障的診斷與識別問題仍亟待解決。
通常,企業(yè)會積累多年的設(shè)備運(yùn)行過程歷史數(shù)據(jù),而這些數(shù)據(jù)往往用于對某些影響化工設(shè)備過程發(fā)展的單一因素分析,或者用于建立少量因子的模型[3],企業(yè)希望通過這些方法結(jié)合過程機(jī)理,從而盡可能及時地排除故障。 但現(xiàn)代化設(shè)備變得日益復(fù)雜化和大型化,伴隨的過程故障發(fā)生的隨機(jī)性更大、種類更多,產(chǎn)生的海量數(shù)據(jù)信息更加復(fù)雜多樣,合理有效地利用歷史數(shù)據(jù)進(jìn)行化工過程故障診斷與識別得到了更多的關(guān)注。
隨著大數(shù)據(jù)技術(shù)的發(fā)展,各個行業(yè)開始通過研究積累的海量數(shù)據(jù), 發(fā)現(xiàn)數(shù)據(jù)內(nèi)部隱含的信息,探索數(shù)據(jù)內(nèi)部之間的關(guān)系,判斷事物發(fā)展走勢并預(yù)測過程發(fā)展趨勢,從而做出更為客觀可靠的決策推動事物發(fā)展[4]。 大數(shù)據(jù)技術(shù)在醫(yī)療、交通、 人才培養(yǎng)及電力等眾多領(lǐng)域已經(jīng)有所應(yīng)用,如劉廣濤發(fā)現(xiàn)大數(shù)據(jù)應(yīng)用于智慧交通可以解決城市擁堵問題[5];梁麗業(yè)和何業(yè)輝將大數(shù)據(jù)應(yīng)用于醫(yī)院病例整理,優(yōu)化了整理過程,減少了人力消耗與出錯[6];王偉發(fā)現(xiàn)將大數(shù)據(jù)應(yīng)用于電網(wǎng)建設(shè)可以有效支撐智能電網(wǎng)運(yùn)行[7]。 大數(shù)據(jù)技術(shù)相比于傳統(tǒng)技術(shù)具有很多優(yōu)越性,如分析內(nèi)容的范圍更廣泛全面,分析內(nèi)容的時間跨度更長,具有一定的預(yù)測性質(zhì),因此可以將它應(yīng)用于化工過程故障的診斷與識別,通過化工過程數(shù)據(jù)的內(nèi)部信息,客觀準(zhǔn)確地判斷故障的發(fā)生,為企業(yè)預(yù)防故障發(fā)生提供依據(jù)。
常用的基于數(shù)據(jù)驅(qū)動的故障分析方法[8]包括主 成 分 分 析 (Principal Component Analysis,PCA)、偏最小二乘法(Partial Least Squares,PLS)、獨(dú)立成分分析 (Indenpent Component Analysis,ICA) 及Fisher 判 別 分 析 (Fisher Discriminant Analysis,F(xiàn)DA)等。Hu Z K等提出了遞推PCA的故障診斷與隔離方法,能夠有效解決實際鉛、鋅冶煉的5種過程故障誤報警與隔離問題[9];Yu J提出了一種基于局部Fisher判別分析的多種故障模式監(jiān)測方法, 對3種不同測試情形下的故障誤診斷率分別為0.0%、9.8%和2.0%[10];Dong J等提出了一種基于全PLS模型的自適應(yīng)故障監(jiān)測方法,對田納西-伊斯曼(Tennessee-Eastman,TE)過程某一質(zhì)量故障的兩個監(jiān)測統(tǒng)計量的誤報警率為0.6%和0.9%[11]。上述基于數(shù)據(jù)統(tǒng)計的方法都能夠針對不同化工過程故障進(jìn)行不同程度的診斷與識別,但是仍然存在針對因素單一、診斷故障種類偏少及數(shù)據(jù)“維度災(zāi)難”[12]限制等問題。
筆者提出一種基于主元分析的化工過程故障診斷與識別方法,通過對正常工況數(shù)據(jù)進(jìn)行統(tǒng)計量計算,確定正常工況數(shù)據(jù)的閾值;然后計算故障工況數(shù)據(jù)的統(tǒng)計量,超過閾值的均為故障數(shù)據(jù)。 同時,通過計算變量的貢獻(xiàn)率識別出引起故障的主控變量,當(dāng)出現(xiàn)故障時,調(diào)整該變量數(shù)值,可以及時改善運(yùn)行工況。 將該方法運(yùn)用于化工行業(yè)標(biāo)準(zhǔn)的TE過程數(shù)據(jù),希望為行業(yè)的過程故障診斷與識別提供依據(jù)與借鑒。
如圖1所示,故障診斷與識別過程包括:數(shù)據(jù)預(yù)處理; 計算正常工況數(shù)據(jù)的統(tǒng)計量T2與SPE閾值[13],統(tǒng)計故障工況數(shù)據(jù)的統(tǒng)計量值大于閾值的數(shù)量,并計算對應(yīng)的故障發(fā)現(xiàn)率(Fault Discovery Rate,F(xiàn)DR)[14], 利用FDR評價PCA方法的故障診斷能力;計算數(shù)據(jù)集所有變量對故障產(chǎn)生的貢獻(xiàn)率,貢獻(xiàn)率大的變量即為識別出的引起故障的主控變量。

圖1 故障診斷與識別流程
在使用PCA方法進(jìn)行降維時, 需要將數(shù)據(jù)標(biāo)準(zhǔn)化為均值為0、 方差為1的標(biāo)準(zhǔn)正態(tài)分布數(shù)據(jù)集,利用零均值(z-score)標(biāo)準(zhǔn)化[15]可以實現(xiàn),其數(shù)學(xué)表達(dá)為:

其中,Y表示數(shù)據(jù)集,μ表示Y的均值,σ表示Y的標(biāo)準(zhǔn)方差,X表示預(yù)處理后數(shù)據(jù)集。
PCA可以將高維過程數(shù)據(jù)投影到正交的低維子空間,并保留主要過程信息。 幾何上,把樣本構(gòu)成的坐標(biāo)系通過某種線性組合旋轉(zhuǎn)到新的坐標(biāo)空間, 新的坐標(biāo)軸代表了具有最大方差的方向。對經(jīng)過預(yù)處理的數(shù)據(jù)集X(n×m)通過協(xié)方差分解確定主元空間,其協(xié)方差矩陣S的計算式為:

其中,Λ是協(xié)方差矩陣S的特征值矩陣, 其對角線上的元素滿足λ1≥λ2≥…≥λm;V是協(xié)方差矩陣S的特征矩陣;P(m×A)是包含V的前A列的主元信息矩陣;是特征矩陣V余下的m-A列,包含非主元信息。 分解X得到主元子空間矩陣Q(n×A)和殘差子空間矩陣E:


每個變量對SPE和T2的值有貢獻(xiàn)率, 檢測到故障后, 貢獻(xiàn)率值Cont越大的變量被認(rèn)為是越可能造成故障的變量。 統(tǒng)計量SPE和T2的變量貢獻(xiàn)率定義如下:

其中,ξi為單位矩陣I的第i列,=I-P·PT,D=PTΛ-1P。
1.2.2 故障診斷與識別結(jié)果評價
在機(jī)器學(xué)習(xí)領(lǐng)域,為了保證提出的最優(yōu)模型的故障診斷效果可靠,將故障發(fā)現(xiàn)率作為評價指標(biāo),其含義是錯誤拒絕(拒絕真的(原)假設(shè))的個數(shù)占所有被拒絕的原假設(shè)個數(shù)的比例的期望值[17]。 在故障診斷時,其數(shù)學(xué)表達(dá)式為:

其中,F(xiàn)DR值的范圍是[0,1],其值越接近于1,表明診斷效果越好;TN表示被正確分類的故障數(shù)據(jù);FN表示被錯誤分類的故障數(shù)據(jù)。
每個量的混淆矩陣見表1,針對二分類,建立的分類模型最終需判斷當(dāng)前樣本是正或負(fù) (即Positive與Negative),True表示分類正確,F(xiàn)alse表示分類錯誤。

表1 混淆矩陣
TE過程由伊斯曼化學(xué)公司創(chuàng)建,是為了給評價過程控制和監(jiān)控方法提供的一個現(xiàn)實的工業(yè)過程,具有一定的代表性。 利用在TE過程仿真中采集的數(shù)據(jù)來比較各種故障檢測和診斷方法的有效性,已在過程監(jiān)控領(lǐng)域得到了廣泛的應(yīng)用[18]。 TE過程主要由反應(yīng)器、冷凝器、汽提塔、氣液分離塔及壓縮機(jī)等多個操作單元構(gòu)成,TE過程流程如圖2所示。
TE過程共有4種氣體反應(yīng)物, 分別為A、D、E和C,這4種反應(yīng)物中分別都含有少量的惰性氣體B。 在催化劑的作用下,反應(yīng)器中主要有4個同時進(jìn)行的化學(xué)反應(yīng),其中的兩個主化學(xué)反應(yīng)生成的液態(tài)產(chǎn)物分別為產(chǎn)物G和產(chǎn)物H,同時會生成副產(chǎn)物F,化學(xué)反應(yīng)方程式如下:


圖2 TE過程流程

表2 TE過程故障
TE過程設(shè)定的故障見表2, 包括21種可操作的故障工況。 21種工況下的采樣時間間隔為3min。 在正常工況下,過程運(yùn)行48h產(chǎn)生的960個數(shù)據(jù)被采集作為正常數(shù)據(jù)樣本。 21種故障工況在過程穩(wěn)定運(yùn)行8h后引入, 故采集的960個數(shù)據(jù)中前160個數(shù)據(jù)不含故障, 后800個數(shù)據(jù)含有故障。將正常工況下的960個數(shù)據(jù)作為訓(xùn)練樣本, 故障工況下的800個數(shù)據(jù)作為測試樣本。 故障模式1~7是關(guān)于過程變量的階躍故障,故障模式8~12是隨機(jī)變化故障,故障模式13是反應(yīng)動力學(xué)的慢漂移故障,故障模式14~15是相應(yīng)的粘滯故障,故障模式16~20是未知故障, 故障模式21為恒定位置故障。
TE過程數(shù)據(jù)的正常狀態(tài)與21種故障都有52個變量,其中包括41個過程變量(22個測量變量和19個成分變量)和11個操作變量,具體信息見表3。

表3 TE過程的變量
TE過程包含的故障有六大類,筆者選擇階躍故障1、隨機(jī)變化故障12、慢漂移故障13、粘滯故障14、未知故障18和恒定位置故障21展示診斷與識別過程, 并以故障1為例具體說明診斷與識別過程。
階躍故障1:A/C進(jìn)料流量比發(fā)生變化,組分B含量保持不變。
首先, 選擇TE過程正常工況的960個數(shù)據(jù)與故障1工況的480個數(shù)據(jù)組合,作為預(yù)處理數(shù)據(jù)集進(jìn)行z-score標(biāo)準(zhǔn)化;然后,將正常集通過PCA確定其統(tǒng)計量的閾值, 對故障集進(jìn)行故障診斷與識別。 若故障集數(shù)據(jù)超過閾值,則診斷正確,若沒有超過閾值,則診斷錯誤。
圖3為PCA診斷與識別故障類數(shù)據(jù)的統(tǒng)計量值和貢獻(xiàn)率。
根據(jù)圖3的MATLAB仿真結(jié)果可知:當(dāng)PCA確定的主元個數(shù)為31時,T2的控制限為0.056 9,SPE的控制限為10.061 9。 T2與SPE故障診斷率分別為100%與99.85%,診斷出的主控變量分別為16、7、13與2、16、21。

圖3 故障1診斷與識別統(tǒng)計量值和變量貢獻(xiàn)率
PCA方法對于480個故障數(shù)據(jù), 診斷出了478個,具有很高的診斷能力。當(dāng)TE過程中的A/C進(jìn)料流量比發(fā)生變化,組分B含量保持不變時,反應(yīng)物的組成成分變化會最先直接影響汽提塔、反應(yīng)塔相關(guān)的變量變化,如變量16(汽提塔壓力)、7(反應(yīng)器壓力)及21(反應(yīng)器冷卻水出口溫度)等。 同時,為了使反應(yīng)過程能夠改善,就需要對其他反應(yīng)物和可操作的反應(yīng)器、汽提塔和分離器進(jìn)行調(diào)節(jié),從而避免更為嚴(yán)重的故障。
對其他5種類型的故障也進(jìn)行上述診斷與識別過程,當(dāng)PCA確定的主元個數(shù)為31時,T2控制限為0.056 9,SPE的控制限為10.061 9。 圖4為5種故障的數(shù)據(jù)統(tǒng)計量值與變量貢獻(xiàn)率。



圖4 故障12、13、14、18、21診斷與識別統(tǒng)計量值和變量貢獻(xiàn)率
由圖4可知:
a. 故障12統(tǒng)計量T2與SPE故障診斷率分別為100%與95.62%, 診斷出的主控變量為16、7、13與2、21、16;
b. 故障13統(tǒng)計量T2與SPE故障診斷率分別為100%與98.33%, 對應(yīng)的主控變量為16、7、13與2、16、21;
c. 故障14統(tǒng)計量T2與SPE故障診斷率分別為100%與99.79%, 對應(yīng)的主控變量為16、7、13與2、16、21;
d. 故障18統(tǒng)計量T2與SPE故障診斷率分別為100%與82.58%, 對應(yīng)的主控變量為16、7、13與2、21、16;
e. 故障21統(tǒng)計量T2與SPE故障診斷率分別為100%與20.42%, 對應(yīng)的主控變量為16、7、13與2、21、16。
統(tǒng)計量T2的結(jié)果中,當(dāng)故障出現(xiàn)時,完全可以診斷出所有故障數(shù)據(jù),并且適用于上述5種故障;統(tǒng)計量SPE的結(jié)果略微低于T2, 仍然能快速診斷出故障是否出現(xiàn)。 統(tǒng)計量T2主要用于非成分量的變量時,會有很好的表現(xiàn),而統(tǒng)計量SPE是針對所有類型的變量,由于成分變量的作用,會導(dǎo)致其結(jié)果表現(xiàn)較差。
4.1 PCA方法通過建立正常工況數(shù)據(jù)的統(tǒng)計量控制限閾值,能夠快速準(zhǔn)確地發(fā)現(xiàn)過程運(yùn)行是否發(fā)生故障。
4.2 當(dāng)過程變量僅包含非成分相關(guān)的變量時,通過計算統(tǒng)計量T2能夠為設(shè)備運(yùn)行提供很好的故障診斷依據(jù);當(dāng)包含成分變量較多時,可以參考統(tǒng)計量SPE。