孫中建,楊博,齊楚,李宏光
(北京化工大學信息科學與技術學院,北京100029)
對于連續工業過程中的某些生產系統,一些離散過程參數如電機、閥門和開關等也會經常發生狀態改變,因而對生產系統的安全性和穩定性產生影響[1],即體現了混雜系統特性。混雜系統是指同時包含離散事件系統和連續變量動態系統、兩者又相互作用的系統[2],其特點是隨時間連續變化的同時,也受到離散事件的驅動。故障檢測技術已被證明能夠提高生產過程的安全性并降低制造成本[3],其中廣泛應用的技術可分為基于模型、基于知識和基于數據驅動的方法[4]。因不需要精確數學模型和大量先驗知識,近年來基于數據驅動的故障檢測引起廣泛研究[5-8],而對于工業過程中的混雜系統的故障檢測相對關注較少[9-10]。
采用知識分類技術構建工業過程數據監測模型,可以為工業過程混雜系統的故障檢測提供新方法。而在故障檢測分類方法中,模型的可解釋性引起了研究人員的關注[11],進而通過發現可解釋模式的知識來分析和檢測故障[12]。數據邏輯分析(logical analysis of data, LAD)是一種描述性機器學習方法,通過分析歷史數據中變量的組合來描述不同的分類。與一般的數據驅動的故障診斷方法相比,優勢在于其強大的解釋能力,能夠在歷史數據中挖掘隱藏的相關聯的物理現象,并且根據專家知識進行因果關系的表達,使其在工程、金融、醫療保健等多個領域得到了廣泛的應用[13-15]。在工業領域,使用LAD 方法檢測和預測物理現象,同時解釋現象背后的原理,Mortada 等[16]將LAD 用于檢測和隔離航空公司機隊的劣質渦輪壓縮機,通過監視某些性能指標和專家系統的知識,發現了劣質組件獨有的模式。Shaban等[17]提出了一種適用于復合材料碳纖維增強聚合物布線工藝的過程控制技術,通過監視某些加工特征和參數來檢測特征模式,并使用它們在特定范圍內控制加工零件的質量。Jocelyn等[18]將LAD 應用于職業健康和安全領域,尤其是表征了與機械相關的不同類型的事故,并將其與故障的根本原因相關聯,生成了用作確定風險因素和潛在事故原因的優先級的模式,以幫助安全從業人員做出有關機器安全措施的決策。Ragab 等[19]將LAD 應用于診斷復雜工業化學過程中的故障并解釋這些故障的潛在原因,并與其他常見的機器學習技術獲得的結果進行比較,結果表明LAD 的性能與最精確的技術相媲美。
LAD 基于離散化的歷史數據進行模式提取,適用于針對混雜變量的過程監測,但LAD 在挖掘規則過程中由于對連續變量離散化表示而嚴重丟失了連續變量的趨勢變化信息,而過程數據的動態特性中包含的潛在信息需要納入模型[20],否則難以挖掘到令人滿意的結果。另外,LAD 在提取特征時忽視了變量的權重差距,容易獲得無法體現過程特征的冗余規則,因此,本文提出一種面向工業過程混雜系統故障檢測的擴展數據邏輯分析(extended logical analysis of data,ELAD)方法,挖掘混雜系統過程數據中的隱含規則及連續變量的變化趨勢,刪除冗余規則,獲得豐富的故障信息和高效的故障檢測模型,應用于工業煤氣化汽包過程實例,以驗證其效果。
數據邏輯分析能夠發現歷史數據中隱含的知識,相關研究證明了發現知識的有效性[21-22]。LAD迭代提取能夠表征不同類別的模式,直到所提取模式能夠完全表征所有的觀測值,因此提取模式中存在的冗余模式引起進一步的研究[23]。
作為有監督的分類學習算法,LAD 基于優化領域和布爾函數理論,對多類問題進行模式提取[24-26]。其最大的優勢在于強大的解釋能力,根據從訓練數據集中提取的可解釋的模式構建決策模型。LAD主要包括數據二值化、模式提取和理論形成三個步驟[27]。二值化處理按升序對變量Z 的觀測值進行如下排序:



二進制屬性bZ,i(i=1,…,r)由基于切點αZ,i的數值變量Z形成,即:

正負模式的生成是相對稱的,為了簡便起見在此僅描述正模式的產生過程。模式生成最直接的方法即為枚舉產生,所產生模式需至少包含一組正觀測值并且不包含任何負觀測值。本文基于LADWEKA 平臺采用啟發式方法提取模式[28],提取的模式有兩種形式:自變量和組合變量。自變量由自身規則即直接影響系統的分類結果,無須檢測其他的變量,可以根據自變量的變化范圍給出結果產生的原因。組合變量是通過不同變量之間分別滿足不同的條件而組成的規則,可以獲得難以發現的變量之間的聯系,通過共同作用影響模型。其算法描述見表1。

表1 LAD算法描述Table 1 Logical analysis of data algorithms
LAD 能夠生成表征特定觀測值的不同規則,但由于工業過程中存在眾多高維、復雜數據組,直接使用所有數據將導致模型訓練速度慢且包含大量冗余信息,這里,提出一種擴展數據邏輯分析(ELAD)方法,在建立ELAD 模型時需要首先對原始數據進行降維[29],但同時為了保留表征原始數據特性的過程變量,在不改變原始數據結構的情況下,選擇使用灰色關聯分析對數據進行處理,排除對過程無影響變量的信息,指導選擇過程以解決選擇問題[30-31]。ELAD 產生的規則必須經過進一步的篩選才能構成模型,因此模型構建時通過與關鍵變量的灰色關聯度對相關變量的優先度進行選擇,從而解決規則冗余的問題。在確定單元窗口參數后,引入動態標準差及趨勢變化量,豐富變化信息以避免信息丟失。
ELAD 能夠自動選擇相關性強的變量,并在不需要人為干預的情況下進行模式提取,刪除冗余規則并形成具有可解釋性的分類模型,主要包括灰色關聯分析、挖掘波動趨勢、挖掘規則、模式選擇與模型構建四個步驟。模型建立的流程如圖1所示。

圖1 ELAD流程圖Fig.1 The flow chart of ELAD
灰色關聯分析是一種根據因素間發展趨勢的相似程度以衡量因素間的關聯程度的方法[32],因其可以直接評估原始數據,受到廣泛關注并在工業領域成功應用[33],本文選用灰色關聯分析法以實現相關變量的選擇并用于后續步驟的規則提取,能夠初步避免冗余規則的產生。
為了消除量綱對于計算結果的影響,在關聯分析之前對所有變量進行歸一化處理。設表示關鍵變量的參考序列為x0={x0(k)|k = 1,2,…,m },表示相關變量的數據組存在 n 個變量 xi={xi(k)|k = 1,2,…,m },i=1,2,…,n。因此x0(k)與xi(k)關于第k個指標的關聯系數ξi(k)有:

其中,i=1,2,…,n;k=1,2,…,m。

分辨系數取值區間為[0,1],取值越大則分辨率越大。第k個指標與參考序列的關聯度為:

為了挖掘變量的變化情況尤其是過程中的波動信息,受到基于均值和數據分布的形態特征改進符號聚合近似方法的啟發[34],在模型中引入基于歷史數據的標準差以表征變量的持續波動變化情況,標準差能反映數據集離散程度的同時不受樣本個數的影響,相比較于均值或其他特征變量,波動變化情況在過程中將更清晰地反映運行狀態的改變。
設變量可表示為x ={x(k)|k = 1,2,…,N },那么標準差σ為:

由式(8)、式(9)計算的標準差反應變量x 的離散程度,而針對于過程變量需要考慮的是不同狀態時的變化情況,因此本文提出單元窗口波動趨勢的概念。單元窗口[35]是指在一個觀測周期內,所包含的所有時間序列數據集,在單元窗口內部對應的不同變量存在著不同的趨勢特征,因此同一個單元窗口內存在多個標準差,換句話說,對于變量而言在該窗口內只有一個趨勢特征值,即計算所得標準差能夠體現該變量最新的發展情況。
單元窗口寬度nw太大不僅對歷史數據的要求過高,而且無法體現變量最新的波動情況,寬度太小也會造成計算精度缺失,甚至在波動的工業數據中失去意義。在確定單元窗口寬度并計算標準差后,需要選取適當的窗口滑動長度nl,窗口滑動長度決定趨勢波動的變化精度,當長度越小時將獲得頻率越高的對比結果,如圖2所示。

圖2 單元窗口及滑動長度Fig.2 The unit window and slide length
為了獲取相同的單位時間段內的變化信息,采用固定的單元窗口寬度nw(nw?N),nw需要根據變量進行適應性調整,為了能夠獲取迅速變化時的信息,單元窗口寬度選取為窗口內平均值變化為該變量波動值的時間長度,不超過該變量極值至均值的時間長度,可得到動態標準差σt為:

為了能夠提取靈敏的波動趨勢特征,采用窗口滑動長度nl=1 進行后續分析[36]。在確定單元窗口參數后,為關鍵變量引入趨勢變化量k={+1,-1},k=1時表示關鍵變量當前時刻較上一時刻增加,反之為降低。引入該值能夠增強模型表達能力,進一步豐富故障的特征信息。
ELAD 參照灰色關聯度選擇相關變量進而提取模式,在表征所有的觀測值的同時選用關鍵變量進行表達,相比于單純基于統計的傳統方法,能夠增強模型的準確性和有效性。假設某過程有關鍵變量A,經過灰色關聯分析后篩選出2 個相關變量C、E,可行方案將從以上3個變量及其波動參數依次為B、D、F 的模式組合中產生。每個可行方案都將按照覆蓋率和重疊率進行組合,覆蓋率指的是該模式能夠表征的觀測值的數目,重疊率指的是所有觀測值中被多個模式覆蓋的數目。覆蓋率能夠體現該模式的表征效率,重疊率則體現模式中存在的冗余觀測值。最終形成的可行方案將在優先提取關鍵變量的模式后,選取覆蓋率高且重疊率低的模式進行組合,產生的模型可能包含不同的可行方案。

圖3 模式選擇過程Fig.3 Patterns in selecting
圖3展示了模式選擇的全過程,由灰色關聯度、覆蓋率、重疊率共同選擇出可行方案。在所有變量中,發現了不同的9 種基本事件,其中與關鍵變量A相關的基本事件有2種。首先計算關鍵變量基本事件的覆蓋率均不為1,因此選取相關變量的模式進行組合,對每個組合模式的覆蓋率和重疊率進行計算,直至獲得覆蓋率為1 的模型才足以表征所有的觀測值,在最終獲得的可行方案中選取重疊率最低的作為檢測模型。根據上述方法能夠獲得P((P1∩P3)∪(P2∩P6))和P((P1∩P4)∪(P2∩P8))兩種可行的模型。
模型由多個可行方案即模式組成,每個模式由1 個或多個規則組成,每條規則可能包含多個事件的合并集關系,每個事件的發生概率使用符合該事件的觀測值與所有的觀測值之比表示:

若規則Mi中含有多條規則相交的情況,根據貝葉斯定理[37]有:

針對不同的可行方案,由組合模式的有限個事件P1,P2,…,Pn并集計算可行方案的概率,根據龐加萊公式[38]有:

最后,分類事件的可行解概率由所有可行方案Sq(q = 1,2,…,Q)計算:

考慮某工業煤氣化合成氣洗滌單元中壓汽包過程,其工藝流程如圖4 所示。氧氣經由氧氣緩沖罐進入預熱器,中壓循環水使其溫度加熱到指定溫度,混合蒸汽后輸送至氣體混合器。中壓飽和蒸汽被蒸汽電加熱器加熱至指定溫度與氧氣按比例混合,與粉煤一同輸送至氣化爐。中壓汽包液位控制給水流量大小,是中壓汽包過程監測的關鍵參數。根據工藝知識和數據分析,共有12 個與該反應過程相關的變量,其中包含1 個離散變量,如表2 所示。通過對汽包液位變化機理的研究,汽包故障有兩種常見情況,即液位過高或液位過低,液位的變化不僅取決于通過閥門控制的流量變化,同時也受到循環過程中環境參數連續變化的影響,因此在過程中同時關注閥門的操作以及監測變量的狀態。
確定中壓汽包液位為關鍵變量以后,選取灰色關聯算法分析液位與其他連續變量的相關度,圖5描述了過程變量間的灰色關聯度。

圖4 汽包過程工藝圖Fig.4 The steam drum process diagram

表2 相關變量及其描述Table 2 Correlated variables and its description

圖5 變量間的灰色關聯度Fig.5 The grey association analysis between variables
可以看出液位和其他連續變量的相關程度,采用試錯法選取閾值為0.65,得到與液位相關程度高的6個變量分別是補水流量、汽包壓力、鍋爐水補水溫度、汽包出口蒸汽溫度、汽包循環水密度和去汽化爐循環水流量,因此選用以上7 個變量以及離散變量組成的數據集進行后續的分析。表3給出了相關過程變量部分數據,圖6為數據集的可視化結果,紅色表示故障,藍色表示正常,使用以下算法不能準確識別故障同時改變了原始數據的結構,無法獲取能夠表征特性的規則信息。

表3 相關過程變量數據Table 3 Correlated variable data
表4 為提取由8 個變量組成的數據集,利用ELAD 算法進行隱含模式的挖掘。為了能夠體現變量的變化情況,在數據集中添加基于歷史數據的變量標準差信息。在眾多的規則中設置覆蓋閾值為2%,這意味著僅包含少量數據的規則將被過濾,保留適用于多組數據的不同規則的組合。
訓練過程如下:
(1)根據液位變化計算單元窗口參數取nw=30,nl=1,并計算k;(2)提取隱含規則,正常數據不能包含在規則內的同時必須有一條以上的故障數據被規則所描述;(3)規則選擇與組合,根據覆蓋閾值選取含有關鍵變量的規則計入模式,對于未能包含的故障信息使用相關變量進行表示。
經過訓練,共建立四類故障檢測模式,分別是:
檢測故障模式M1,由兩條規則組成,M1=R(1)∪R(2);

圖6 數據集可視化結果Fig.6 Visualizations of the dataset

表4 訓練集和測試集的數據總數Table 4 Number of training and testing datasets
檢測故障模式M2,由兩條規則組成,M2=R(3)∪R(4);
檢測故障模式M3,由兩條規則組成,M3=R(5)∪R(6);
檢測故障模式M4,由兩條規則組成,M4=R(7)∪R(8)。
其中,M1和M2表示液位過高的故障,M3和M4表示液位過低的故障。構成四種檢測故障模式的基本事件的含義和不同規則在故障數據中的覆蓋率如表5和表6所示。
以上檢測模式可解釋如下:在檢測模式M1中,補水流量閥為開,液位呈上升趨勢,液位高于71.105并且液位變化波動較大為故障,表達式中出現離散變量意味著在該情況下補水流量閥值與正常狀態時相反;或者當滿足液位高于71.105,流量大于3.423,流量波動較小且循環水密度波動較小時為故障。在檢測模式M2中,當滿足補水流量閥開,液位呈上升趨勢,液位高于71.105 同時補水流量大于3.1788時為故障;或者當滿足補水流量閥開,液位呈上升趨勢,液位波動較大同時補水流量波動較大時為故障。檢測模式M1和M2等價,均為液位過高時的可行方案,M3和M4為液位過低時的兩種可行方案,表7為計算的故障發生概率。

表5 基本事件覆蓋率Table 5 Coverages of events

表6 規則覆蓋率Table 6 Coverages of rules
四種檢測模式能夠反映所有訓練集中的故障狀態,對于汽包過程故障和正常的誤判都將影響報警結果,因此在測試集中計算各模式的準確率[39],如表8所示。

表7 故障發生概率Table 7 Fault Probabilities

表8 模式準確率Table 8 Accuracies of patterns
從過程控制方面,根據表7的實驗結果,操作工人需要預防概率較大的規則發生情況,避免最終引發故障。如表9所示,相比較于傳統方法,采用本文提出的ELAD 模型能夠排除冗余規則,對混雜系統故障類別的識別正確率可以達到99.8%,獲得可以解釋的規則信息,取得令人滿意的分類結果,增強了汽包過程對于故障的檢測能力。

表9 與傳統分類模型的性能比較Table 9 Performance comparisons with traditional classifiers
通過結合灰色關聯度選擇過程變量并引入固定窗口的動態標準差挖掘波動趨勢信息,從而優化數據邏輯分析在面向工業過程混雜系統時提取規則的選擇問題,提出一種擴展數據邏輯分析方法,能夠在不需要專家干預的情況下生成基于數據的可解釋模型,能夠準確描述不同的觀測集并且提供便于理解的因果關系并將模型應用于故障檢測。應用于工業煤氣化汽包過程的實驗結果表明在提取模式和故障檢測方面的有效性,所提出模型在不依賴于豐富的專家知識的情況下有效降低了規則的復雜程度,獲得面向混雜過程的高效檢測模型并豐富了故障信息,提高了對于模型的解釋能力。
將來重點研究對于變量之間在不同生產狀態下產生偏移的規則提取,并且考慮變量的時滯情況,提取故障發生前期的知識,從而實現對于故障預警能力的提升。