鐘 凱 韓 敏 韓 冰
1.大連理工大學電子信息與電氣工程學部 大連 116023 2.上海船舶運輸科學研究所航運技術與安全國家重點實驗室 上海200135
隨著現代工業水平的迅猛提高,其生產規模和生產過程的復雜性也大大增加,為了保障工業安全和產品質量,過程監控和故障診斷技術也顯得愈發重要[1-2].傳統的基于模型的過程監測方法依賴于精確的數學模型或充分的先驗知識,極大地限制了其在實際中的應用.而基于數據驅動的方法無需建立精確的過程機理模型,直接對過程運行數據進行分析和處理,據此建立描述過程運行狀態的統計模型,因此很適合于監測難以建模的復雜工業過程,主要包括,適合于故障分類和診斷的費舍爾判別(Fisher discriminant analysis,FDA)[3],主成分分析(Principal component analysis,PCA)[4],利用質量變量引導過程變量樣本空間分解的偏最小二乘(Partial least squares,PLS)[5]以及適用于非高斯過程監測的獨立主元分析(Independent component analysis,ICA)[6].特別地,PCA 作為一種最主要的數據驅動方法,能夠有效地進行數據降維和潛在特征的提取,并且在上述方法中具有最低的計算復雜度,因此受到工業界和學術界的廣泛關注,并在故障檢測和診斷領域取得了豐富的研究成果[7-8].
實際工業過程采集的過程數據一般都在時間上序列相關,而基于傳統的PCA 方法的過程監控并沒有考慮數據間的此種關聯,以至于主成分甚至殘差都具有未被建模的動態特性,因此并不適用于動態過程的建模.文獻[9]首先使用延時測量值擴充分析數據陣,然后對該增廣數據陣實施PCA 分解以建立數據間的動態關聯,進而提出了動態PCA(Dynamic PCA,DPCA)的主體框架.此后,DPCA在理論和應用上仍有后繼的發展[10-11].最近,文獻[12]利用自回歸模型提取數據間動態潛隱成分(dynamic latent variables,DLV),而PCA 模型用于建立殘差的靜態關系,因此靜態關系和動態關系都得到了很好的表征,從而提高了動態過程的故障檢測效果.
然而,以上所涉及的方法都是單個集中的模型,不適用于目前大規模的工業過程故障檢測,而分散式建模策略由于其具有較低的計算復雜度,較好的模型靈活性和較強的容錯能力等優點,已成為監控大規模工業過程的有力手段[13-14].更進一步,文獻[15]利用動態特性選擇準則并結合分布式建模的優勢,成功地解決了大規模動態的故障檢測問題.但其在選擇子模型變量時所依賴的動態特性準則是一種單純的線性關系指標,無法評估變量之間的非線性關聯,因此并沒有取得最優的故障檢測效果.文獻[16]又提出一種基于互信息(Mutual information,MI)的分散式動態PCA 故障檢測方法(MI-DPCA),MI 準則同時考慮了變量間的線性和非線性關系,較好地處理了數據的動態性問題.然而在分散式子塊中基于MI 準則選擇的變量之間往往存在較大的冗余,從而導致欠佳的故障檢測結果.文獻[17]提出了一種基于最大相關最小冗余(Minimal redundancy maximal relevance,mRMR)變量選擇的PCA 故障檢測,解決了由MI 準則帶來的變量間冗余問題,取得了較好的故障檢測效果.但該模型采取簡單地剃除mRMR值超過設定閾值的變量來實現變量選擇以建立相應的子塊,因此直接忽略了對當前變量影響較小的測量變量,并且也不能定量描述保留下的不同測量變量對當前變量的影響程度,此外該模型也無法解決動態過程的監控問題.
基于以上分散式建模的優勢以及描述變量間動態關系方法的不足的討論,并受到文獻[18]的啟發,本文提出了一種基于動態特性描述的變量加權型分散式故障檢測方法(Minimal redundancy maximal relevance—weighted dynamic principal component analysis mRMR-WDPCA).全文主要創新點如下:
1)與傳統的變量選擇方法[15-16]相比,mRMR算法考慮了動態過程中變量間的線性和非線性關聯的同時也顯著地減少變量間存在的冗余,從而能更準確地描述變量間的相關性關系.
2)根據變量間mRMR 值的大小對動態增廣矩陣中所有測量值賦予不同的權值,避免遺失含有有用信息的變量,且不同延遲變量對當前測量值的影響大小就通過權值來體現,因此能更加全面地刻畫該測量值的動態特性.
3)提出一種融合mRMR 算法,貝葉斯推理以及DPCA 模型的加權型分布式建模策略,提高了模型的容錯能力和泛化能力,取得了更好的故障檢測結果.為全流程動態過程監控方案的設計提供了新的思路.





圖1 基于mRMR 的動態特性描述Fig.1 mRMR-based dynamic feature characterization

由上述描述可知,與常規的DPCA 對所有的(d+1)m個變量賦相同的權值,亦或是與其他直接剔除某些相關性較弱的變量選擇方法相比,式(9)加權了所有的變量,在避免信息損失的同時,還通過較大的權值強調了相關程度較大的變量帶來的“積極作用”,而相對小的權值也抑制相關程度較小的延遲變量所帶來的“次要影響”,更能體現變量的動 態特性.
在上一節的動態特性描述方法的基礎上,我們給出如圖2所示的包含離線和在線兩部分的監控流程,具體細節介紹如下.

圖2 基于mRMR-WDPCA 故障監測的流程圖Fig.2 Flowchart of mRMR-WDPCA based fault detection
2.2.1 離線建模
步驟1.通過對X中每個測量變量引入其前d個采樣值,以獲取如式(2)中的增廣矩陣.
步驟2.對增廣矩陣的每一個測量變量實施第2.1 節的動態特性描述準則,以獲取Xa中每一列的權值向量,并按式(9)求取Xi.
步驟3.對Xi建立基于PCA 的監測模型,并重復 此步驟以獲得m個PCA 監測模型.
2.2.2 在線監測


TE(Tennessee-Eastman)工業過程由文獻[23]首次提出并已經成為驗證過程控制和故障診斷方法的標準實驗平臺,其流程如圖3所示,主要包含5 個主要單元:反應器、冷凝器、分離塔、汽提塔和壓縮機.主要涉及8 種反應成分:A、B、C、D、E、F、G 和H.整個過程中共有12 個操作變量和41 個測量變量,還有21 種不同的預設故障,每個故障都有相應的訓練樣本和測試樣本[24],相應地,故障都從第160 個采樣點開始引入,且本文涉及的所有仿真數據都可從網站http://web.mit.edu/braatzgroup/links.html 上下載.本文依據文獻[25]選擇了過程中的11 個操作變量和22 個測量變量共33 個變量作為監測對象,且假設所有數據都服從高斯分布.

圖3 TE 過程的結構圖Fig.3 Structure diagram of the TE process
離線建模階段,將正常工況下的960 數據作為訓練集建立DPCA、DLV 以及MI-DPCA 的監控模型,以作為本文方法的對比,為了更好地進行比較,所有方法的置信水平α都設置為99%.DLV 監測模型采用了3 個統計量,分別為和Qr,分別用于監測動態潛隱成分、靜態潛隱成分和殘差,關于該模型的具體介紹可參考文獻[12],此處不再贅述.而對于DPCA 和MI-DPCA 模型中的延遲測量值d可根據文獻[7]中提供的方法確定為2,保留的主元個數可通過累計方差貢獻率準則(CPV ≥85%)確定為34.且本文提出的mRMR-WDPCA方法中的延遲測量值d=2 ,而每個子PCA 模型中的主元個數同樣由CPV ≥85% 準則確定為1.
首先利用TE 過程中500 組正常數據作為測試樣本集測試DPCA、DLV、MI-DPCA 以及本文的mRMR-WDPCA 模型對正常工況的誤報率(第I型錯誤),具體的實驗結果如表1所示,由表1 可知,雖然所提方法兩個統計指標都沒有取得最低的誤報率,但是從工程實踐角度來說,監控過程中連續6個采樣點超過控制線時才被認為有故障發生,而由于mRMR-WDPCA 兩個指標分別對應的誤報率1.63%和 2.13% 都是通過單一采樣點計算求得的,所以所得結果仍然處于可接受的范圍內,所提方法在監控正常工況時也是有效的.

表1 TE 過程的誤報率(%)Table 1 False alarm rates of TE process(%)
通常來講,較低的故障誤報率會對應著較高的故障漏報率,為了進一步說明所提方法的優越性,還需對比4 種方法的故障漏報率(第II 型錯誤).即分別利用4 種方法來檢測TE 過程的21 種故障,并記錄每種方法不同統計量中較好的檢測結果,詳見表2.其中,由于故障3,9 和15 發生時不會引起樣本數據均值或方差的顯著變化[26],因此很難被本文中以數據均值和方差為診斷特征的mRMR-WDPCA 方法有效地檢測出來,所以,上述3 種故障在本研究中不予考慮.但已有一些基于流形學習[27]或子空間分解[28]的數據驅動方法仍可以成功檢測、診斷以上3 種故障.剩余的18 種故障對應的最小的漏報率以及檢測延遲數在表2 中都標記為粗體,以方便辨識.
從表2 中可以看出,所提方法在大多數故障類型上都能取得優越于其他三種方法的漏報率和檢測延遲數.特別地,對于故障10 和16 的漏報率得到大幅的降低.主要是因為mRMR-WDPCA 模型考慮變量間的線性和非線性關聯同時減少變量間存在的冗余,還通過不同權值的賦予,“凸顯”了重要延遲變量作用的同時也“弱化”了次要延遲變量的次要影響,因此所建立的監控模型能更加全面地描述當前測量變量的動態特性,從而能進一步提高故障的監測效果.即便是mRMR-WDPCA 方法沒有取得最好結果的故障,但所得結果與最優的漏報率也相差無幾.此外,4 種方法對剩余的18 種故障的平均漏報率結果如圖4所示,其中,DLVT表示DLV方法的兩個統計量和的均值,從圖4 中可知,相比于其他三種方法,本文所提模型的不同統計量都取得了最低的平均漏報率,因此從另一個角度說明了方法的有效性和實用性.

圖4 4 種方法的故障平均漏報率Fig.4 Average missing alarm rates of the four methods

表2 TE 過程故障漏報率(%)和檢測延遲數(個)Table 2 Missing alarm rates(%)and detection delay(delayed samples)of TE process
為了更好地展示mRMR-DDPCA 方法相比于其他對比方法的有效性,特將4 種方法對故障10和16 這兩種不同類型的故障的監控細節列于圖5和圖6 中.具體地,從圖5(d)中可以看出,mRMRDDPCA 方法的 BICQ統計量不但取得了最低的漏報率18.88%,而且在第163 個采樣點就檢測出了故障,故障延遲數為2,而其他三種方法對應的延遲數分別為18,7 和24,說明本文方法能在故障發生后

圖5 故障10 的過程監控結果Fig.5 The monitoring charts of Fault 10
最快地將其檢測出來.此外,當故障被檢測到之后,mRMR-DDPCA 模型對應的統計量曲線很少回落到閾值線以下,而3 種對比算法的統計量曲線都會出現不同程度的回落現象,從而導致較高的漏報率,進而說明了所提方法故障檢測的穩定性和持續性.類似地,圖6 中對于故障16 的監測細節同樣說明了所提方法的優越性.

圖6 故障16 的過程監控結果Fig.6 The monitoring charts of Fault 16
針對大型工業系統常常伴有復雜的動態特性,且變量間的相互影響會體現在不同的采樣時刻上等問題.本文利用分布式mRMR-WDPCA 方法充分刻畫變量間相關性的同時,也通過不同權值的賦予定量地描述了不同延遲變量對當前測量變量的影響程度,凸顯了變量間的相關性差異,從而更好地解決了測量變量的動態特性問題,取得較好的故障檢測結果.在TE 過程上的仿真實驗驗證mRMRWDPCA 相對于其他方法的優越性.然而,本文僅局限于故障檢測的分析,而后續的故障診斷問題還未有所涉及.此外,所提的mRMR-WDPCA 方法仍是一種線性模型且假設訓練數據服從高斯分布,如何將方法拓展以處理非線性、非高斯復雜過程仍是值得進一步研究之處.