王云會,楊 杰,楊佳琳
(京能集團北京京西燃氣熱電有限公司,北京 100041)
自動控制水平的提高對生產系統的故障診斷技術提出了更高的要求。傳感器故障是致使系統異常的常見因素之一,而故障信息的特征提取是診斷識別的關鍵技術。本研究將類均值核主元分析應用到故障診斷中,分析不同核函數的選取對判斷結果的影響。類均值核主元分析脫胎于周東華等[1-2]的豐富研究。主元分析是把相關變量數據轉換成部分無關變量數據的分析方法,但是不能解決非線性問題。因此,Scholkopf等[3]提出了核主元分析,不僅能處理非線性數據,而且其計算復雜度由輸入數據空間的維數決定。彭紅星等[4]提出了基于核的主成分分析(Kernel Principal Component Analysis,KPCA)的非線性過程的監控方法,成功應用于廢水處理過程的檢測,然而,該方法存在損失部分數據樣本信息的缺點。因而,針對這一問題,一種被叫作類均值核主元分析的新方法被提出[5],它在原始數據非線性映射到高維空間后,先求出映射數據的類均值矢量,再進行核主元分析,構建類均值核主元,使之包含了數據樣本的全部信息,降低數據維度的同時實現無損。類均值核主元分析已在故障診斷研究中有所應用[6-8],本文的目的在于探究不同核函數對故障診斷結果的影響,分別從故障識別和故障判斷角度進行實驗,即將類均值核主元分析與BP神經網絡結合[9-10],對比不同核函數下特征提取對故障識別率的作用。此外,計算T2和SPE統計量,比較故障判斷的準確性和即時性。文章闡述了類均值核主元分析的基本原理,并在此基礎上介紹核參數優化方法和實踐步驟,對不同核函數進行仿真實踐,通過總結分析發現,經粒子群優化后的混合模型在準確性和即時性方面更為優越。


設C的特征值μ對應特征向量為v,則有:


其中,D表示類均值核矩陣,且D為對稱矩陣。將矩陣D代入式(5),化簡得:

若類均值矢量均值不等于零,則需要對其進行中心化處理得到Dˉ,則有:

1.2.1 核函數選取和優化
分析類均值核主元的步驟可知,核函數的選取決定核主元的最終形式,不需要對數據進行非線性映射操作,只需要選擇滿足條件的核函數即可。常用的核函數包括:多項式核函數、高斯徑向基核函數、神經網絡核函數等。本文中采用多項式核函數、高斯徑向基核函數及其混合核函數作比較,分析優越性。
多項式核函數:

高斯徑向基核函數:

混合核函數:

在核參數的應用中,分別存在d,σ,ρ3個未知參數,人為經驗的設定對最終的判斷結果存在巨大的影響,本文通過粒子群優化算法(Particle Swarm Optimization,PSO,PSO)尋找各個核函數在類均值核主元分析中的最優參數設置,其算法流程如下:(1)初始化種群。(2)計算各個粒子的種群適應度,求出個體極值和全體極值。(3)更新速度和位置。(4)判別結束條件,若不滿足,返回上一步繼續執行。
1.2.2 故障類型識別方法
本文采用BP神經網絡進行故障類型識別的分類方法。BP神經網絡是一種按誤差反向傳播訓練的多層前饋網絡,其算法稱為BP算法,基本思想是采用梯度下降法,使網絡的實際輸出值和期望輸出值的誤差均方差最小。結構如圖1所示。
由于基于跨境電商平臺能實現了單個企業之間或單個企業與單個消費者之間的交易,所以它已然成為外貿企業的轉型的創新途徑(任志新、李婉香,2014)。同時,聶林海(2014)也指出電子商務一方面可以帶動傳統企業加快轉型升級,也能為中小企業進入大市場提供更好助力,并為其創造更多的貿易機會和發展空間;另一方面,它也能成為企業開拓海外市場的利器?;ヂ摼W市場和實體市場協同融合發展將成為世紀經濟發展的必然趨勢。

圖1 BP神經網絡結構
BP神經網絡擁有很強的非線性映射能力、自學習和自適應能力,實質上實現了一個從輸入到輸出的高維映射功能,正好映射了類均值核主元分析法中的高維映射過程。具有3層及以上的BP神經網絡能夠以任意精度逼近任何非線性連續函數。BP神經網絡在訓練時,能夠通過不斷地更新并自動提取輸出、輸出數據間的“合理規則”,自適應地通過網絡的權值調整來逼近期望結果。上述兩點能保證其作為類均值核主元分析法中故障類型識別方法的合理性。
1.2.3 算法步驟
在進行故障診斷時,一方面,利用類均值核主元分析處理實驗數據,實現無損降維;另一方面,通過前者提取出的主元特征映射得到新數據集,采用BP神經網絡訓練優化,得到診斷模型。整個步驟中,變參數是作為核心的核函數被選取的,改變核函數的種類并通過PSO優化得到最佳參數,進行實驗對比,具體步驟如下:
(1)對數據樣本進行去噪、平滑、標準化處理。
(2)應用PSO算法優化3種核參數,分別就不同核參數進行類均值核主元分析,計算類均值矩陣,并對其進行中心化處理。
(3)計算中心化后的核矩陣的特征值和特征向量,并計算特征向量在特征空間上的投影,得到降維后的樣本數據集Q=H×X,其中,X為處理后的數據集,H為由核主元組成的特征矢量。
(4)確定網絡的輸入,將被檢測的故障狀態進行編碼和樣本訓練,計算各神經元之間的權值。
(5)用訓練好的網絡進行故障識別。
以圖2中上下水箱液位以及相關的控制器、執行器輸出指令作為檢測變量,模擬各故障狀況,獲取實驗數據。取各故障的前1 000組數據作為訓練樣本,剩下的500組數據作為測試樣本,并對故障類型進行獨熱編碼,輸出節點如表1所示。

圖2 實驗平臺

表1 故障診斷網絡訓練樣本目標輸出編碼

續表1
通過粒子群優化算法尋找各個核函數在類均值核主元分析中的最優參數設置,所優化核參數如表2所示。

表2 核參數優化結果
針對上述3種核函數的神經網絡訓練結果(即故障識別對比結果)如圖3所示。

圖3 3種核函數的故障識別對比結果
可以直觀看到,當傳感器發生漂移、超限、恒增益、恒偏差、失效和斷線故障6種故障時,上述3種核函數經粒子群算法優化核參數后都能以不低于90%的識別率準確診斷出故障類型。高斯徑向基核函數在漂移、超限和恒偏差故障的特征提取中有優勢,多項式核函數在其余3種故障的診斷中有優勢。而混合核函數則結合二者的優點,其診斷結果明顯優于單一一種核函數的結果。
為進一步驗證混合核函數的優越性,分別計算T2和SPE統計量,判別故障的發生的原因。其中,T2統計量反映了每個主成分在變化趨勢和幅值上偏離模型的程度,是對模型內部化的一種度量,可以用來對多個主元同時進行監測;SPE統計量刻畫了輸入變量的測量值對主元模型的偏離程度,是對模型外部變化的一種度量。結果如表3所示。

表3 故障診斷結果
表3中數據表示,在采集正常情況下的數據點800個(訓練分類器用)之后,開始模擬6種故障的發生。表3中數值即為通過兩個統計量指標檢測出當前正確顯示故障原因的時刻,顯然,數值越靠近800表示越能及時發現故障。
通過對比表3中數據可以看出,采用混合核函數時,對漂移故障、恒增益故障以及恒偏差故障的檢測及時性明顯快于其他兩種核函數,分別提高了32次、35次和44次(和相對好的一種結果相比)。
本文針對工業工程中常見的傳感器故障類型(超限、失效、斷線、漂移、恒增益和恒偏差故障),利用類均值核主元分析法對其進行診斷。分別利用3種核函數不同的故障類型是否發生進行診斷。結果顯示,3種核函數對超限故障、失效故障和斷線故障具備相近的檢測能力,而對于漂移故障、恒增益故障和恒偏差故障,混合核函數的應用具有更高的準確性和及時性。進而通過與BP神經網絡結合證明故障識別的準確性,通過T2和SPE統計量證明故障診斷的及時性。