馬立玲,徐發富,王軍政
?
一種基于改進核Fisher的故障診斷方法
馬立玲,徐發富,王軍政
(北京理工大學自動化學院,北京 100081)
針對化工過程故障數據呈非線性分布,數據類別復雜,難以進行故障診斷的問題,提出一種改進核Fisher的故障診斷方法。對于原始樣本數據投影后,樣本出現因類間距離存在很大差異性而導致部分類別樣本存在混疊的現象,以及不同類別的邊界數據歸類模糊問題,給出了統一的解決辦法。該方法首先采用改進類間距的方法來改變樣本投影空間的分布,使得樣本具有較好的投影效果,然后通過定義閾值參數來篩選出邊界數據,對于邊界數據,采用改進的近鄰(-NN)算法來分類,對于非邊界數據,采用馬氏距離來分類。最后在TE過程中進行了仿真驗證,結果表明方法在兼顧了故障診斷時間的同時,有效提高了故障診斷精度。
核Fisher;故障診斷;改進-NN算法;實驗驗證;優化
在實際的化工過程中產生了大量的數據,化工過程的故障診斷問題是如何利用這些故障數據,對其進行分類。這種基于數據驅動的統計方法在化工過程中得到了廣泛運用[1]。目前基于數據驅動的故障診斷方法主要有:統計分析方法、信號處理方法、基于定量的人工智能方法[2-3]。統計方法主要包括:主元分析、最小二乘、獨立元分析、Fisher判別分析、貝葉斯理論等方法;基于信號處理的方法主要有:小波變換、希爾伯特變換等;基于定量的人工智能方法主要有:模糊數學、支持向量機等[4-6]。然而這些方法有其局限性,對于復雜的化工過程,單純的這些方法已經不能滿足需要。而將核方法[7]引入Fisher判別分析中,很大程度上解決了原始數據呈非線性分布問題,適用于復雜的化工過程。在過去的十多年中,核Fisher方法得到了廣泛的運用[8-17]。
近年來,運用Fisher判別分析進行故障診斷取得了許多成果。文獻[18]提出了基于改進的生物地理學優化算法的加權核Fisher判別分析法,對非線性大規模的工業過程進行及時、準確的故障診斷;文獻[19]提出了在類標簽指導下最小化同類流形的離散度并最大化異類流形的離散度來實現類判別;文獻[20]提出了基于核Fisher的正常工況與故障包絡面模型,給出了基于該模型的在線故障診斷流程,該方法能夠及早診斷出故障的發生;文獻[21]提出了基于核Fisher判別分析的非線性統計過程監控方法,能有效捕獲過程變量之間的非線性關系;文獻[22]所提方法充分利用了蘊含于無標記故障樣本中的故障信息。這些方法一定程度上提升了故障診斷的正確率,但是故障診斷的快速性、準確性還有待進一步提升。
運用核Fisher分析法進行故障診斷時,還是存在一些問題:①對于故障樣本在投影空間的投影數據,存在邊界數據由于遠離類中心且處于不同類的分界處,導致歸類模糊誤判的問題;②在投影空間,有的樣本類間距離存在很大差異性,導致類間距小的類別間出現投影數據混疊,互相掩蓋的現象。針對以上問題,提出了統一的解決辦法,基于改進的核Fisher方法,有效改善了核Fisher的投影效果,并很好減少了故障樣本的分類錯誤率,這一方法在TE平臺上得到了驗證。
Fisher判別分析是模式分類領域研究發展的一種數據降維及分類方法。它的核心思想是投影,依據樣本的不同特征,將測試數據投影到某個方向,使得測試數據的投影的類間離散度最大化并同時最小化類內離散度。雖然傳統的Fisher判別在故障診斷方面有了廣泛的運用,但是當變量之間的非線性化很嚴重時,很難找到一個合適的方向使得測試數據的投影能最大程度地分離。針對非線性分類,將核函數方法引入Fisher判別中取得了很好的效果,Mika等[23]最早提出了核Fisher判別分析。下面對核Fisher判別進行簡述。
假設在維空間的所有樣本點有類,即1,2, …,G,樣本總數為。第(=1, 2, …,)個類G包含N個樣本記做1,2,…,。
樣本∈R通過非線性高維映射后對應的模式()∈。在高維特征空間中,訓練樣本的類內離散度W和類間的離散度B分別為

(2)
式中,表示特征空間中第類采樣均值:,而表示所有樣本點在特征空間中的均值:。在特征空間中,Fisher判別準則為

式中,為任一非零列向量。Fisher判別就是通過最優化式(3),找到最佳投影矢量。由于特征空間維數太高,不能直接求取,因而引入核函數
(4)
式(4)表示任意2個在高維空間中的向量內積可以用核函數表示。則式(3)中最優解可以表示為:,其中=(1,2, …,)T為一列向量。于是在高維特征空間中Fisher準則變為

式中,B和W的求法如下

因此式(5)的問題轉化為求W?1B的最大特征值以及對應的特征向量。在實際應用中,往往不能保證W是非奇異的,因此,采用W+來替換W,其中是一個極小的正數,通常取=10?7,為單位矩陣。
在核函數Fisher判別方法中,核函數的選取至關重要。核函數有很多種,最為常見的有線性核函數、多項式核函數、徑向基函數和Sigmoid核函數等,但是如何構造一類最優核還沒有一個好的方法,缺乏深入的理論研究。在文獻[24]中,通過實驗研究發現,在默認參數的情況下,RBF核函數(高斯核函數)具有較好的分類能力。在本研究中,采用RBF核函數

式中,參數為正常數,的選取是一個優化問題,目前常采用的參數選擇方法有:交叉驗證法[25]、Bayesian法[26]、梯度下降法[27]等。本研究采用交叉驗證法選取參數。
2.1 類間距的改進
在很多研究情況下,類間距離存在很大差異,通常計算類間離散矩陣B如式(2)所示,計量類間差異的權重僅僅是依據不同類別樣本數在總體樣本中所占比例計算,但是在實際情況中,會出現有部分類距離其他類別很遠,但是有些類別的間距很小,容易出現類間差異較小的類信息被差異較大的類信息覆蓋的情況,導致故障分類效果不佳。
為解決上述問題,在原先的核Fisher判別中,保證類內離散度不變,重新定義映射后類間離散度,與Dai等[28]一樣,采用Euclidean距離的函數來對類間距進行加權。重新定義的類間離散度如下

式中,和為第類和第類的平均值;d為第類和第類的類間距離,如式(8),權重函數(d)為關于d的一個函數。
(8)
式中,k1,i2=〈(x1),(x2)〉,k1,j2=〈(x1),(x2)〉,k1,j1=〈(x1),(x1)〉。
文獻[28]中,權重函數定義為(d)=d?q(∈,≤3),即權重與類間距離呈反比。一般取3~10。
2.2 故障分類的改進
將任意一個原始故障數據樣本=[1,2, …,x]T經過核Fisher判別投影后得到投影向量=[1,2, …,y]T(≤),同樣第類組均值x經過投影后得到投影向量=[,, …,]T。傳統的判別方法通過計算兩個投影向量之間的歐式距離來判斷故障類別,即:若
歐式距離雖然簡單易用,但缺點明顯,將樣本的不同屬性間的差別等同看待,這一點有時不能滿足實際需要。而馬氏距離不受量綱影響,可以排除不同變量間的相關性干擾,能計算樣本與不同總體間的相似性,因而更適合用來判斷故障類別。
2.2.1 馬氏距離 分別計算待判樣本到每一個類別的馬氏距離,則該樣本點屬于馬氏距離值最小的那一類。
具體判別規則如下:
雖然通過馬氏距離能夠有效且快速地對大多數故障樣本進行準確分類,但是對于不同類別邊界上的數據歸類仍然存在較大的錯誤率,歸類模糊。因此考慮使用-NN算法來對樣本進行歸類。
-NN算法根據與待判樣本最鄰近的個樣本來決定歸類,具有很好的分類能力。但是-NN算法本身也存在一些不足:①-NN算法需要存儲全部訓練樣本,具有繁復的距離計算量;②-NN算法沒有考慮距離遠近,當樣本不平衡時,可能導致待判樣本直接歸入大數量類的類別,從而導致誤判。針對以上兩點,提出了相應的改進措施:①僅僅針對占少量的邊界樣本采用-NN算法,其余大多數樣本仍然采用馬氏距離來判別;②采用加權的方法來改進-NN算法,將距離因素考慮在內,提升判斷的準確率。
2.2.2 改進-NN 具體做法如下:
(1)找出邊界點。求出待判樣本距離每個類別的歐式距離dis1, dis2, …, dis,按照距離由小到大排序為dis'1, dis'2, …, dis',邊界判別標準如下

式中閾值參數是一個(0,1)間的小數。當滿足式(9)時,認為待判樣本屬于邊界點。
(2)針對確定為邊界點的待判樣本點,求出距離待判點最近的個樣本點1,2, …,z到待判點的距離dis1, dis2, …, dis。設函數(dis)=1/dis,表示和待判樣本點距離小的鄰近點權值大,這與加權的初衷相吻合。記這個樣本點屬于個類別G1,G2, …,G,該待判樣本屬于樣本點加權和最大的類。判別準則如下:若
2.3 故障診斷算法的具體步驟
經過對傳統的核Fisher方法的改進,能夠很大程度地提高故障診斷正確率,具體的算法步驟如下:
(1)采集原始故障數據,對原始數據進行歸一化處理,并將處理后的數據分為兩部分:訓練集和測試集。
(2)將訓練集輸入改進類間距的核Fisher方法中,用交叉驗證法優化選取RBF核函數的參數。
(3)輸入測試集,根據式(9)判斷測試數據是否為邊界點。
(4)如果測試數據不是邊界點,則采用馬氏距離來判斷該數據的故障類別。
(5)如果測試數據是邊界點,則用改進后的-NN算法來判別該數據的類別屬性。
本研究依托于田納西-伊斯曼過程來驗證算法的正確性。TE過程是伊斯曼化工公司創建的一個真實工業過程仿真,該過程作為各種統計數據分析算法的數據源,得到了廣泛的認可與運用。TE過程包括5個主要過程單元:反應器、冷凝器、壓縮機、分離器、汽提塔。該過程包含12個控制變量,41個觀測變量,20個類型的典型故障,文獻[29]對其有詳細描述。
3.1 實驗1:數據歸類模糊的故障診斷實驗
在文獻[30]中提到,有3種典型的故障類別(故障4、故障9、故障11),其原始觀測數據空間重疊嚴重,各類別之間具有很強的非線性,如圖1所示。
同時,在文獻[30]中經過實驗證明,特征9和51與輸出故障類型間具有很高的互信息值,對區分故障類別能提供很多的有用信息,而且選用特征{51,9},所建的故障診斷模型簡單,因此本研究選擇特征{51,9}來對故障4、9、11進行區分。
對于故障4、9、11每一種類型,各自選用兩組數據:訓練集和測試集,各自包含400個樣本。即訓練集共400×3個樣本,測試集共400×3個樣本,且每個樣本包含2個特征,特征51和9。
采用傳統的核Fisher對訓練集進行投影,投影效果如圖2所示(為方便觀看,每類故障僅畫了100個樣本的投影情況)。
由圖2可以看出,3類故障數據的投影間距較均勻,沒有出現混疊現象,主要是投影邊界點處點存在歸類困難問題。
針對上述采集到的故障數據,輸入訓練集共1200個樣本,測試集共1200個樣本,采用標準的核Fisher對樣本進行投影,采用馬氏距離對所有樣本進行故障分類,表1顯示的是隨著核參數的變數,訓練集和測試集的故障診斷準確率的變化。

表1 不同核參數δ的故障診斷結果
通過表1可以看出,隨著核參數的增大,從0.01到100,測試樣本的故障診斷正確率并不是隨的變化呈遞增或遞減的關系,很難找出最優的。目前對于核參數的選取并沒有統一的標準,在常用的參數選擇標準中,本研究采用的交叉驗證法能得到的一個較優值。
對故障數據采用標準的核Fisher對樣本進行投影,用馬氏距離結合改進-NN的方法來進行故障診斷。經過交叉驗證法選取核參數的平方取0.08。表2顯示的是隨著邊界判斷閾值的變化,訓練集和測試集的故障診斷準確率的變化。

表2 不同閾值ε的故障診斷結果
通過表2可以知道,當閾值0.1≤≤0.6時,隨著的增大,訓練樣本的準確率由93%提高到95.83%,測試樣本的準確率由91.67%提高到92.83%,準確率均有明顯增大。但是當超過0.6以后,測試樣本的準確率不再上升,始終保持著92.83%的準確率,說明對于>0.6的投影數據,用改進的-NN方法并不能有效提高故障診斷正確率,反而會增加診斷時間,如圖3所示。
從圖3可以看出,隨著閾值的增大,越來越多的測試樣本投影后采用改進的-NN算法來歸類,花費的時間越來越長,=0.6時,僅需要0.21 s,而當=140時,即幾乎所有的測試樣本投影后都用改進的-NN算法歸類時,需要將近3 s。最重要的是,當≥0.6后,測試精度基本都是92.83%,不再增大。通過以上分析可知,當取0.6時,在保證分類精度達到最大的同時,保證測試時間最短。
將訓練集和測試集通過核Fisher投影后,將投影樣本分別用傳統的歐式距離(method 1)、傳統的-NN算法(method 2)、馬氏距離結合改進的-NN算法(method 3)進行分類,得到的訓練精度和測試精度見表3。

表3 不同方法的故障診斷結果
通過表3可以看出,用馬氏距離結合改進的-NN算法能顯著提高核Fisher投影后的分類效果,優于傳統的分類效果,無論是訓練樣本,還是測試樣本,都提高了故障診斷正確率。
前面都是采用核Fisher方法對樣本進行投影,下面采用改進類間距的核Fisher方法對樣本進行投影,得到取不同值時的投影圖像如圖4所示,并用馬氏距離結合改進的-NN算法進行故障分類,得到訓練樣本和分類樣本的診斷精度見表4。
從表4可以看出,隨著的增大,訓練精度和測試精度都幾乎不變。另外,改進類間距的核Fisher方法跟僅用核Fisher投影得到的診斷精度也相差不多。換言之,改進類間距幾乎不影響實驗1數據的投影結果,從圖4(a)?(b)也可以看出這一點。而上述結論的得出也符合理論分析,因為通過圖2可以知道,實驗1的3類故障數據本身經過核Fisher投影后,3類投影數據間距相差不多,不存在某些類信息被某類信息覆蓋的情況,因此改進類間距對實驗1數據幾乎沒有影響。

表4 不同q值的故障診斷結果
為了驗證本研究所提方法的有效性,分別采用極限學習機(ELM)、支持向量機(SVM)、相關向量機(RVM)、本研究提出的基于改進的核Fisher方法(MKF)分別對數據集進行離線建模及故障診斷。其中,ELM模型選擇Sigmoid函數為激活函數;SVM模型選擇RBF函數作為核函數;RVM模型也選用高斯核函數;本研究提出的方法MKF,其中核參數的平方取0.12,邊界閾值取0.6,權重函數參數取3。
不同模型的測試樣本的故障診斷精度及診斷時間見表5。

表5 4種模型的故障診斷結果
通過表5可以看出,ELM模型測試時間最短,但是其測試精度是幾種模型中最低的。本研究所提出的方法MKF在保證較短的測試時間的情況下,測試精度是最高的,體現了其優越性。
3.2 實驗2:數據混疊的故障診斷實驗
TE過程故障診斷,共有21種故障類型,這21個故障都是預先設定的,其中前7類故障類型均為階躍的,選取其中的第3、4、5、7類故障作為研究對象,見表6。

表6 故障樣本集描述
每一種故障類型,取兩組數據,即訓練數據和測試數據,每組數據各100個樣本,每個樣本由所有52個特征變量組成。訓練集和測試集各包含400個樣本。
對訓練集樣本采用核Fisher投影,得到的在第一、二特征軸上的投影圖如圖5所示,核參數取200。同樣的對訓練集樣本采用改進類間距的核Fisher投影,得到的投影圖如圖6所示,核參數取100,權重函數參數取3。
通過圖5可以看出,通過核Fisher投影,得到的故障3和5的投影信息互相掩蓋,難以凸顯二者的類間差異,不利于后續的分類。而在圖6中,通過采用改進類間距的核Fisher投影,可以將故障3、5區分開來,增大兩者間的類間距。
采用改進類間距的核Fisher投影(不同的值)、核Fisher投影,用馬氏距離結合改進-NN算法對樣本進行分類,得到的故障診斷結果見表7。

表7 不同方法的故障診斷結果
由表7可以看出,改進類間距的核Fisher投影分類方法明顯比核Fisher投影分類方法要好,前者的訓練樣本和測試樣本的診斷精度可以高達100%和99%,后者的診斷精度分別為95.25%和92.25%。
通過對比上述兩個實驗可以發現,本研究提出的方法因為引入了改進的類間離散度計算方法,對于故障樣本3、4、5、7,投影后類間距離呈現很大差異性的樣本,很好地改進了樣本在投影空間的分布,更有利于故障的分類,而對于故障樣本4、9、11,投影后類間距離差異性不大的樣本,沒有任何負作用。因而改進類間距的核Fisher方法對于類間距離存在很大差異性的實驗樣本具有良好的分類效果。
化工過程產生了大量的故障數據,這些故障數據呈現非線性特性,用傳統的核Fisher方法進行投影后,部分故障樣本的映射空間仍然會出現混疊現象以及類別邊界上數據歸類模糊問題,使分類效果不是很理想,本研究有針對性地提出了改進方法,改進后的核Fisher方法具有通用性,不僅適用于映射樣本空間不同類別數據出現混雜的情況,而且適用于映射樣本空間出現邊界樣本較多的情況。
改進的方法在TE平臺上得到了驗證。本研究提出的方法一方面因為引入了改進的類間離散度計算方法,使得樣本數據在投影空間的區分度更加明顯,更利于后續的故障分類。另一方面本方法改進了投影后故障樣本的具體分類方法,通過引入邊界閾值參數,有效分離出了邊界樣本點,通過改進-NN算法,大大提高了邊界樣本點的分類準確率,通過馬氏距離與改進-NN算法的配合,不僅有效兼顧了測試樣本的分類時間,而且保證較高的分類準確率。在本研究提及的方法中,核參數的選擇方法有待做進一步的深入研究。
[1] LENNOX B, HIDEN H G, MONTAGUE G A,. Application of multivariate statistical process control to batch operations[J]. Computers and Chemical Engineering, 2000, 24(2/3/4/5/6/7): 291-296.
[2] 文成林, 呂菲亞, 包哲靜, 等. 基于數據驅動的微小故障診斷方法綜述[J]. 自動化學報, 2016, 42(9): 1285-1299. WEN C L, Lü F Y, BAO Z J,. A review of data driven-based incipient fault diagnosis[J]. Acta Automatica Sinica, 2016, 42(9): 1285-1299.
[3] 李晗, 蕭德云. 基于數據驅動的故障診斷方法綜述[J]. 控制與決策, 2011, 26(1): 1-9, 16. LI H, XIAO D Y. Survey on data driven fault diagnosis methods[J]. Control and Decision, 2011, 26(1): 1-9, 16.
[4] 于春梅, 楊勝波, 陳馨, 等. 多元統計方法在故障診斷中的應用綜述[J]. 計算機工程與應用, 2007, 43(8): 205-208. YU C M, YANG S B, CHEN X,. Survey of multivariate statistical methods for fault diagnosis[J]. Computer Engineering and Applications, 2007, 43(8): 205-208.
[5] 張可, 周東華, 柴毅, 等. 復合故障診斷技術綜述[J].控制理論與應用, 2015, 32(9): 1143-1157. ZHANG K, ZHOU D H, CHAI Y,. Review of multiple fault diagnosis methods[J]. Control Theory & Applications, 2015, 32(9): 1143-1157.
[6] 蘇中鮮. 基于數據驅動的工業過程故障診斷方法綜述[J]. 軟件導刊, 2016, 15(3): 149-150. SU Z X. Review of fault diagnosis based on data-driven in industry process[J]. Software Guide, 2016, 15(3): 149-150.
[7] SCHOLKOPF B, MIKA S, BURGES C J C,. Input space versus feature space in kernel-based methods[J]. IEEE Transactions on Neural Networks, 1999, 10(5): 1000-1016.
[8] HU W P, HU H F. Heterogeneous face recognition based on modality-independent kernel Fisher discriminant analysis joint sparse auto-encoder[J]. Electronics Letters, 2016, 52(21): 1753-1755.
[9] FRANCK D. A one-class kernel fisher criterion for outlier detection[J]. IEEE Transactions on Neural Networks and Learning Systems, 2015, 26(5): 982-994.
[10] BO L F, WANG L, JIAO L C. Feature scaling for kernel fisher discriminant analysis using leave-one-out cross validation[J]. Neural Computation, 2006, 18(4): 961-978.
[11] VAN GESTEL T, SUYKENS J A K, LANCKRIET G,. Bayesian framework for least-squares support vector machine classifiers, Gaussian processes, and kernel Fisher discriminant analysis[J]. Neural Computation, 2002, 14(5): 1115-1147.
[12] VOLKER R. Kernel Fisher discriminants for outlier detection[J]. Neural Computation, 2006, 18(4): 942-960.
[13] JIANKE Z, STEVEN C H H, MICHAEL R L. Face annotation using transductive kernel Fisher discriminant[J]. IEEE Transactions on Multimedia, 2008, 10(1): 86-96.
[14] LIU Q S, LU H Q, MA S D. Improving kernel Fisher discriminant analysis for face recognition[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2004, 14(1): 42-49.
[15] SANG W L, ZEUNGNAM B. Representation of a Fisher criterion function in a kernel feature space[J]. IEEE Transactions on Neural Networks, 2010, 21(2): 333-339.
[16] WON K J, SAUNDERS C, PRüGEL-BENNETT A. Evolving Fisher kernels for biological sequence classification[J]. Evolutionary Computation, 2013, 21(1): 83-105.
[17] 祝志博, 宋執環. 故障分離——一種基于FDA-SVDD的模式分類算法[J]. 化工學報, 2009, 60(8): 2010-2016. ZHU Z B, SONG Z H. Fault isolation: an FDA-SVDD based pattern classification algorithm[J]. CIESC Journal, 2009, 60(8): 2010-2016.
[18] SHI H T, LIU J C, WU Y H,. Fault diagnosis of nonlinear and large-scale processes using novel modified kernel Fisher discriminant analysis approach[J]. International Journal of Systems Science, 2016, 47(5): 1095-1109.
[19] 李鋒, 王家序, 湯寶平, 等.有監督不相關局部Fisher判別分析故障診斷[J]. 振動工程學報, 2015, 8(4): 657-665. LI F, WANG J X, TANG B P,. Fault diagnosis method based on supervised uncorrelated local Fisher discriminant analysis[J]. Journal of Vibration Engineering, 2015, 8(4): 657-665.
[20] 王晶, 劉莉, 曹柳林, 等. 基于核Fisher包絡分析的間歇過程故障診斷[J]. 化工學報, 2014, 65(4): 1317-1326. WANG J, LIU L, CAO L L,Fault diagnosis based on kernel Fisher envelope surface for batch processes[J]. CIESC Journal, 2014, 65(4): 1317-1326.
[21] 趙旭, 閻威武, 邵惠鶴, 等. 基于核Fisher判別分析方法的非線性統計過程監控與故障診斷[J]. 化工學報, 2007, 58(4): 951-956. ZHAO X, YAN W W, SHAO H H,. Nonlinear statistical process monitoring and fault diagnosis based on kernel Fisher discriminant analysis[J]. Journal of Chemical Industry and Engineering(China), 2007, 58(4): 951-956.
[22] 蘇祖強, 湯寶平, 劉自然, 等. 基于正交半監督局部Fisher判別分析的故障診斷[J]. 機械工程學報, 2014, 50(18): 7-13. SU Z Q, TANG B P, LIU Z R,. Fault diagnosis method based on orthogonal semi-supervised local Fisher discriminant analysis[J]. Journal of Mechanical Engineering, 2014, 50(18): 7-13.
[23] MIKA S, RATSCH G, WESTON J,. Fisher discriminant analysis with kernels[C]// Proceeding of the IEEE International Workshop on Neural Networks for Signal Processing, 1999: 41-48.
[24] 彭陳松. 基于核函數Fisher判別的數據分類算法研究[D]. 杭州: 浙江理工大學, 2011. PENG C S. Data classification algorithm based on kernel Fisher discriminant[D]. Hangzhou: Zhejiang Sci-Tech University, 2011.
[25] 王煒, 郭小明, 王淑艷, 等. 關于核函數選取的方法[J]. 遼寧師范大學學報(自然科學版), 2008, 31(1): 1-4. WANG W, GUO X M, WANG S Y,On the method of kernel-function selection in support vector machine[J]. Journal of Liaoning Normal University (Natural Science Edition), 2008, 31(1): 1-4.
[26] 武優西, 郭磊, 柴欣, 等. 基于優化算法的核函數參數選擇的研究[J]. 計算機應用與軟件, 2010, 27(1): 137-140. WU Y X, GUO L, CHAI X,. On parameter selection of kernel function based on optimisation algorithm[J]. Computer Applications and Software, 2010, 27(1): 137-140.
[27] 張翔, 肖小玲, 徐光祐, 等. 一種確定高斯核模型參數的新方法[J]. 計算機工程, 2007, 33(12): 52-53, 56. ZHANG X, XIAO X L, XU G Y,A new method for determining the parameter of Gaussian kernel[J]. Computer Engineering, 2007, 33(12): 52-53, 56.
[28] DAI G, YEUNG D Y, QIAN Y T. Face recognition using a kernel fractional-step discriminant analysis algorithm[J]. Pattern Recognition, 2007, 40(1): 229-243.
[29] DOWNS J J, VOGEL E F. A plant-wide industrial process control problem[J]. Computers and Chemical Engineering, 1993, 17(3): 245-255.
[30] 呂寧, 于曉洋. 基于二階互信息特征選取的TE過程故障診斷[J]. 化工學報, 2009, 60(9): 2252-2258. Lü N, YU X Y. Fault diagnosis in TE process based on feature selectionsecond order mutual information[J]. CIESC Journal, 2009, 60(9): 2252-2258.
A fault diagnosis method based on improved kernel Fisher
MA Liling, XU Fafu, WANG Junzheng
(College of Automation, Beijing Institute of Technology, Beijing 100081, China)
A fault diagnosis method of kernel Fisher projection was proposed to solve issues of nonlinear data, complex classes, and difficult fault-diagnosing in chemical processes. The proposed method provided a uniform solution for partial sample mix-up induced by a large difference in category distances and nebulous classification of different category’s boundary data after projection of the original data sample. First, an improved category distance was used to change sample distribution in the projection space so that the sample had a good projection. Then, boundary data was screened out by a defined threshold parameter and classified by improved-Nearest Neighbor (-NN) algorithm, which none-boundary data was classified by Mahalanobis distance. Simulation in a TE process showed that training accuracy was increased by 2.25% and testing accuracy was increased by 2.41% in the first experiment, whereas training accuracy was increased by 4.75% and testing accuracy was increased by 6.75% in the second experiment. Therefore, the method improved both fault diagnosis time and accuracy.
kernel Fisher; fault diagnosis; improved-NN algorithm; experimental verification; optimizing
10.11949/j.issn.0438-1157.20161000
TP 277
A
0438—1157(2017)03—1041—08
國家自然科學基金項目(61503027)。
2016-07-14收到初稿,2016-11-23收到修改稿。
聯系人:徐發富。第一作者:馬立玲(1974—),女,博士,副教授。
2016-07-14.
XU Fafu, bitrenqq@sina.com
supported by the National Natural Science Foundation of China (61503027).