劉昌,楊世文,吳澈(中北大學機械與動力工程學院,山西 太原 030051)
基于KPCA和Cam加權距離的帶鋼熱鍍鋅生產過程監測
劉昌,楊世文,吳澈
(中北大學機械與動力工程學院,山西 太原 030051)
摘 要:針對復雜生產過程存在著參數眾多,而且工藝參數間、產品質量參數間各自呈現復雜的多變量非線性耦合關系,提出基于KPCA的非線性生產過程監控與診斷方法。結合數據重構和基于Cam加權距離的領域選取策略這兩種方法,計算出故障指數的變化情況,具體分析引起過程異常的工藝參數。利用冷軋帶鋼熱鍍鋅生產線的生產數據進行實驗,實驗表明:KPCA具有處理非線性的能力,且能準確地實現對故障的識別。
關鍵詞:非線性;核主成分分析;SPE;故障診斷
10.16638/j.cnki.1671-7988.2015.10.032
CLC NO.: TP183 Document Code: A Article ID: 1671-7988(2015)10-86-04
然而KPCA在映射后的特征空間中進行PCA,就沒法找出原始觀測變量與特征空間中的監控統計量之間的對應關系,即難以找出從特征空間到原始空間的逆映射函數,這導致基于KPCA的故障診斷方法很難辨識過程的異常是由什么變量引起的。因此,提出了一種將核主成分分析的數據重構方法和基于Cam加權距離的領域選取算法相結合引入到故障診斷中,能更準確地辨識故障原因,方便操作工及時控制現場,提高經濟效率。
主成分分析的實質是對將工藝過程的歷史數據與線性主成分的距離總和最小化的過程,KPCA與其不同的是:KPCA直接采用核函數并把原始變量映射到非線性主成分上,使得樣本點與非線性主成分距離之和達到最小。KPCA算法[4-5]如下:
Step2 計算步驟:
其中:λ為的特征值,V為特征向量。
其中,特征值kλ較小的主元tk一般被認為由噪聲引起的,因此,主成分的選取一般依據主成分累計解釋率表示前q個kλ的和與所有kλ總和比值超過E值,認為選取q個主成分就能夠反映主體信息(E為既定常數,代表著噪聲的影響程度)。為了消除噪聲、降低樣本數據維數,通常維數q的選取普遍都要低于非零特征值數目。
PCA的故障識別一般是通過計算各個元素對主成分的貢獻率,貢獻多的就為故障值。但是KPCA算法本身存在限制,導致基于PCA的故障識別方法,不能直接用于基于KPCA的故障識別,因此可以考慮在高維空間進行線性主成分分析,通過特征空間中的q個主成分tk重構從而得到新的重構值:
因為計算核變換的逆是非常復雜的,所以通常采用最小化下列式子來求出向量Z:
2017年是互助縣國家馬鈴薯種植綜合標準化示范區提升項目實施的第一年,我縣以開展“兩學一做”活動為動力,緊緊圍繞國家標準委確定的2017年是標準化改革深化之年、標準化戰略推進之年的有利時機,結合農業產業精準扶貧工作,嚴格按照項目要求,認真組織實施,建立馬鈴薯原原種標準化繁育技術示范田2.08 hm2,馬鈴薯生產標準化示范區133.3 hm2,輻射示范1200 hm2。通過示范區建設形成了較為完善的標準體系、檢測體系、監管體系和保障服務體系,引用和推廣2個國家標準、5個行業標準、11個地方標準,制定企業標準1 個,提升了全縣馬鈴薯種植的質量安全水平,達到了項目實施的預期目標和要求。
其中,z1= x為迭代初值。通過迭代,矢量Z成為原始輸入樣本空間中x的一個很好的近似。
3.1 基于KPCA的故障檢測策略
第i時刻的核主成分模型通常使用平方預測差[7]監控生產過程,即(squard prediction error,SPE):
其中,x為真實數據,z為重構數據,m為變量個數。SPE統計量度量了一個數據點偏離KPCA模型的程度,當其過大時,則說明過程中出現了不正常情況。其控制限為:
其中δa2代表置信水平為a時的控制限λj代表X的協方差矩陣∑的特征值,ca是標準正態分布在上述置信水平為a下的閥值。當SPE位于控制限內時,認為過程是正常的;反之,則異常。
3.2 基于KPCA和Cam加權距離的故障識別策略
定義故障指數:
故此,提出基于Cam加權距離的領域選取方法,選取圖1中橢圓形內的k個近鄰。
Cam加權距離:
上式包含代表數據的規模大小和在特定偏向的形變程度的數值的a和b(a> b0≥);代表數據變形方向的為單位向量τ。a, b , τ的計算參考文獻[8]可得。使用此距離可以更為有效地解決數據分布不均勻的問題。因此鄰域選取策略為:利用Cam加權距離求得正常生產過程中的樣本的k個近鄰,再將當前樣本用正常樣本中與其近鄰的k個樣本的加權線性表示:其中,jω為當前樣本xi與其近鄰樣本xj的權值然后在利用替換后的數據ix帶入建立的KPCA模型中,計算其估計值iz。
核主成分分析過程監控與診斷的具體步驟:
Step1原始數據歸一化處理;
Step2利用歷史正常生產過程數據建立KPCA模型,根據交叉驗證法選取核參數c。根據主成分的總解釋率是否超過95%,最終確定主成分的數量;
Step3使用公式(7)和公式(8)分別算出SPE值以及控制限,并用于生產監控;
Step4利用式子(7)計算待監測生產數據的統計量,當其超出控制限時則認為生產過程異常,否則認為生產過程處于統計穩態;
Step5若過程異常則利用式子(9)計算,分析各個工藝參數對統計量的作用,從而判斷引起異常的原因。最小的故障指數對應的工藝變量認為是引起過程異常的主要原因。
將某鋼鐵廠的實時冷軋帶鋼熱鍍鋅[9-10]生產線的產生的數據為樣本源,將每一卷帶鋼作為取樣點,以氣刀壓力、氣刀到帶鋼的距離、帶鋼厚度、帶鋼速度等工藝參數和帶鋼上表面的鋅層重量為樣本特征,收集150組樣本。現取(鋅重<80)50個樣本作為訓練樣本;取正常數據(鋅重<80)50個,擾動后數據(90<鋅重<125.5)50個,共100個數據作為測試數據。利用訓練數據構建KPCA模型,而后利用測試數據檢驗模型的有效性。
在KPCA模型中選取高斯函數作為核函數,根據交叉驗證法選取核參數c=2,根據主成分累計解釋率大于95%的準則,選取了2個主成分。PCA分析過程中,同樣根據主成分累計解釋率大于95%原則,選取2個主成分。由(a)與(b)的SPE統計量控制圖,可以看出KPCA模型SPE統計量控制圖可以明顯看出后50個樣本的SPE統計量絕大多數超出了控制限,認為此時過程出現了故障,而PCA模型的異常捕捉能力明顯不如KPCA模型。
在過程診斷中,通過實驗選取近鄰k=5,由圖3的故障指數圖可以明顯看出,后100個樣本點的第一個變量(氣刀壓力)從第50號樣本開始對SPE的故障指數明顯小于另外三個變量(氣刀到帶鋼的距離、帶鋼厚度、帶鋼速度),可以認定第一變量的變化偏離了正常分布狀態,氣刀壓力是引起生產過程異常的主要原因。
利用冷軋帶鋼熱鍍鋅生產過程中工藝參數和產品質量的統計數據,建立生產過程的質量模型,結合數據重構算法和Cam鄰域選取算法運用到KPCA模型中,并運用此模型對冷軋帶鋼熱鍍鋅生產過程的監控與診斷,不僅實現了對生產過程的監控,同時能較好地尋找引起異常的原因。
[1] Jung D Y,Lee S M, et al. Fault detection method with PCA and LDA and its application to induction motor[J].J.Cent.South.Univ.Technol. 2010(17):1238-1242.
[2] Wang X,Kruger U,Irwin G W,et al.Nonlinear PCA with the local approach for diesel engine fault detection and diagnosis, IEEE Transactions on Control Systems Technology,2008,16(01):122-129.
[3] Lee J M,Yoo C K,Choi S W, et al. Nonlinear process monitoring using kernel principal component analysis[J].Chemical Engineering Science,2004,59 (01):223-234.
[4] Shawe-Taylor.J,.et al. Kernel Methods for Pattern Analysis[M]. BeiJing:China Machine Press.2005.
[5] 王姝,馮淑敏,常玉清等.改進的基于數據重構的KPCA故障識別方法[J].東北大學學報,2012,33(04):500-503.
[6] Scholkopf B, et al. Nolinear component analysisasa kernel eigenvalue Problem[J].Neural Computation, 1998,10(05):1299- 1319.
[7] 周東華,李鋼,李元等.數據驅動的工業過程故障診斷技術[M].北京:科學出版社,2011.
[8] 韋立慶,陳秀宏.基于Cam加權距離的增量拉普拉斯方法[J].計算機工程,2011,37(22):171-173.
[9] 李培興,張紅梅,趙紅陽等.連續熱鍍鋅過程帶鋼邊部氣流特征的研究[J].材料科學與工藝,2014,22(06):90-95.
[10] 李培興.帶鋼連續熱鍍鋅鍍層均與性改進研究[D].遼寧:遼寧科技大學碩士論文集,2014.
Based on KPCA and Cam weighted distance of strip hot dip galvanizing production process monitoring
Liu Chang, Yang Shiwen, Wu Che
( School of Mechanical and Power Engineering, North University of China, Shanxi Taiyuan 030051 )
Abstract:According to huge mass of parameters in complicated production process, which shows a complex multivariable nonlinear coupling relation between each processing parameters and product quality parameters, this paper proposed a method based on KPCA nonlinear monitoring and diagnosis. Combined with the data reconstruction and field selection, obtained the function of various process parameters for SPE statistics, specifically analysis process parameters that causes abnormal process. Using data of hot-dip galvanizing prove that this method not only retains the advantages of PCA, also has ability of dealing non-linear parameters, and even could identify fault.
Keywords:nonlinear; KPCA; SPE; fault diagnosis
作者簡介:劉昌,碩士研究生,就讀于中北大學機械與動力工程學院,從事設備故障診斷和檢測的研究。
中圖分類號:TP183
文獻標識碼:A
文章編號:1671-7988(2015)10-86-04