基于PCA-BP神經(jīng)網(wǎng)絡的設備潤滑狀態(tài)評價應用

2020-01-01 02:04:08崔策賀石中李秋秋康鑫碩

潤滑油 2019年6期

崔策,賀石中,李秋秋,康鑫碩

(廣州機械科學研究院有限公司設備潤滑與檢測研究所, 廣東廣州 510700)

0 引言

油液監(jiān)測技術是通過潤滑劑的性能變化、污染狀況及油中攜帶的磨損顆粒等信息，并結合工程師對現(xiàn)場工況的了解，綜合評價設備運行狀態(tài)的監(jiān)測技術[1]。該技術不僅對潛在故障、避免災難性損壞導致的設備停機停產(chǎn)狀況的預報具有及時性，同時減少了設備不必要的維修時間，增加隱性產(chǎn)值和效益[2]。神經(jīng)網(wǎng)絡在數(shù)據(jù)分類及回歸等方面已有廣泛應用，其特點主要包括；①充分逼近并求解復雜的非線性問題；②自適應特征提取及學習能力；③具有一定容錯性和魯棒性；④適用于處理多維數(shù)學問題。

本文首先通過主成分分析進行數(shù)據(jù)降維，后將降維后的數(shù)據(jù)集訓練BP神經(jīng)網(wǎng)絡，在關聯(lián)專家知識后，結合模糊綜合評價理論，對數(shù)據(jù)集進行分類，建立PCA-BP神經(jīng)網(wǎng)絡分類模型。結果表明，基于PCA-BP神經(jīng)網(wǎng)絡的油液監(jiān)測評價模型的準確率較高，相比人工識別分類，消除了數(shù)據(jù)模糊性，且效率明顯提升。

1 主成分分析

素等共12個項目，其中黏度是表征潤滑劑的油膜強度的主要指標；水分、元素Si及Al通常來源于外部污染；酸值主要表征潤滑油的氧化程度及添加劑消耗程度；添加劑元素Ca、Zn及P是油中極壓抗磨添加劑的主要成分，如烷基水楊酸鈣、二烷基二硫代磷酸鋅(ZDDP)等；金屬元素Fe、Cu、Cr、Sn主要來源于系統(tǒng)中的摩擦副材料，如齒輪、軸承材料及液壓系統(tǒng)中的鍍層等。

表1 測試樣本集

潤滑狀態(tài)評價集合是檢測數(shù)據(jù)集及專家知識的綜合內(nèi)容，其內(nèi)容主要依據(jù)診斷人員的專家經(jīng)驗，監(jiān)測數(shù)據(jù)的狀態(tài)，部分項目的評價指標參考石化行業(yè)標準SH/T 0467，如40 ℃運動黏度值的變化率超出10%時，說明油質(zhì)明顯氧化變質(zhì)，需要換油；水分超過0.1%則可能引起油品乳化等，表2列舉了評價結論集U={u1、u2、u3、u4}及其特征矢量。

表2 評價集及特征矢量

圖1是協(xié)方差矩陣的特征值累計曲線，為了消除指標之間的量綱影響，本文先對原數(shù)據(jù)進行歸一化處理，不僅能加快梯度下降求最優(yōu)解的速度，同時也降低了奇異樣本對誤差梯度無法收斂的影響[4]。由圖1可知，前8個成分的累計特征值貢獻率達到90%，因此本文選取8個特征作為原數(shù)據(jù)的主成分，圖2列舉了部分主成分特征向量。

圖1 主成分特征值累計貢獻率

圖2 累計貢獻率90%的主成分矩陣

2 BP神經(jīng)網(wǎng)絡識別分類結果

BP神經(jīng)網(wǎng)絡是一種多層前饋神經(jīng)網(wǎng)絡，其主要過程包括數(shù)據(jù)前向傳播及誤差反向傳播，是目前應用最廣泛的神經(jīng)網(wǎng)絡之一[5-6]。

圖3 神經(jīng)元模型

圖4 最佳迭代次數(shù)及均方誤差

由圖4可知，在誤差梯度迭代至316次時，訓練誤差已然達到目標誤差，此時為防止過擬合，網(wǎng)絡停止訓練，模型已達到最優(yōu)。ROC曲線是一種常見的分類器模型評估方法，其原理是將單一樣本類別分類看成二分類問題，即對于類別yj，xm本屬于該類別即為正樣本，若不屬于即為負樣本。圖5表示ROC曲線圖中4個頂點分別表示的含義。

圖5 ROC曲線中坐標頂點的含義

對于優(yōu)質(zhì)模型，單一類別的ROC曲線應盡量靠近(0,1)點，ROC曲線常用于解決由于樣本不均衡導致訓練模型對單一類別敏感的評價問題。

對比圖4結果發(fā)現(xiàn)，采用PCA-BP的各類別ROC曲線ROC值較BP平均ROC值更高，說明模型對分類樣本集合的識別率更高，表明模型更優(yōu)，見圖6。

圖6 BP及PCA-BP模型ROC曲線

3 結論

本文采用BP神經(jīng)網(wǎng)絡建立油液監(jiān)測評價模型，并首先對樣本集合進行PCA降維，選取成分貢獻率90%的8個維度訓練神經(jīng)網(wǎng)絡，并通過ROC曲線分別評價了4分類的模型識別率，通過對比發(fā)現(xiàn)，相比未降維樣本訓練的BP神經(jīng)網(wǎng)絡，采用PCA-BP神經(jīng)網(wǎng)絡的識別結果較高，且能夠在一定程度消除人為評估的模糊性及主觀性。由于樣本數(shù)據(jù)較少，且維數(shù)較多，因此采用主成分分析對數(shù)據(jù)集進行降維，減少了訓練集中存在相關冗余的屬性，提升了神經(jīng)網(wǎng)絡的計算效率。考慮數(shù)據(jù)集合的評價內(nèi)容可擴展性，后期也可通過擴充樣本數(shù)量或串聯(lián)其他機器學習算法進一步增加模型的魯棒性。