余永華 ,賈海超,胡 嘉,胡 磊 ,楊建國
(1.武漢理工大學 船海與能源動力工程學院,湖北 武漢 430063;2.武漢理工大學 船舶動力工程技術交通運輸行業重點實驗室,湖北 武漢 430063)
船用柴油機噴油器工作環境惡劣,所用重油雜質較多,噴嘴殘余燃油在高溫、高壓下易形成積碳,發生噴嘴堵塞故障,威脅柴油機安全運行[1].聲發射頻率范圍寬、信噪比高,所含信息豐富,可以發現早期微弱故障,具有適應范圍廣、準確率高的優點,因而得到了國內外學者的廣泛關注,已在柴油機氣閥漏氣、軸瓦磨損及缸套-活塞環磨損的監測診斷方面得到了廣泛應用[2-4].
現有文獻的故障診斷判據往往是基于已有工況的特征參數獲得的,在相同工況下具有較好的適用性,從傳統機器學習的觀點來看,這正是因為訓練數據與測試數據服從獨立同分布規律,而發動機實際運行工況多變,在所有工況下采集充足的數據,既不現實也不可行[5-6],因此,難以通過傳統的機器學習算法獲取發動機的故障診斷模型.如何充分利用已有工況的數據,在變工況少量數據條件下,實現柴油機全工況下的高準確度故障診斷和診斷方法的跨機型應用,是柴油機故障診斷工程應用的難題.
遷移學習是一種機器學習算法,能夠將某個領域上學習到的知識遷移到不同但相似的領域中,實現已有知識的利用,在模式識別領域廣泛應用.崔石玉等[7]將基于參數的遷移方法應用到海水泵的故障診斷,賈鋒等[8]和Li等[9]將遷移學習應用于軸承的故障診斷.Dai等[10]提出了一種基于實例的遷移學習算法TrAdaBoost,該方法可以實現利用少量標簽數據和大量異分布輔助標簽數據建立較高準確率的故障診斷模型,該算法原理簡單、易于實現[11],在目標數據集和輔助數據集具有相似性的時候可以取得很好效果.內燃機結構復雜,不同工況和不同機型的缸蓋聲發射信號均存在差異,但由于其激勵源相似又表現出一定的相似性,特別符合TrAdaBoost遷移學習算法的前提,目前在內燃機故障診斷領域的研究較少.
因此,筆者針對噴油器噴孔堵塞故障,基于缸蓋聲發射信號,擬借鑒TrAdaBoost遷移學習的思想,提出一種提高柴油機故障診斷模型應用于跨工況和跨機型時診斷精度的方法.
以TBD234V6型高速四沖程柴油機為研究對象,其主要技術參數如表1所示.該柴油機標定功率為186kW,標定轉速為1500r/min,供油提前角為20°CA BTDC,單噴油器4噴孔,噴孔直徑為0.45mm,以A1缸為故障模擬缸,聲發射傳感器布置在A1缸蓋表面靠近排氣閥處,如圖1所示.試驗測量了上止點、缸壓和缸蓋聲發射信號.選用軟島時代RS54A型聲發射傳感器,工作頻帶為100~900kHz,試驗中聲發射采樣率為800kS/s,數據采集系統示意如圖2所示.

圖1 缸蓋表面傳感器布置Fig.1 Sensors location on the cylinder head

圖2 數據采集系統示意Fig.2 Schematic diagram of data acquisition system

表1 TBD234V6型柴油機技術參數Tab.1 Technical parameters of TBD234V6 type diesel engine
表2為故障模擬方案,試驗獲取了如表3所示兩個工況不同故障程度的數據.在噴油器校驗臺上,利用Photron-675K-C1高速相機記錄試驗用噴油器的噴油效果,如圖3所示.

圖3 噴油器噴孔堵塞效果Fig.3 Nozzle blockage state

表2 故障模擬方案Tab.2 Fault simulation test programs

表3 故障模擬試驗工況Tab.3 Working conditions of fault simulation
TBD234V6型柴油機A、B列氣缸夾角為60°,發火順序為A1→B2→A3→B1→A2→B3,以60°~180°CA交替發火.圖4為1500r/min、50%負荷正常狀態下采集到的A1缸缸蓋聲發射信號時域波形,圖中橫坐標的0°CA對應A1缸的排氣上止點,縱坐標為聲發射信號幅值,圖中標注了對應的聲發射信號激勵源.柴油機的配氣相位見圖5.可以發現,整周期的聲發射信號不僅受試驗缸自身激勵,還受到了同側氣缸激勵的影響,但燃燒段的聲發射信號受其他缸影響較小,而噴油器噴孔堵塞故障主要影響燃燒段信號[12],因此,截取340°~400°CA內的信號進行分析.

圖4 柴油機聲發射信號時域波形Fig.4 AE waveform of the diesel engine

圖5 柴油機配氣相位Fig.5 Valve timing diagram of the diesel engine
以1500r/min、50%負荷正常狀態和單缸斷油時測取的聲發射信號為例,結合缸內壓力信號,分析聲發射信號特征.圖6a為A1缸斷油后的缸內壓力與聲發射信號,此時缸內只有壓縮過程沒有燃燒過程,噴油器也沒有任何動作,因此,可推斷燃燒段聲發射信號主要受本缸內燃燒以及噴油器動作激勵.

圖6 正常狀態與單缸斷油燃燒段聲發射與缸內壓力信號Fig.6AE and cylinder pressure signals of combustion section under normal conditions and one cylinder fuel shut-off
圖6b為正常狀態缸蓋燃燒段的聲發射信號,其中包含3段明顯的衰減振蕩,有3個明顯的突變時刻,a點位于發火上止點前20°CA,若忽略供油與噴油時延,對應于噴油始點;b點聲發射信號幅值急劇增加,對應于第1個衰減振蕩始點;c點對應于燃燒始點;d點對應于第2個衰減振蕩的始點;e點對應于缸內爆壓點;f點對應于第3個衰減振蕩始點;g點燃燒基本結束.參考文獻[13—14]關于缸蓋振動信號的結論,第1個衰減振蕩大部分位于燃燒始點之前,可判斷是由噴油器針閥落座引起的,第2個衰減振蕩位于燃燒的速燃期,可判斷是由缸內燃燒引起的,第3個衰減振蕩幅值較小,并且位于燃燒的后燃期,判斷是由后燃引起的.
綜上可知,確定了燃燒段聲發射信號的激勵源,這為后續的特征參數提取、故障診斷提供了機理性支撐.圖7為1500r/min、50%負荷正常狀態與堵3孔下的燃燒段聲發射信號.當故障發生時,第1個衰減振蕩提前,第2個衰減振蕩對應燃燒的速燃期,出現了明顯的滯后,主要原因為堵孔后,噴入缸內的燃油變少,可燃混合氣變少,燃燒緩慢,圖8為正常狀態與堵3孔下的缸內壓力信號,通過計算壓升率得到燃燒始點分別為356°,CA與357°,CA,堵孔后燃燒始點出現了1°,CA的延后,造成了與之對應的聲發射信號出現延遲.第3個衰減振蕩幅值增大,主要原因是堵孔后造成燃燒不良和后燃現象,甚至可能出現二次噴射.

圖7 正常狀態與噴油器堵3孔聲發射信號Fig.7 AE signal under normal working condition and injector clogged three holes

圖8 正常狀態與堵3孔缸內壓力信號Fig.8 Cylinder pressure signals under normal working condition and injector clogged three holes
為了進一步說明所提結論的可信性與通用性,利用文獻[15]在Z6170型柴油機上獲取的噴油器噴孔堵塞故障模擬試驗數據進行驗證.圖9為Z6170型柴油機在1000r/min、75%負荷正常狀態下的燃燒段聲發射和缸內壓力信號,圖9中標注字母含義與圖6b相同.圖10為正常狀態與堵2孔時燃燒段聲發射信號,可以看出,信號特征和故障對信號的影響規律與V型機相似.

圖9 Z6170正常狀態燃燒段聲發射與缸內壓力信號Fig.9AE and cylinder pressure signals of combustion section under normal working condition of Z6170 diesel engine

圖10 Z6170正常狀態與堵2孔聲發射信號Fig.10AE signal of normal working condition and injector clogged two holes of Z6170 diesel engine
聲發射各衰減振蕩蘊含著豐富的狀態信息.根據燃燒段聲發射信號的特點,以50%負荷的信號為基準,將燃燒段信號劃分為不同特征窗口范圍,窗口0對應于噴油始點a至聲發射信號幅值第1個突變點b;窗口1對應于信號的第1個幅值突變點b至第2個幅值突變點d;窗口2對應于信號第2個幅值突變點d至第3個幅值突變點f,窗口3對應于第3個幅值突變點f至燃燒基本結束,此范圍將作為基準用在TBD234V6柴油機信號分析和特征參數提取中.
特征窗口劃分范圍如表4所示.從聲發射信號中提取特征參數16個見表5.

表4 特征窗口劃分Tab.4 Scope of the characteristic windows

表5 提取的特征參數Tab.5 Extracted feature parameters
常見的故障診斷流程包括數據采集、特征參數提取和故障識別模型的建立.KNN算法是使用K個最近鄰域點對未知樣本進行判定,即計算測試樣本點與訓練集樣本之間的距離,找出與測試樣本距離最小的K個點,根據這K個點屬于什么類別來判斷該樣本點屬于哪個類別.分類中距離度量的方法有歐氏距離或曼哈頓距離,該算法實現較為簡單,已在故障診斷領域被廣泛使用[16].
以KNN算法為例建立TBD234V6柴油機故障診斷模型,按上節方法提取特征參數.按照不同的負荷劃分訓練集和測試集,選取TBD234V6型柴油機工況一(50%負荷,1500r/min)噴油器3種故障程度的特征數據作為訓練集,以工況二(75%負荷,1500r/min)噴油器3種故障程度的特征數據為測試集,每個工況320個樣本,KNN算法鄰域點K=5,歐式距離作為度量方式.得出模型總體識別率為55%,識別效果用混淆矩陣表示,如圖11所示.

圖11 KNN識別效果Fig.11 Recognition effect of KNN
由圖11可知,模型對各個類別的識別準確率較低,主要原因是基于傳統機器學習的故障診斷方法要求訓練集與測試集獨立同分布,而此次用于模型訓練和測試的數據來自不同的負荷,雖然包含的故障程度相同,但由于聲發射響應信號的非線性特征,數據分布有一定的差異,導致模型對測試集的識別效果并不理想,泛化能力較差.考慮柴油機的工作特性,難于采集所有工況的足夠樣本,遷移學習能夠充分利用已有的數據,實現不同領域間知識的遷移,可有效解決故障樣本不足問題.
TrAdaBoost是一種基于實例的遷移學習算法,該算法針對訓練集樣本數據較少不足以單獨訓練模型,通過引入相似輔助訓練數據構建故障診斷模型.首先,將相似輔助訓練集數據和少量目標訓練集數據組成聯合訓練集,然后通過迭代加權改變各個類別的權重,最終提升模型在目標測試集上的分類效果.算法步驟如下[17].
(1) 輔助訓練集Ta(樣本數量為n)和目標訓練集Tb(樣本數量為m)組成聯合訓練集T、測試集S及基分類器learner,N為迭代次數.
(3) wt為迭代第t次后的樣本權值向量,t=1,2,…,N,對權值進行歸一化Pt,即
調用learner,結合訓練集T、Pt,根據合并后的訓練數據T以及T上的權重分布Pt和測試集S,得到一個在S的分類器ht.計算目標訓練集Tb在分類器ht上的誤診率為
(4) 設置權值系數βt=εt/(1-εt),則在迭代中保證:
(5) 更新訓練權重,則
(6) 最終分類器為
由式(5)可知分類器輸出值僅包含0和1,僅適合單分類或二分類,因而選擇決策樹作為TrAdaBoost的基分類器learner.當同分布訓練數據太少而N過大時,TrAdaBoost容易出現過擬合,也會影響模型訓練時間.
為驗證方法的有效性,以TBD234V6型柴油機工況一(50%負荷,1500r/min)噴油器3種故障程度的特征數據為源域輔助數據,以工況二(75%負荷,1500r/min)噴油器3種故障程度的特征數據為目標域數據,數據集劃分如表6、表7所示.其中源域輔助訓練樣本總數量為320個(共有4種類別,每種數量為80個).訓練集目標域樣本數量分別設置為16、32(即每種類別數量Z分別為4、8).測試集中目標域未標記樣本共320個.迭代次數N設置為10,鄰域點K=5.將基于TrAdaBoost算法的故障診斷模型與KNN算法進行對比,模型準確率如表8所示.Z=8時基于不同算法的模型識別效果用混淆矩陣表示,如圖12所示.

圖12 Z=8時不同算法模型的識別效果Fig.12Recognition effect of different algorithm models when Z=8

表6 數據集Tab.6 Data set

表7 訓練集和測試集樣本Tab.7 Samples of training set and test set

表8 同機型跨工況遷移診斷準確率對比Tab.8 Comparison of transfer diagnostic accuracy across operating conditions for the same type of diesel engine
表8中,一→二表示以工況一特征數據作為源域輔助訓練數據,工況二特征數據作為目標域數據.由圖12可知,TrAdaBoost算法對故障的識別效果優于KNN算法;由表8可知,當目標域訓練樣本不足,即訓練集中包含5%(樣本數量為16)的目標域數據量下,與KNN算法相比,TrAdaBoost算法的準確率有13%的提高,主要原因是TrAdaBoost利用輔助訓練數據蘊含的狀態信息,提高了對目標域樣本的總體識別率;經過綜合對比,TrAdaBoost算法的識別效果優于KNN算法,實現了跨工況的特征遷移.
為進一步驗證在特征分布差異較大、不同機型數據集上的有效性,利用文獻[15]中Z6170型柴油機噴孔堵塞故障模擬試驗數據進行驗證.采取與TBD234V6相同的方法劃分窗口范圍、提取特征參數,劃分數據集I(1000r/min,50%負荷)、II(1000r/min,75%負荷),迭代次數N設置為10,鄰域點K=7,分別定義遷移工況一→I、二→Ⅱ和I→Ⅱ,模型遷移結果如表9所示.

表9 不同機型/工況下遷移診斷準確率對比Tab.9 Comparison of transfer diagnostic accuracy for different engine types and operating conditions
數據集本身的特征分布相似度會對診斷結果產生一定的影響,對來源于同一機型的數據集,特征分布會比較相似(I→Ⅱ、一→二),最終的識別準確率也越高;數據集一和I、二和Ⅱ數據集來自不同的機型,特征數據分布有一定的差異,模型準確率稍低,但總體識別效果優于傳統的KNN算法.綜合來看,在不同負荷和不同機型下模型都有較好的識別效果與泛化能力.
針對柴油機故障診斷判據在不同負荷和機型間適用性不足,模型準確率低,提出了基于聲發射信號的特征參數,結合TrAdaBoost遷移學習故障診斷方法,對噴油器噴孔堵塞故障進行診斷方法研究,在同機型不同工況和不同機型上進行了驗證,得到以下結論:
(1) 燃燒段聲發射信號主要受本缸噴油器動作和缸內燃燒激勵,包含3個衰減振蕩,其振蕩特征點與噴油器故障密切相關.
(2) TrAdaBoost算法可以充分利用已有工況數據蘊含的信息,即使當訓練集中只有5%的目標域數據量,與KNN相比,仍有較好的準確率,可提高診斷算法對同機型不同工況的魯棒性;經過不同機型驗證,基于聲發射信號結合TrAdaBoost算法的故障診斷方法,同樣適用于診斷算法的跨機型應用.
本算法只在兩個機型少量工況點進行了驗證,數據量有限,即現有的輔助訓練集不能包含所有故障狀態信息,難于直接應用于工程實際.如果對某型柴油機進行全壽命周期的實機測試,利用這些樣本輔助其他機型的故障診斷,特別是隨著通信技術和船聯網的發展,通過遷移學習使得艦(船)柴油機的運行數據相互利用,進一步提高故障診斷精度,尚有一定的借鑒意義.