姜志宏, 劉民民, 胡 博, 盧文海
(1.江西理工大學 機電工程學院,江西 贛州 341000; 2.江西省礦冶機電工程研究中心,江西 贛州341000)
信號的特征提取作為機械設備負荷識別及工作狀態參數預測的關鍵環節,旨在借助各種信號處理方法構造出能夠表征設備狀態信息的特征量[1]。但是,不同特征量組成高維特征集為后續模式識別與智能預測環節提供充足數據來源的同時,增加了計算負擔,降低了識別效率。因此,在保留原始信號中大部分本征信息的前提下,提取出高維特征集的低維表達形式的維數約簡方法應運而生[2]。早期的特征約簡方法主要有主成分分析(PCA)、多維尺度分析[3]以及線性判別分析[4]等。近年來興起的流形學習方法[5]被廣泛運用于人臉識別、圖像處理等領域的非線性特征約簡中,機械設備工作狀態預測過程也逐漸選用此類方法進行特征降維。
球磨機多傳感器特征層“特征—特征”信息融合,其實質上屬于一類特殊的特征維數約簡問題,因此,采用的信息融合算法以特征降維算法為主,并輔以其他類型的特征維數參量二次整合與優化,共同完成多傳感器信息的特征層融合[6,7]。王恒等人[8]基于最小二乘支持向量機(LS-SVM)算法提出一種基于多傳感器信息融合的球磨機料位測控系統,實現球磨機的礦料位置檢測。孫衛祥[9]采用主成分分析方法對來自于多個傳感器的轉子故障特征集進行特征融合,從而在特征融合的同時實現特征約簡。
本文以二階張量作為球磨機筒體振動信號特征融合表現形式,并對傳統張量局部保持投影(tensor partial preservation projection,TPPP)算法進行改進,將特征樣本的幾何結構信息與類別信息加入至相似性加權矩陣的計算過程中,提出一種基于集成矩陣距離測度的監督二階張量局部保持投影(supervised second-order tensor local preservation projection,SSTLPP-IMDM)算法,最后將該方法運用于球磨機筒體振動信號特征維數約簡中,從而驗證該方法的有效性和優越性。
二階張量局部保持投影(second-order tensor local pre-servation projection,STLPP)算法的原理為:設有N個二階張量表達形式的特征樣本為X={X1,X2,…,XN}∈Rn×m,通過式(1),從而獲得兩個變換矩陣U∈Rn×n′及V∈Rm×m′(n′,m′ (1) 式中 ‖‖F為矩陣的Frobenius范數。Sij為近鄰圖G的權矩陣S中第i行第j列的元素;D為對角矩陣,Dii=∑jSij。 通過式(2)迭代推導,計算出其廣義特征向量,并求出最優U和V (2) 最終,可將原始二階張量形式的高維空間特征投影至低維空間,即,Yi=UTXiV。其中,Yi為相比于Xi維數更低的二階張量。 由式(1)可知,求解近鄰圖G的加權矩陣S的方法存在一定的不足之處,其忽略了特征樣本數據中各個元素之間的空間信息,最終將出現不同樣本間的相互匹配性能較差的問題。因此,傳統的STLPP算法對分類環節中的類別信息未得到有效運用。 集成矩陣距離測度(IMDM)準則旨在求得兩個二階張量表達形式特征樣本之間的距離。設任意兩個二階張量表達形式的特征樣本為A=[a1,…,ah,…,am]T與B=[b1,…,bh,…,bm]T,其中ah=[a1h,…,alh,…,anh]T,bh=[b1h,…,blh,…,bnh]T,基于IMDM準則的樣本間距離計算公式為 =‖[‖a1-b1‖2,…,‖ah-bh‖2,…, ‖am-bm‖2]T‖p (3) 式中p為可變量,用于表現距離函數對后續模式識別能力的影響程度。當p>1時, ‖ah-bh‖2越大對dist(A,B)的影響越大;當p≤1時, ‖ah-bh‖2越小對dist(A,B)的影響越大。由于dist(A,B)最終運用于模式識別中各個特征樣本間類別評定,因此,應選用較小值的‖ah-bh‖2對dist(A,B)的影響能夠大于較大值的‖ah-bh‖2,這表明兩個向量ah與bh的匹配度更高。因此,為精確計算特征樣本間距離,應取p值為0 針對傳統STLPP算法運用Frobenius范數計算樣本數據之間的距離存在弊端,結合集成矩陣距離測度準則,提出一種基于SSTLPP-IMDM的算法。 將投影空間上樣本矩陣距離及相似性加權矩陣計算上的改進運用于傳統STLPP算法中,其變換矩陣U與V的求解轉變公式為 (4) 式中DDii為特征樣本集Xi與Xj間的近鄰程度,投影張量空間里的兩個投影點Yi=UTXiV與Yj=UTXjV之間距離使用IMDM準則進行計算。 為了研究磨機筒體振動信號與磨機負荷狀態及其工作狀態參數之間的關系,選用φ330 mm×330 mm的Bond指數實驗球磨機進行磨礦實驗。實驗中使用的物料為鎢礦石,其密度為1 800 kg/m3。由于實際磨礦過程中,物料的入料粒度存在差距,因此,參考工業中小型球磨機的入料粒度,將礦石粒度篩分為5個等級,分別為2~5,5~8,8~11,11~15,15~20 mm。筒體內物料的破碎與研磨主要依靠鋼球對其做功,而鋼球的大小不同在磨礦作業中破碎作用也不相同。為了提高球磨機的磨礦的效果,選用φ20 mm,φ30 mm,φ40 mm,φ50 mm的鋼球進行實驗,其密度為7 800 kg/m3。在球磨機筒體外沖擊區和拋落區各安裝1只傳感器。結合本課題組現有實驗條件搭建實驗平臺,球磨機筒體振動信號采集系統實驗平臺如圖1所示。 圖1 球磨機振動信號采集系統實驗平臺 磨礦實驗以填充率、料球比和轉速作為變量,采用單因素全組合實驗方案。其中,填充率分別為0.2,0.3,0.4,0.5,料球比分別為0.5,0.6,0.7,0.8,0.9,1.0,1.1和1.2,轉速分別為40,50,60 r/min,一共包括96組實驗。 根據文獻[10]提出的方法,求解出磨機筒體振動信號的最大頻率為3 880 Hz,由于采樣定理指出,采樣頻率應大于信號最高頻率的2倍,但在實際工程應用過程中,一般要將采樣頻率設置為信號最高頻率的5~10倍,才能較為準確地采集到實際信號[11]。為了提高信號的頻率分辨率,在滿足信號能夠精準采樣的前提下一般選用較小的采樣頻率,因此,本研究中將采樣頻率設置為fs=20 000 Hz。 進行筒體振動信號采集,得到筒體振動信號的時域波形,發現相同球磨機工況下拋落區與沖擊區加速度傳感器采集得到的振動信號各不相同,由此表明球磨機筒體不同位置的振動信號具有明顯不同的設備狀態表征特性。因此,將來自于多只傳感器的球磨機筒體振動信號特征進行融合,為球磨機負荷狀態識別提供一種有效方法。 針對不同負荷狀態下采集得到的磨機筒體振動信號的樣本數據,分別提取8個時域特征參量和5個頻譜特征參量[12]:均值、方差、方根幅值、有效值、峰值、偏度指標、峭度指標、峰值因子、均值頻率、標準偏差頻率、頻譜偏度、頻譜峭度、重心頻率;兩個熵值特征參量:樣本熵、模糊熵。將以上15個特征參量作為特征約簡的原始高維特征集。 基于SSTLPP-IMDM算法的球磨機筒體振動信號多傳感器特征維數約簡的具體實施流程如圖2所示。 圖2 球磨機振動信號多傳感器融合特征維數約簡 由于后續需要對降維特征集的分類性能進行評判,因此,需要設定訓練樣本和測試樣本。實驗中提取出100組球磨機來自于拋落區與沖擊區2只加速度傳感器的筒體振動信號,由此,可得到一個2×15×300維的特征集樣本張量X。特征樣本中50組特征樣本集作為球磨機負荷識別模型的訓練樣本,剩余50組則作為模型的測試樣本,因此,該特征樣本張量X中含有一個2×15×300維的訓練樣本張量X1及一個2×15×300維的測試樣本張量X2。根據圖2中描述的流程,將上述設定的特征集訓練樣本張量X1作為輸入,從而獲得相應的變換矩陣U和V,最后求解出其低維投影張量Y1∈Rn′×m′×150,即得到高維特征樣本集降維后的特征集。 為了可視化表現出磨機筒體振動信號特征降維效果,將降維得到的低維投影樣本張量Y1中的各特征樣本數據矩陣向量化,從而得到基于SSTLPP-IMDM算法降維后向量化表達的三維散點分布效果如圖3(a)所示。將基于傳統STLPP算法的維數約簡方法運用于同一訓練樣本張量X1中,其降維得到的低維投影樣本張量Y′1的向量形式的三維散點表現形式如圖3(b)所示。 圖3 基于SSTLPP-IMDM和STLPP算法的訓練樣本張量維數約簡后特征集的散點分布 將圖3(a)與圖3(b)進行對比可知,圖3(b)中運用傳統STLPP算法維數約簡后的特征樣本集在不同類別的樣本分布中存在的混合現象,即不同類別的樣本特征集區分度不高;而運用SSTLPP-IMDM 算法維數約簡后的特征樣本集在不同類別中區分度較高,即同類樣本相互之間分布緊湊,不同類樣本之間具有明顯分離。上述實驗結果表明,基于SSTLPP-IMDM算法的維數約簡方法能夠有效地將原始高維二階張量形式的特征樣本集投影至低維特征樣本集中,且其分類性能明顯優于傳統的STLPP算法。 由于上述實驗是針對不同維數約簡方法,從定性的角度衡量降維后特征集的聚類特性[13],引入特征聚類性能指標對各類算法的降維效果進行定量評價,即類內散度Sw、類間散度Sb以及類內—類間綜合散度SS。其計算公式為 (5) (6) (7) 由式(5)~式(7)可知,類內散度Sw表示在同一類別中,各個樣本之間的平均聚集程度;類間散度Sb表示在不同類別中,各個樣本之間的平均分離程度;類內—類間綜合散度SS則表示Sw與Sb的綜合評價結果。STLPP和SSTLPP-IMDM維數約簡方法降維后各特征集之間的聚類評價指標計算結果如表1所示。 表1 不同維數約簡方法降維后各特征集之間的聚類評價指標計算結果 由表1分析可知,在對球磨機筒體振動信號特征降維過程中,運用SSTLPP-IMDM的維數約簡方法降維后的樣本特征集的類內散度Sw均小于SSTLPP維數約簡方法、類間散度Sb均大于SSTLPP維數約簡方法,且其聚類綜合評價指標SS的結果也相比SSTLPP降維方法明顯更大,這表明,基于SSTLPP-IMDM算法的球磨機筒體振動信號特征維數約簡方法能夠到達更好的聚類效果。 為進一步驗證SSTLPP-IMDM算法的優越性,采用三種典型分類器模型:K最近鄰(KNN)分類算法、多層感知神經網絡(MLP neural network)模型及支持向量數據描述(SVDD)模型對SSTLPP和SSTLPP-IMDM維數約簡方法降維特征集的分類精度進行對比分析。將維數約簡后的低維特征樣本在上述3種分類模型中各進行10次分類實驗,取10次實驗的分類精度均值作為最終結果。經過STLPP和SSTLPP-IMDM維數約簡方法得到的降維特征集在3種典型分類模型中的分類精度如表2所示。 表2 STLPP和SSTLPP-IMDM維數約簡方法在3種典型分類模型中的分類精度 由表2可知,基于SSTLPP-IMDM算法的張量形式表達多傳感器融合特征樣本數據的降維特征集相比STLPP降維特征集具有更高的分類精度,其分類精度分別為99.6 %,95.33 %, 98.5 %,因此,實驗結果再一次驗證了本文研究提出的基于SSTLPP-IMDM的維數約簡算法結合張量形式表達的多傳感器特征信息融合能夠在增加特征集有用信息的同時提高其類別分類精度。 提出了SSTLPP-IMDM算法,并將該方法運用于球磨機筒體振動信號特征維數約簡中,通過對傳統STLPP算法中樣本矩陣距離及相似性加權矩陣計算方法進行改進,實現了二階張量形式表達的多傳感器特征維數約簡。相比傳統的STLPP降維算法,SSTLPP-IMDM算法具有更好的聚類特性且能夠有效提高分類模型的分類精度。通過對來自2只定位于球磨機筒體拋落區和沖擊區的加速度傳感器采集到的實驗數據進行分析驗證,表明了基于SSTLPP-IMDM算法在球磨機筒體振動信號特征融合維數約簡中的技術優勢,提高了后續球磨機內部負荷狀態識別的可靠性。
1.2 SSTLPP算法改進
2 實驗驗證
2.1 實驗平臺的搭建

2.2 實驗方案設計
2.3 實驗數據獲取與預處理
3 基于SSTLPP-IMDM算法的球磨機振動信號特征維數約簡
3.1 多傳感器融合特征維數約簡步驟

3.2 降維效果的驗證與對比



3.3 降維特征集的分類性能驗證與對比

4 結 論