丁少虎 張瑞晨 楊稱稱 張 森
(①北方民族大學機電工程學院,寧夏銀川 750021;②北方民族大學電氣信息工程學院,寧夏銀川 750021)
高檔數控機床和基礎制造裝備是實現制造技術和工業現代化的基石[1],也是實施強國戰略的重點領域,全球制造業強國也都在研究水平先進的制造設備。由于數控機床結構復雜,零部件構造精密,在運行時很容易被周圍各種因素影響,加上長時間不停歇的使用,導致設備故障頻繁發生[2],對產品性能和數控機床壽命都會產生影響,如果在問題剛出現或即將出現時能快速反饋并采取解決措施,就能挽回更多損失,因此精準的故障分類診斷就成了生產過程的重要環節。機械故障診斷技術通過采集和分析設備運行時的數據,可以了解和掌握機器在運行過程中的狀態,實現對設備運行狀態的監測。常采用的診斷技術包括油液監測、振動監測、性能趨勢分析和無損探傷等,其中早期最常用的是基于接觸式振動傳感器的診斷方法,該方法在齒輪、高壓斷路器等故障部位的應用較為成熟,但該方法需要接觸測量,將振動傳感器放置在被測物體上,當遇到高溫、腐蝕液體、難以附著的光滑位置等問題時,該方法無法發揮作用;此外,振動傳感器也只能對機械的局部問題進行故障檢測,當局部的振動特征對故障不敏感時,診斷效率會受到影響。隨著聲音技術的發展,基于聲音的故障診斷技術逐漸受到更多研究人員的關注,該技術采用非接觸式測量,無需將傳感器附著在被測機械位置上,可以將機械整體聲音進行收集處理,操作簡單且靈活。近年來聲學故障檢測也逐漸得到推廣,應用在多種機械領域上,如鉆機鉆頭的斷裂檢測[3]、刨機故障診斷[4]等。
常見的特征提取方法有時頻域分析[5]、小波變換[6]等,但單一的特征提取方法往往不能充分表征數控機床音頻信息,因此使用Mel頻率倒譜系數(mel-frequency cepstral coefficient,MFCC)提取特征和線性預測倒譜系數(linear predictive cepstral coefficient,LPCC)提取特征融合,從不同標準獲得更多數控機床聲音特征;因為特征的維度較高,數據處理較慢,使用主成分分析(PCA)降維方法和歸一化處理特征數據,可以消除不同維度和量綱導致的距離計算不合理情況;傳統的診斷方法只有在正常和異常樣本均衡時才會有較高的檢測準確率,而數控機床工作時的異常樣本(如刀具斷裂、主軸磨損等)難以大量獲取,因此使用一類支持向量機方法對數控機床數據進行檢測可以解決樣本不均衡的問題。本文將利用MFCC和LPCC方法提取數控機床聲音信號的多維特征,分別進行PCA降維和歸一化后進行特征融合,將融合特征使用一類支持向量機方法判斷是否存在故障,若檢測為正常,則繼續工作,若判斷為異常,則通過SVM分類器[7]識別具體故障類別并停止工作,精準定位故障快速解決問題。通過該流程能快速且高效診斷識別數控機床的故障類別。
在聲音特征參數提取技術的發展歷程中,線性預測倒譜系數最早被用于語音特征參數的提取,該方法能較好反映語音的聲道特征。隨著環境音的發展,雖然工程機械音與語音產生過程有所差異,但通過對比分析語音與機械環境音的產生和特征,在本質上發音過程類似,且常規的部分特征都適用,因此,可使用LPCC對機械音進行特征分析[8]。譜質量下降。LPCC具有計算量小,對共振峰的描述清晰等優點,其核心思想是:第n個音頻樣本可以通過其之前p個樣本的線性組合來估計,表示為
LPCC是 由 線 性 預 測 編 碼(linear predicative coding,LPC)計算頻譜包絡得到的倒譜系數,因為LPC對誤差比較敏感,導致一些小誤差也會造成頻

式中:a1,a2,···,ap被 假定為語音分析框架上的常數[9]。LPCC特征的階數通常與其所反映的信息和運算量成正比,階數越大,通常所包含的信息就越大,階數通常選擇8~16[10]。特征提取聲譜圖如圖1所示,這是對聲音信號進行預加重、分幀和加窗等預處理后,再進行線性預測分析、快速傅里葉變化、取對數和快速傅里葉逆變化獲得的關鍵特征信息。

圖1 LPCC的13維特征聲譜圖
不同于LPCC對發聲處機理進行研究而得到的聲學特征,MFCC是依據人耳的聽覺系統研究推出的特征提取方法。與LPCC類似的是,MFCC也是利用求倒譜系數分析特征,倒譜分析是常用的一種方法,它可以用有限特征表征聲音包含的信息。
這種方法不基于信號本質的變化,對輸入的聲音信號不附加各種條件,又利用了聽覺模型上的研究,因此這種特征提取方法具有更強的魯棒性[11],而且在信噪比較低時仍有可觀的檢測正確率。通過將頻率轉換成Mel尺度,特征能夠更好地匹配人類的聽覺感知效果,從頻率到Mel頻率的轉換公式為
其中:f為頻率,利用Mel濾波也是該特征提取方法的一個關鍵,MFCC的特征提取聲譜圖如圖2所示,圖2中MFCC的特征聲譜圖是經過對聲音信號預處理、快速傅里葉變化、Mel濾波、取對數以及離散余弦變化后獲得的關鍵特征信息。


圖2 MFCC的13維特征聲譜圖
通常特征的維度越高,其所包含的信息就越多,準確率也會相應提高,但當處理的文件數量增多,且特征維度較高時,一次檢測運行可能就是以小時起步,因此為了節省時間與內存,選擇一種合適的降維算法進行處理數據就顯得格外重要。不同的算法會根據數據的不同特性進行降維,常見的降維方法有t分布隨機鄰域嵌入(t-SNE[12])、一致流形近似與投影(UMAP)和PCA方法。
PCA是主成分分析方法。這是一種常見的數據處理算法,一般用來給高維數據降維。通過選擇不同的基對同一組數據給出不同的表示,若基的數量小于數據本身的維數,則說明達到了降維的目標[13]。其中的關鍵問題是怎樣選擇K個基去表示N維向量。
(1)方差。方差代表著數值的分散程度,為方便處理,將變量均值化為0可得

需要尋找1個一維基,使得變換數據到基上后,方差值最大。
(2)協方差。協方差能代表1個變量之間的相關性。要讓2個變量之間不存在線性相關性,這樣能使其表示更多不重復的原始信息。同樣將均值化為0可得

表1 實驗采集數據信息

當協方差為0時,表示2個變量線性不相關,在選擇第2個基時在第1個基正交的方向上進行選擇,就能滿足相互正交的期望。有a和b兩個變量,按行組成矩陣X
(3)協方差矩陣。要滿足優化目標,就要將方差與協方差統一表示,可用矩陣的方式,假設

由式(6)可得統一表達后的方差與協方差。
(4)矩陣對角化。假設P是1組基按行組成的矩陣,設Y=PX,則Y就是X對P做基變換后的數據。設Y的協方差矩陣為D,則D為

由式(7)可以看出優化目標已經變為尋找1個矩陣P,滿足D是1個對角矩陣,則對角元素從大到小的前K行就是要尋找的基。
由實對稱矩陣定義可知,1個n行n列實對稱矩陣一定能找到n個單位正交特征向量,設為e1,e2,···,en,將其按列組成矩陣E=[e1,e2,···,en],則協方差矩陣C可為

對角元素λ就是各特征向量對應的特征值。得到P=ET,P的每1行都是C的1個特征向量,將P從大到小排列的前K行組成的矩陣乘原始數據X,就得到了Y=PX,即為降到K維后的數據。
文章對比了t-SNE、UMAP以及PCA這3種降維方法診斷效果,具體實驗見后文。
傳統理解中,特征維度越高代表其所包含的關鍵信息越多,檢測準確率就會相應地提高。環境聲具有非線性且背景復雜發聲點較多,使得單一特征無法完全表征環境聲音信號,融合特征可以解決這一問題。因此,采用LPCC與MFCC方法提取特征,之后進行降維及歸一化處理,最后結合生成新的特征。

其中:μ為所有樣本數據的均值,σ為所有樣本數據的標準差。
如式(9),對數據進行標準歸一化,是機器學習與統計學習任務中常用的一種處理方式。由于MFCC和LPCC是基于不同方法的濾波器提取得到的特征,具有不同的量綱,因此直接對兩者進行疊加或結合可能會導致精度下降。為了消除量綱不同帶來的影響,采用特征降維和標準歸一化處理可以解決由于不同維度和量綱導致的距離計算不合理情況,此外還能方便處理數據和加快收斂速度。
文章對兩種特征提取方法都設置為13維特征提取,因此MFCC和LPCC特征具有相同的維數,在經過降維、歸一化處理后,聲譜圖已轉換為多維數組,利用Python中的concatenate函數將處理后的2種特征的對應位置相互融合,融合后的新特征既包含MFCC提取的特征信息,也包含LPCC提取的特征信息,2種方法提取的特征之間相關性較小,反映出環境聲音不同特征,預計融合后效果較好。
一類支持向量機(one-class support vector machine,OCSVM)是由Bernhard Scholkopf等人基于支持向量機(SVM)提出[14]。SVM有著諸多算法不具備的優良特性,首先,SVM算法是基于統計學習中VC維與結構風險最小原理的典型機器學習方法。通過添加對應的正則項,使該方法具有良好的泛化能力,不易過擬合;將SVM的原二次規劃求解問題轉化為凸優化問題,當數據集線性可分時,則必定能得到全局最優解;其次利用線性、多項式和高斯等核函數,將原樣本空間投影至高維空間,利用高維空間線性可分的特性,將非線性問題轉化為線性問題進行求解;最后,通過引用一個松弛變量和懲罰系數,最大化軟分類間隔,使得SVM算法具有較好的魯棒性。
OCSVM算法也使用了核函數來處理線性不可分的情況。給定數據X=[x1,x2,···,xl],其中包含l個觀測數量,設為1個R N的1個子集,假設Φ是1個從X低維輸入空間到高維Hilbert空間H的映射,利用核函數運算通過k(x,z)對任意x,z∈X:

為了將數據集與原點分離,并使這個距離最大化,對其求解二次規劃,得

由于非零松弛變量ξi在目標函數中受到懲罰,可以預期,如果w和ρ解決了這個問題,則對于訓練集中包含的大多數示例xi,決策函數將會為正,其中v扮演重要權衡角色,v∈(0,1)是1個參數,類似于SVM中的懲罰參數C。采用拉格朗日求解,并通過上面核函數可證明解具有SV展開式:
具有非零αi的模式xi稱為SVs,其中找到系數便可得優化問題的對偶形式:

單分類支持向量機基本思想:首先通過非線性變換將數據映射到高維的特征空間,然后在特征空間中,將原點作為異常點,求出訓練樣本與原點的最大間隔的超平面。對測試樣本,通過超平面進行分類[15]。這是一種無監督學習方法,能規避手工貼標錯誤引起的識別下降,還能節省大量時間。為預防將通過的人聲鳥叫等都識別為異常聲音,所以在訓練測試時,會給定一個總比例約0.1的異常樣本,使機器認識異常樣本,通過機器自動識別異常樣本數量,對比已知數據觀察檢測效果。
機床的異音故障分類診斷方案主要有以下3個方面的工作,分別是機床音頻信號的采集、數據信號的處理和異音診斷方法的實現。根據實現的流程,將機床異音檢測系統分為以下幾步:
(1)使用Brüel&Kj?r(BK)信號采集設備(包括傳聲器、信號采集儀等)采集機床正常工作與多種異常工作的聲音信號,為后續算法分析提供數據支持。
(2)對采集的信號先在BK Pulse Reflex軟件上進行時頻域觀察分析,再通過Python進行切割命名等處理數據,使用MFCC和LPCC方法進行信號濾波和特征提取,選擇PCA降維方法進一步處理特征,對提取的兩種特征進行特征融合,為之后的決策方法處理好數據。
(3)利用OCSVM方法對機床音頻數據進行檢測,得到是否有異常音頻,若為異常音頻,再進一步判斷是哪一類異常音頻。
基于聲音特征融合與OCSVM的機床故障分類診斷詳細流程圖如圖3所示。

圖3 機床的故障診斷分類流程圖
實驗采用Type 4189-A-021傳聲器和Type0671前置放大器采集數控機床的各類音頻,搭配3050-A-060信號采集儀傳入計算機進行數據分析,傳聲器懸掛放置在機床內部兩側,傳聲器方法采集數據區別于振動傳感器,不能放置在機床的某一單獨位置附近,應確保對工作環境的整體監測,同時對傳聲器包裹海綿套,在濾除部分雜音和降噪的同時保護設備正常使用,部分設置參考GB/T 12060.4聲系統設備第4部分:傳聲器測量方法,測試圖如圖4所示。

圖4 采集現場和采集設備搭建示意圖
機床音頻信號數據采集時,先確定正常運轉的各項參數值,選擇8 mm尺寸的切削刀具,機床轉速設置為3 000 r/min,進給量為250 mm/min,背吃刀量為1 mm。刀具磨損音頻采集選擇70%左右界值的磨損刀具進行工作,進給量增至350 mm/min時運行狀態作為異常音頻采集,背吃刀量增至1.5 mm時作為異常音頻采集。考慮到不同的異常音頻故障采集難度不同,因此每個音頻的采集數量都會有區別,如刀具斷裂錄制時間較短,采用音頻裁剪的方式擴充數據集。采集頻率為51.2 kHz,使用雙聲道采集音頻,數據每30 s分為一個音頻文件,后期切割為每500 ms一個音頻文件,并去除其中的空白音頻,錄制的各類正常與異常音頻總數如表1所示。
機床數據采集過程中會存在環境噪聲的影響,采用2種方法解決該問題:第一種是在聲音特征提取時對信號預處理、加濾波器濾除部分噪音;第二種是對持續存在的機床噪音混入每一個音頻中,將采集的機床每類音頻都設為一個整體,默認該噪聲為數據集的一部分去訓練診斷。
對機床的所有類型音頻信號進行時頻譜分析如圖5所示,從左上圖至由右下圖分別為刀具磨損、刀具斷裂、刀具缺失、主軸抱死、導軌磨損、進給量改變、背吃刀量改變、異常撞擊、刀具空轉和正常工作時頻圖。由圖5對比可見,刀具斷裂和導軌磨損的異常音頻與機床正常運轉的聲音差別較大,其他7種異音時頻圖與正常聲音時頻圖差別會小很多,因此可以選擇更多的分析方式識別故障。

圖5 機床各類音頻信號時頻圖對比
分別使用MFCC和LPCC各提取機床音頻信號特征進行實驗檢測,在異音故障檢測上主要設置特征融合和降維方法的選擇對比實驗。理論上融合特征會獲得更高的檢測效果,因此先固定融合特征選擇效果更好的降維方法,待確定降維方法后,再進行單特征與多特征提取實驗對比。實驗中以9∶1比例選擇正常與異常樣本,由于本文采用的診斷方法是OCSVM,可以在數據樣本不均衡的情況下使用,選擇訓練數據樣本總量為2 828個,測試樣本總量為701個,將所有異常故障聲音合并為一個整體稱為故障總類,具體每一類的訓練和測試數據量如表2所示。

表2 訓練/測試樣本數量說明
數據樣本量為n為2 828,數據時長為500 ms,每一次檢測模型會對數據特征處理,將每一個數據點的值表示出來,計算得到結果,如表3所示。

表3 單次檢測數據值表示
分別對機床音頻數據進行t-SNE、UMAP和PCA 降維方法實驗,并進行調參,實驗結果如圖6。

圖6 3種降維方法實驗結果圖
在保持核函數和多特征融合方法情況下,常用混淆矩陣表達模型數據預測結果,見表4。

表4 混淆矩陣
采用式(14)準確率方法來體現模型效果。

通過準確率對比特征融合下不同降維方法的檢測效果,如表5所示。

表5 3種降維方法檢測結果對比
t-SNE降 維 方 法 在2 828個 數 據 中 共 識 別 錯285個,這種效果并不盡如人意。UMAP降維方法在2 828個數據中識別錯143個,識別準確率相比t-SNE較高,但識別時間增加過多。PCA方法在所選的數據中識別率較高,且運行時間較短,說明PCA降維方法相對更加合適。
在確定PCA降維方法后,開始進行單特征提取與多特征融合的實驗,對機床音頻數據集進行單獨MFCC和LPCC特征提取實驗,并進行調參,結果如圖7所示,詳細信息如表6所示。

圖7 單特征提取實驗結果圖

表6 單特征檢測結果
由圖7和表6可見單特征效果較好的為LPCC特征提取,檢測效果為88.1%,在運行時間差距不大的情況下,檢測效果相比于表5中特征融合-PCA方法的94.9%準確率還是低了6.8%,因此特征融合和PCA降維方法搭配OCSVM分類器使用是診斷故障效果最好的方法,下面將使用該方法進行測試驗證。
將測試數據代入訓練好的故障診斷模型,診斷效果如圖8所示。
由圖8檢測效果可見正確診斷樣本674個,錯誤診斷樣本27個,故障診斷準確率達到了96.1%,能夠實現機床運行故障的診斷。

圖8 測試集檢測效果圖與混淆矩陣圖
通過機床異音故障診斷后,當診斷為正常工作聲音時,機床正常工作,當診斷為異常聲音時,需要進一步識別該音頻對應的機床故障類別并停止機器,通過K近鄰(K-nearest neighbors,KNN)方法和SVM方法進行具體檢測。機床異音故障分類的總數為4 123個樣本,共9類如表7所示。

表7 機床異音故障類別樣本數量
將整體數據以7∶3分為訓練集與測試集進行實驗,觀察測試集檢測效果,實驗結果如表8所示。

表8 多類故障檢測結果對比
由表8可見SVM檢測效果相比KNN方法準確率提高了14.3%,因此在檢測異音故障問題上選擇SVM方法能更準確地檢測出異音所屬故障類別。通過機床故障分類的檢測方法流程,可以對大多數故障問題進行分類診斷,大大降低因故障帶來的各項損失。
文章提出一種基于聲音特征融合與OCSVM的異音故障分類診斷方法,并將該方法應用于機床實際工作,進行了故障診斷與分類,由實驗結果得到以下結論:
(1)將LPCC與MFCC提取的特征進行融合可以獲得機床聲音數據更完整的各項信息,故障診斷準確率分別比MFCC和LPCC高12.2%和6.8%,說明對數據進行特征融合會獲得更好的診斷效果。
(2)對比t-SNE、UMAP和PCA降維方法,通過機床故障診斷實驗結果可見,無論是故障診斷準確率還是診斷時間,PCA都屬于效果更好的方法,因此使用PCA對機床數據進行降維處理。
(3)通過機床測試數據集的故障診斷實驗可見,即使在樣本不均衡的情況下,OCSVM分類器的故障診斷準確率也能達到96.1%,說明該方法契合此類異常樣本難以獲取的應用方向且環境噪音對診斷的結果影響不大。由多類故障檢測結果說明了在機床故障分類診斷應用上,SVM是比KNN更好的分類方法。