趙心陽,肖 涵,2,呂 勇,2
(1.武漢科技大學機械自動化學院,湖北 武漢 430081;2.武漢科技大學冶金裝備及其控制教育部重點實驗室,湖北 武漢 430081)
齒輪傳動廣泛應用于機械設備中,但由于工況的復雜多變,齒輪自身也容易發生故障,統計表明,在齒輪箱的全部零件中,齒輪自身失效引起的設備故障約占全部故障的60%[1],因此針對齒輪故障診斷方法的研究一直是近年來的熱點。齒輪振動信號更多的表現出非線性、非平穩特征是普遍共識[2],學者往往將振動信號的非線性特征,如Lyapunov指數、分形維數、熵等用于故障診斷,取得一定的效果[2-3]。但由于振動信號通常信噪比較低,而上述參數對噪聲較敏感,導致其作為特征量時,故障識別精度不高。
遞歸性是動力學系統的基本屬性之一,1987年Eckman基于相空間重構理論提出遞歸圖(Recurrence Plot,RP)分析方法[4],用以從遞歸圖的內部層狀結構揭示時間序列的復雜性和可預測性,包括傳統閾值遞歸圖(Thresholded Recurrence Plot,RP)和無閾值遞歸圖(Un-Thresholded Recurrence Plot,URP)。為了解決遞歸圖分析方法無法定量描述動力學特性等問題,文獻[5-6]提出傳統閾值遞歸圖特征提取方法-遞歸定量分析(Recurrence Quantifica?tion Analysis,RQA)。通過研究遞歸點的分布規律,研究者已提出的遞歸參量已達20余種,且已應用于設備故障診斷領域。但遞歸參量的選擇往往由研究者主觀確定,且故障識別精度有待提高。由于URP中遞歸點間的距離參數被保留下來,因此對于同一時間序列,URP 中往往包含比RP 更多的信息量,近年來針對URP 的研究逐漸成為熱點。2018年,文獻[7]提出利用URP 分析方法檢測絕緣電力電纜因熱老化引起的劣化程度。文獻[8]根據URP中的歐式距離分布提出了一種基于無閾值遞歸矩陣的檢測器,用于檢測噪聲環境中信號的出現。但上述研究均是從定性角度分析,無法定量描述URP,限制了其應用。這里提出一種采用有界廣義高斯混合模型(BGGMM)進行URP特征提取的方法,用于URP的定量分析,并應用于齒輪故障分類。
遞歸圖作為時間序列中重復模式的圖形表示,是分析時間序列周期性、混沌性以及非平穩性的一個重要方法[2]。算法流程如下:
(1)對于一維時間序列xi(i=1,2,3,…N),經相空間重構后,得到高維相空間:

式中:Nd=N-(d-1)τ,τ—延遲時間;d—嵌入維數。
(2)對于相空間中的軌跡x→i(i=1,2,…Nd,x∈Rd),無閾值遞歸圖定義為:

式中:‖ ?‖—向量范數,常用范數包括1-范數,2-范數和∞-范數,這里采用∞-范數;與傳統閾值遞歸圖不同,無閾值遞歸圖由于沒有閾值ε的限定,其遞歸矩陣Ri,j(unthres)—相空間中兩個向量x→i和x→j之間的歐式距離。
基于高斯分布的混合模型一直都是研究的熱點,廣泛應用于模式識別、圖像處理和故障診斷等領域。其中高斯混合模型(GMM)[9]是應用較多的混合模型之一,但由于其具有奇異性,即樣本數不足時參數估計會更加困難,從而導致算法發散。為解決GMM 的不足,學者提出更具魯棒性的廣義高斯混合模型(GGMM)[10]。相較于傳統GMM,GGMM 嵌入額外參數λ用以控制擬合曲線尾部凸起與否,因此可適應更多類型數據。但是上述混合模型都未考慮數據邊界問題,當數據存在支撐邊界時,將導致參數估計存在較大的偏差。因此文獻[11]2014年提出有界廣義高斯混合模型(BGGMM)用以擬合高斯分布和非高斯分布數據,并考慮數據的邊界問題,近年來廣泛用于模式識別等領域。文獻[12-13]成功將BGGMM 應用于視頻和圖像降噪以及圖像分割領域。文獻[14]結合獨立分量分析方法(ICA)和BGGMM成功實現對關鍵字進行無監督識別。
2.2.1 算法簡介
高斯混合模型(GMM)是單高斯概率密度函數的延伸,廣泛應用于模式識別、圖像處理、故障診斷[6]等領域。
K個分量的GMM,其定義為:

式中:Θj—模型參數,ωj作為混合權重系數,滿足ωj≥0。


式中:μj和σj—混合模型中的均值和方差,參數λj控制該分布的尾部凸起與否;Γ(?)—伽馬函數。值得提出的是,GMM 和GGMM是BGGMM的特殊情況:當λj=2,H(xi|Ωj)=1時,式(4)可表示為GMM的概率密度函數;當H(xi|Ωj)=1時,表示為GGMM的概率密度函數。
2.2.2 參數估計
期望最大化(Expectation-Maximum,EM)算法在統計學中廣泛被用于參數的最大似然估計,同時也是基于高斯分布的混合模型中常用的參數估計方法[15]。EM算法以迭代的形式實現最大似然函數的最大化,包括E-Step 和M-Step,在這里所應用的BGGMM中,最大似然函數定義如下:

為了最大化式(8),采用其負數方程作為誤差方程,此時最大化似然函數即等效為最小化誤差式(9),誤差方程定義如下:

在E-Step中,后驗概率定義為:

在M-Step 中,根據式(10)得出的后驗概率更新模型參數如下:

其中:

式中:γ—比例因子—從混合模型特定組分j的廣義高斯分布中提取的隨機變量;M—大正整數;當x≥0時,sign(x)=1,否則sign(x)=0。
最后,對式(9)中的誤差函數進行評估,檢查收斂準則。若不滿足收斂條件,則從E-Step重新開始下一次迭代,直到滿足收斂準則為止。
無閾值遞歸圖(URP)可以檢測遞歸點之間距離的微小變化,而如果這些變化小于預定義的截止距離,則在RP中無法檢測到。因此,URP中的模式可以比RP提供更多的信息。為了從統計學角度量化URP,這里提出采用BGGMM進行URP統計定量分析方法,算法流程如下:
(1)輸入時間序列x(t);
(2)通過式(1)和式(2)經相空間重構獲得無閾值遞歸矩陣Ri,j(unthres),然后將遞歸矩陣中值的直方圖進行歸一化處理;
(3)初始化模型參數Θ=(ωj,μj,σj,λj);
(4)通過式(10)式(14)迭代更新模型參數Θ;
(5)檢測迭代收斂準則。若不滿足,返回步驟(4)繼續迭代,直至滿足條件,迭代停止;
(6)輸出均值和方差,組成特征向量(μ,σ),對URP進行定量描述。
本節中,為了驗證該方法的有效性,利用兩組仿真信號進行分析。(1)周期信號:x(t)=sin(2π10t);(2)Lorenz信號:

周期信號和Lorenz信號的時域波形圖、對應的URPs以及歸一化后的歐式距離分布直方圖,如圖1所示。從圖1可看出,正弦周期信號URP的遞歸點沿主對角線平行或垂直分布,而混沌信號URP中出現大量平行與主對角線的線段。其對應的分布直方圖近似服從于高斯分布,所不同的是,圖1(a)中的直方圖明顯存在數據邊界,數據也更加分散;圖1(b)中,數據更接近于高斯分布,且相對集中,這表明原始信號存在差異。經BGGMM擬合(K=1),提取均值分別為1.45和1.92,方差分別為7.04和1.91,提取的均值和方差均存在差異,其中方差存在較大的差異也解釋了直方圖數據的集中程度的不同,這表明混合模型的參數可作為URP的定量分析指標。

圖1 仿真信號時域圖及其對應的URPs和歐式距離分布直方圖Fig.1 Time-Domain Plot and their URPs as well as the Euclidean Distance Distribution Histogram of Simulate Signals
這里將該方法應用于齒輪故障的分類,提出的齒輪故障分類算法的流程圖,如圖2所示。

圖2 齒輪故障分類算法的流程圖Fig.2 The Flowchart of Fault Classification Algorithm
為了驗證所提方法的有效性,通過齒輪故障實驗臺采集不同齒輪狀態下的振動信號,實驗臺及其結構簡圖,如圖3 所示。實驗臺包括550w(220V-50Hz)電機,帶有一對嚙合齒輪的齒輪箱,聯軸器和磁粉制動器。其中,電機的轉速和負載在(300~1217)r/min和(0~20)N·m范圍內變動;小齒輪的齒數為20,大齒輪37,模數均為3;振動信號由安裝在輸入軸承座的垂直方向上的加速度傳感器采集。

圖3 齒輪故障實驗臺及其結構簡圖Fig.3 Gear Failure Test Table and its Structure Diagram
采用上述實驗臺,分別采集四種齒輪狀態的振動信號各100組,采樣頻率10kHz,采樣時間0.1s。四種齒輪故障狀態的時域信號波形圖及其對應的URP,如圖4、圖5所示。原始信號不進行降噪處理,采用虛假鄰域法確定嵌入維數d=4,平均互信息算法[16]確定延遲時間τ=4。


圖4 四種齒輪狀態時域波形圖Fig.4 Time-Domain Signals of Four Gear States

圖5 四種齒輪狀態的無閾值遞歸圖Fig.5 Un-Thresholded Recurrence Plots of Four Gear States
從時域波形圖看,原始信號摻雜噪聲較多,無法直接從原始時域信號區分四種齒輪故障狀態;從URP中看出,遞歸圖中的遞歸點主要呈垂直分布,動力學系統所決定。
無閾值遞歸圖中,向量之間的歐式距離大小由顏色深淺不一的遞歸點映射在圖像中,如圖5 所示。四種齒輪故障模式下的URP 顏色深度不同,表明遞歸點的歐式距離分布存在差異。應用BGGMM 擬合URP 中遞歸點歐式距離分布直方圖,并提取均值和方差組成特征向量(μ,σ)用以齒輪的故障分類。分別以均值(μ)和方差(σ)為橫縱坐標繪制,如圖6 所示。由圖6 可以看出,四種齒輪故障狀態下的振動信號特征向量的分布存在較大的差異,除了斷齒和周節兩種狀態存在少量重疊外,四種故障齒輪的特征向量基本完全被分開。

圖6 BGGMM提取的特征向量分布情況Fig.6 Distribution of Feature Vectors Extracted by BGGMM
為了驗證該方法的有效性,將所采集的各齒輪故障狀態數據按1:1的比例分為訓練數據和測試數據,即前50組數據用于訓練,后50組數據用于測試,建立高斯混合模型,應用貝葉斯最大似然分類器進行分類。并與傳統RQA的10種遞歸定量[16](RR、DET、L、Lmax、ENTR、LAM、TT、Vmax、T1/T2)作為特征向量時的識別率進行比較,結果如表1所示。

表1 URP定量分析和傳統RQA方法的識別率Tab.1 Identification Rates of URP Quantitative Analysis and Traditional RQA Methods
從表1可以看出,基于BGGMM的URP定量分析方法的識別率明顯高于傳統RQA方法,四種齒輪故障狀態的識別率均高于90%,其中對齒輪正常狀態的識別率較高,達到100%。對于齒輪磨損和正常兩種狀態,較傳統RQA 方法分別提高10%和26%。表明這里所提出的齒輪故障分類方法具有一定的優勢。
近年來,遞歸定量分析廣泛應用于故障診斷等領域,但其診斷精度有待提高,此外,目前缺乏針對無閾值遞歸圖定量分析的有效方法。這里提出一種采用BGGMM進行URP特征提取的方法,用于定量分析URP,并成功應用于齒輪的故障分類中。實驗結果顯示,與傳統的RQA方法相比,該方法在齒輪故障識別方面具有更好的性能和更高的分類精度。
所提方法是從模式識別的角度,對無閾值遞歸圖的一種統計定量分析方法,將遞歸矩陣中歐式距離的分布直方圖的統計參數作為定量分析指標。但提出的定量指標所對應的動力學特征還需進一步研究,此外,研究其它的統計學參數作為定量分析指標也是后續的研究內容。