余煥偉,陳仙鳳,朱先華,趙星波,杜錫勇
(1.紹興市特種設備檢測院, 紹興 312000;2.嘉興市南湖區社會福利保障指導中心,嘉興 314001)
敲擊檢測屬于聲振無損檢測方法的一種[1],最早用于車輪的完整性檢測,現應用范圍逐漸擴大到陶瓷[2]、航天復合材料[3]、蠕墨鑄鐵件[4]、風力機葉片[5]檢測等領域。在特種設備檢測中也常使用檢驗錘敲擊鍋爐進行宏觀檢驗[6],可以對金屬材料的開裂、劣化、腐蝕、結垢等進行初步判斷。
降低敲擊檢測主觀性的傳統方法是利用傳感器記錄下敲擊對象聲振的幅值頻率等信息,通過對敲擊信號時頻域特征參量的研究來判斷被檢對象的缺陷或故障狀況[7-8],再結合具體模型進行故障診斷[9-10]。上述方法主要從聲振檢測理論出發,比較依賴信號處理技巧和專家的知識經驗,在實際應用中有一定的局限性。文章將在對敲擊信號頻域特征分析的基礎上,借助于智能語音識別技術,提出一種基于改進的高斯混合-隱馬爾可夫模型(GMM-HMM)的敲擊檢測模型,模擬檢測人員從敲擊中“聽出”缺陷的過程,并通過試驗對模型的有效性和魯棒性進行驗證。
HMM(隱馬爾可夫模型)以概率統計理論為基礎,廣泛應用于語音識別等多個領域[11-12],其包含了兩個雙隨機過程,可用參數{S,X,Π,A,B}來描述:
S=(s1,s2,…,sN-1,sN)
(1)
X=(x1,x2,…,xM-1,xM)
(2)
Π=(Π1,Π2,…,ΠN-1,ΠN)
(3)
A=[aij]N×N,aij=P(qt+1=sj|qt=si),
1≤i,j≤N
(4)
B=[bjk]N×M,bjk=P(ot=vk|qt=sj),
1≤j≤N,1≤k≤M
(5)
式中:S為隱藏狀態;N為隱藏狀態數;X為L維的觀測狀態序列;M為觀測狀態數;Π為狀態初始分布概率;A為狀態轉移概率矩陣;aij為從時刻t到t+1時狀態si轉移到狀態sj的概率;qt,ot分別為t時刻的隱態狀態和觀察狀態;B為狀態發射矩陣;bjk為t時刻隱藏狀態sj生成觀察狀態vk的概率。
文章利用HMM實現兩個目的:① 學習訓練,給定觀測序列樣本集X,尋找最佳的HMM參數{S,Π,A,B};② 模式識別,給定HMM參數和觀測序列X,求解概率最大的隱藏狀態序列S。
當X為連續值時,bjk可用GMM(高斯混合模型)(μ,σ,w)來描述[13],其中μ,σ分別為序列X的平均值和標準差,w=(w1,w2, …wm)為高斯子分布權重,m為高斯子分布數。
采用EM(期望最大化)算法對GMM-HMM參數{Π,A,(μ, σ,w)}進行迭代更新,采用Viterbi 算法計算模型的總輸出概率,當收斂率RC滿足式(6)時停止迭代。

(6)
式中:Poutl-1,Poutl分別為模型在第l-1次、第l次迭代時的總輸出概率。
試驗制作人工試件來模擬金屬部件存在的凹坑、開裂、夾層、局部減薄、對接焊縫、環向裂紋等情況。1#平板試件無缺陷,2#平板試件底部開孔,3#平板試件的邊緣至中心設有垂直表面的開裂缺陷,4#平板試件一半厚度處設有夾層缺陷,5#平板試件底部的中心減薄,6#平板試件設有對接焊縫,7#鋼管試件一半長處設有環向裂紋,8#鋼管試件的端部焊縫處設有環向裂紋,9#鋼管試件無缺陷。平板試件的尺寸均為400 mm×400 mm×30 mm(長×寬×高),無縫鋼管試件尺寸(直徑×壁厚)為50 mm×3 mm,長度為1 000 mm, 材料為低碳鋼。信號采集系統主要包括動態信號測試分析儀、力錘、加速度傳感器和聲音傳感器,其組成如圖1所示,系統采樣頻率為51.2 kHz,圖2為該系統在1#試件上采集到的連續30次敲擊的聲信號。

圖1 敲擊信號采集系統組成

圖2 1#試件上采集到的敲擊聲信號

圖3 去噪前后的敲擊聲信號
首先對信號進行“五點三次滑動”濾波,然后用小波包基函數對平滑后的信號進行5層小波包去噪(軟閾值為0.05),處理后的信號尖端噪聲明顯降低,且沒有明顯的相位和波形畸變(見圖3);最后采用最大值法對去噪后的信號進行標準化。采用狀態機法根據短時能量、短時過零率、最小等待長度等參數綜合判斷各幀所處的狀態(敲擊等待、模糊、敲擊進行、敲擊結束),并把敲擊信號分割成單獨的信號段[14]。分割后的信號段長度稍有差別,為了方便后續信號處理,取以上各信號段長度的中值為參考對信號進行分段,分段結果如圖4所示。

圖4 敲擊聲信號的分段結果

圖5 1#試件某次敲擊采集到的信號波形及其頻譜
圖5為1#試件某次敲擊采集到的信號波形及頻譜,可以看出敲擊聲信號和敲擊振動信號的頻率峰出現的位置基本一致。這是因為二者為同源信號,信號特征都是由構件的振動模態和結構特性決定的[15]。圖6為敲擊力增大時的信號(試件不變),可見該信號與圖5的時域波形高度相似且頻譜峰重疊,說明了在一定的敲擊力度范圍內,敲擊力的大小對構件的振動模式影響較小。

圖6 1#試件敲擊力增大時的敲擊聲信號及頻譜

圖7 1#~4#試件的敲擊聲信號頻譜
圖7為1#~4#試件的敲擊聲信號頻譜,可以看出1#,2#試件的敲擊聲頻率分布高度相似,但4個主要譜峰向低頻端偏移了49,36,59,89 Hz,且最高峰位置也發生了轉移;3#和4#試件含有開裂和夾層缺陷,其對試件的結構完整性的破壞力度更大,信號頻率主峰向低頻端偏移的現象更嚴重,雜散峰數量也明顯增多。

圖8 7#9#試件的敲擊聲信號頻譜
圖8為7#~9#鋼管試件的敲擊聲信號頻譜,其中7#和8#試件的頻率幅值分別人為上移了0.01,0.035,可以看出3個試件的頻率曲線比較相似,頻率峰值集中在3 500~4 000 Hz,從圖8(b)的局部細節圖可看出無缺陷的9#試件在3 747 Hz處有1個主頻率峰,而存在環向裂紋的7#,8#試件在3 747 Hz附近發生了主峰分裂,峰值降低較大,最高峰位置也發生了一定偏移。
上述敲擊過程可用圖9所示的彈簧模型進行解釋[16]。敲擊右邊完好部位相當于敲擊一個彈性系數為kc的彈簧;敲擊左邊缺陷部位,相當于在右邊完好構件的彈簧模型上串聯一個彈性系數為kd的彈簧,kd與缺陷深度h,缺陷長度l以及被敲擊部位的截面慣性矩等有關。假設局部敲擊時系統中運動部分的抽象質量為m,等效彈簧的彈性系數為k,x和分別為局部位移和局部位移加速度,則有

(7)
式中:fc為構件的振動頻率。
在完好構件部位k=kc,而在缺陷部位k=kc×kd/(kc+kd) 圖9 敲擊檢測的彈簧模型 薄壁鋼管的敲擊檢測模型如圖10所示。環向裂紋處相當于一個長度為0的自由面,瞬時敲擊振動波UI沿著管壁傳播,遇到裂紋面時會產生反射波UR與透射波UT。假設裂紋的等效面積為Sc,無損傷處的管壁面積為S0,當忽略相位變化時,UR和UT有以下近似關系 UR(0,ω)=CUI(0,ω) (8) UT(0,ω)=KUI(0,ω) (9) 式中:ω為振動波的角頻率;C,K為與Sc/S0有關的常數項。 圖10 薄壁鋼管的敲擊檢測模型 根據能量守恒關系有 (10) 由式(8)(10)可知,當薄壁直管段上存在環向裂紋時,振動波的傳播不可避免地被裂紋自由面所影響,管段上的振動波也以裂紋面為界分為不同的兩部分,這也是圖8中7#,8#試件在3 747 Hz頻率處發生譜峰分裂的原因。 互相關分析可以用來衡量兩個周期信號隨時間變化時的相關性,圖11為敲擊信號的互相關系數Rxy(m)曲線(m=1, 2, 3,…,3 000,為信號的采樣延遲數),可以看出Rxy在零點上下呈周期性振蕩,但同類試件敲擊信號Rxy曲線的標準差要遠大于不同類試件Rxy曲線的標準差,該特性可以用來驗證兩種信號是否源自同一類別。 圖11 敲擊信號的互相關分析 在語音識別方面,最常用到的語音特征就是梅爾頻率倒譜系數(MFCC),其可描述人耳頻率的非線性特性[17]。敲擊信號經預加重、分幀、傅里葉功率譜提取、24維度三角梅爾濾波器組濾波和離散余弦變換后得到梅爾系數,舍棄后12維系數并用前12維系數的一階差分替換,最終得到24維的MFCC參數,MFCC參數的灰度映射圖如圖12所示。 圖12 MFCC參數的灰度映射圖 敲擊樣本分為訓練和測試兩個樣本集,每個試件的訓練樣本子集包含80~100個樣本,測試集大小約為訓練集的1/4,GMM-HMM模型包括9個與試件類別相對應的子模型,隱藏狀態數為6,其發射概率由m個高斯子分布函數決定,主要參數可由K-mean等聚類算法得到,文章在參數初始化時引入Calinski-Harabasz 指標對不同m值的聚類效果進行評價,選取最優的m值。采用EM算法進行訓練,當收斂率小于5×10-6時停止訓練,圖13為分別利用敲擊聲信號得到的模型A和利用敲擊振動信號得到的模型B的收斂率曲線,圖中縱坐標為對數收斂率。 圖13 GMM-HMM訓練時不同模型的收斂率曲線 在無噪聲干擾時,模型A和B的識別率分別為96.3%,100%,表現出良好的識別效果。在測試信號上混入一定強度的高斯白噪聲(見圖14),混入噪聲后的信噪比為30 dB(假設原始信號中不含噪聲),此時模型A和B的識別率分別為57.4%,72.1%;在信噪比為25 dB時,則為54.8%,61.0%,識別率隨著噪聲增大而急劇降低。圖15為模型A和B對9類試件的識別率,在噪聲環境下,模型A不能正確識別3#,4#,7#,8#試件,模型B不能正確識別1#,3#和4#試件。 圖14 混入高斯白噪聲前后的敲擊聲信號 圖15 GMM-HMM對不同類別試件的識別率 圖16 “二元信息融合+互相關性反向決策”算法流程圖 4.2.1 二元信息融合+互相關性反向決策 為了提高GMM-HMM的魯棒性,采用 “二元信息融合+互相關性反向決策” 算法對其進行改進,改進流程圖如圖16所示。主要步驟為:① 提取敲擊聲信號T1,T2,…,T9作為參考信號;② 計算總概率序列Pout=PoutA×w1+PoutB×w2,PoutA,PoutB為模型A,B的輸出概率序列,敲擊聲信號權重系數w1、振動信號權重系數w2均為0.5;③ 利用“互相關性反向決策”算法對概率序列Pout中排在前3位的輸出值進行校驗和重新排序。在30 dB和25 dB的信噪比下,采用“二元信息融合”算法(模型C)對信號進行識別得到的識別率分別為87.4%,80.0%; 采用“二元信息融合+互相關性反向決策”算法(模型D)對信號進行識別,得到的識別率則為97.8%,90.4%,優于模型C的。與采用單一信息的模型A、 B相比,模型D綜合了敲擊聲和敲擊振動信息,又利用“互相關性反向決策”對識別結果進行校驗,進一步提高了識別率。 4.2.2 二元信息融合+噪聲泛化 在10 dB信噪比的噪聲環境下,模型D的識別率僅為58.9%,已不能滿足工程需求。在深度學習中常采用噪聲泛化來提高訓練集的多樣性[18],文章采用類似的方法在初始訓練集中混入一定強度的高斯白噪聲(10~30 dB的隨機信噪比),然后和初始訓練集共同組成新的訓練集。圖17為采用“二元信息融合+噪聲泛化”算法的模型在不同信號融合權重時的識別率,橫坐標最大值1表示只使用敲擊聲信號進行識別。從圖17可以看出,當w1=0.6時,模型的識別率最高,此時,記該模型為模型E。此外,由于添加噪聲的影響,模型E再融合“互相關性反向決策”算法并不能進一步提高識別率,甚至還會降低識別率。 圖17 “二元信息融合+噪聲泛化”模型在不同信號融合權重時的識別率 圖18為模型E和D在不同信噪比下的識別率,可見模型E的識別率明顯優于模型D的,其在10,5 dB信噪比時的識別率分別為99.3%,80.4%,表現出較強的魯棒性。進一步地,模型E與參考文獻[19]建立的20層卷積神經網絡模型(CNN)進行對比,在信噪比為10 dB時模型E的識別率要優于基于敲擊振動信號的CNN模型(98.2%)的識別率,稍低于基于敲擊聲信號的CNN模型(100%)的,但文章所構建模型的可解釋性要優于CNN模型的,而且對硬件設備的要求也相對較低,更適合工程應用。 圖18 模型E和D在不同信噪比下的識別率 (1) 在局部敲擊激勵下,金屬部件的敲擊信息與被敲擊部位的結構完整性密切相關,特定的頻域特征峰對應著特定的缺陷形式;缺陷的存在會導致敲擊信號的頻譜向低頻段移動或頻率主峰發生分裂,通過互相關系數分析可以驗證兩種信號是否源自同一類別的缺陷。 (2) 利用敲擊聲和敲擊振動信號的MFCC特征參數構建的GMM-HMM模型可以有效識別出不同的缺陷試件,但識別結果易受到噪聲影響。 (3) 經“二元信息融合+噪聲泛化”算法改進后的GMM-HMM模型在敲擊聲信號融合權重為0.6時,識別率達到最優,在信噪比為10 dB時的識別率為99.3%,相關算法模型可用于特種設備金屬部件內部缺陷的快速敲擊識別及其他智能化無損檢測領域。


3.2 敲擊信號的互相關分析

3.3 MFCC特征集

4 缺陷識別模型搭建與試驗結果分析
4.1 GMM-HMM模型搭建




4.2 GMM-HMM模型改進


5 結論