孫 瑞,左言言,吳傳剛
(江蘇大學 振動噪聲研究所,江蘇 鎮江212013)
聲品質主觀評價需要消耗大量的人力和時間,學者提出建立基于主觀評價預測模型的客觀評價法。目前聲品質客觀評價參數主要有基于物理聲學和心理聲學的評價參數[1-2]。文獻[3]應用支持向量機建立基于心理聲學參數的聲品質預測模型,并將預測結果與多元線性回歸模型進行對比,得出應用基于支持向量機的預測模型預測精度更高;文獻[4]提出一種基于Adaboost算法的車內噪聲聲品質預測模型,以心理聲學參數作為輸入,主觀評價值作為輸出,經試驗驗證,該預測模型的預測精度較理想;文獻[5]提出基于小波變換的沖擊噪聲聲品質客觀評價參數,并構建多元線性回歸預測模型,結果表明該客觀參數可以很好地反映沖擊信號的特征。文獻[6]建立基于心理聲學參數的粒子群-廣義回歸神經元網絡預測模型,用于變速箱殼體激勵噪聲聲品質的預測;文獻[7]利用集總經驗模式分解技術提取傳動系噪聲聲信號特征,建立經遺傳算法優化的小波神經網絡預測模型。由此可知,聲品質的客觀評價主要停留在基于心理聲學參數構建預測模型上,僅考慮信號在時域或頻域上的特征,聲信號對人的影響反映不足,因而基于此參數建立的聲品質預測模型的精度有待提高。
文中在時頻和頻域上對聲信號進行分析,提取出新的客觀參量,建立聲品質評價模型。利用互補集成經驗模式分解法(CEEMD)對聲信號進行分解,再進行Hilbert變換(HT),并引入臨界頻帶值對各信號的瞬時頻率進行計權,計算各信號的計權能量值;然后將計權能量值作為聲品質評價的客觀參量,構建聲品質預測模型。以混合動力汽車動力耦合機構處的噪聲為研究對象,分別利用心理聲學參數和基于CEEMD-HT 法得到的計權能量值建立聲品質評價模型,將評價結果與主觀評價結果對比,以檢驗基于CEEMD-HT法構建的聲品質預測模型的精度。
經驗模態分解(EMD)[8-9]本質上是通過信號的特征時間尺度獲得本征波動模式,實現對信號的逐層分解。EMD算法的具體分解步驟如下:
(1)對于原信號x(t),首先找出其所有的局部極大值和極小值,然后利用三次樣條插值法形成上包絡線u1(t)和下包絡線u2(t),則局部均值包絡線m1(t)可表示為:

(2)將信號x(t)減去局部均值包絡線m1(t),可得第一向量h1(t):

(3)判斷h1(t)是否滿足本征模函數(IMF)分量的條件。若不滿足,則將h1(t)視為信號x(t),重復式(1)和式(2)的分解步驟直至得到滿足IMF 要求的hb(t)。將hb(t)記作原信號的第一個IMF分量c1(t),則原信號的剩余量r1(t)可表示為如下形式:

(4)對剩余量r1(t)做同樣的分解,當第n階殘余信號rn(t)基本呈單調趨勢或為一個常量時停止分解。最終可得到IMF分量。原信號x(t)可表示為如下形式:

其中:cj(j=1,2,...,k)表示分解后的各階IMF分量。
采用CEEMD 技術對聲信號進行分解,得到聲信號的各階IMF分量;然后利用HT 獲得各階IMF分量的瞬時幅值和瞬時頻率,以此來分析聲信號在不同時間尺度上的局部特征。具體操作步驟如下[10-11]:
(1) 在待處理的聲信號中加入n組正負成對的高斯白噪聲,得到2n個重構聲信號。

其中:M1、M2分別為加入正、負高斯白噪聲后的信號;S為原信號;N為輔助高斯白噪聲信號,且其幅值為原信號的0.2倍。
(2)分別對2n個重構聲信號進行經驗模態分解,對每個信號均可得到一組IMF分量cij。cij表示第i個重構聲信號的第j階IMF分量;
(3)將各信號相同階數的IMF分量進行集總平均,求得原信號的IMF分量。

其中:Cj為原信號經過CEEMD 后的第j階IMF分量。
(4) 對經CEEMD 分解得到的各階IMF分量進行希而波特變換(HT):

其中(t)為經CEEMD處理后第j階IMF分量Cj的希爾波特變換。
(5)構造復信號Gj(t):

其中:aj(t)為Gj(t)的瞬時幅值,θj(t)為Gj(t)的瞬時相位。
(6) 計算各階IMF的瞬時幅值aj(t)和瞬時頻率fj(t):

人的聽覺系統具有掩蔽效應,但是當聲信號的頻率差超過閾值時,人耳可以辨別出不同頻率信號的聲音。Zwicker 等據此提出臨界頻帶的概念,將20 Hz到20 000 Hz 內聲信號的頻率分為24個臨界頻帶,每個相同臨界頻帶內的聲信號具有相同的臨界頻帶值。信號的頻率越高,其所在的臨界頻帶值越大[12]。將瞬時頻率所在的臨界頻帶值作為計權值,以增強信號中高頻成分的影響。然后通過對瞬時頻率進行計權得到計權后的IMF分量,其計算公式為

式中:hj表示計權后的第j階IMF分量,fj表示瞬時頻率,zj表示fj所在的臨界頻帶值。
接著計算計權后IMF分量的能量值,將計權能量值作為新的客觀參量,其計算公式如式(13)所示:

其中:Ej表示計權后第j階IMF分量的計權能量值,N為離散后的信號點數,hj(t)為計權后的第j階IMF分量,Δt為采樣時間間隔。
相關向量機(RVM)是一種基于貝葉斯框架構建學習機的稀疏概率模型[13],與支持向量機相比,RVM模型的泛化能力更強,準確率也更高[14]。設RVM模型的輸出為

其中:{φj}表示模型的基函數,一般選擇高斯函數作為基函數;{ωj}表示模型的權值。
然后利用最大似然法訓練模型的權值{ωj},提高模型的泛化能力。權值ωj的先驗概率分布為

式中:aj表示決定權值{ωj}先驗分布的超參數。

采用貝葉斯公式計算權值的后驗概率分布:

通過對權值變量進行積分訓練目標值,并求得超參數的邊緣似然分布:

式中:C表示協方差;A表示(a0,a1,...,aN)的對角矩陣。
若給定模型的輸入值x,則模型輸出的概率分布如式(20)所示,且其服從高斯分布:

其中:y*表示預測均值:

σ2*表示預測方差:

RVM很好地解決了模型的參數選擇問題,具有較好的適用性,適合本研究事件的訓練與預測。
以混合動力汽車動力耦合機構處噪聲為例,分別利用CEEMD-HT 法提出的計權能量值和心理聲學參數建立聲品質RVM評價模型,并將兩模型的評價結果與主觀評價試驗結果進行對比,驗證CEEMD-HT法的有效性。

表1 試驗工況
參考GB/T 18697-2002 標準,采用LMS 公司的SCADAS數據采集系統,并采用LMS.Test.Lab數據采集軟件,進行某混合動力汽車的噪聲試驗。在混合動力汽車動力耦合機構正上方布置一個傳聲器,采集動力耦合機構處的噪聲信號,聲信號的采樣時間為30 s。試驗工況如表1所示,包括不同車速下的電機驅動工況、發動機驅動工況以及混合驅動工況。
對采集到的噪聲信號進行處理,剔除有問題的噪聲信號,再利用Artemis軟件選取聲信號中波形變化較平穩的時間段,截取長度為5 s的聲樣本,最終得到54個聲樣本。通過Artemis軟件對54個聲樣本進行等響處理,避免在主觀評價試驗中各聲樣本之間響度差異所造成主觀感受的偏差[15]。
聲品質的主觀評價是評價主體根據自身的聽覺感受,按照評價標準對聲信號進行打分[16-17]。
3.2.1 主觀評價試驗設計
進行主觀評價試驗時采用耳機和揚聲器在試聽室內播放和收聽聲音樣本,其背景噪聲符合標準。本次主觀評價試驗選擇21 位振動噪聲控制方向的在校研究生作為評價主體,以煩躁度作為評價指標,采用成對比較法對采集的聲樣本進行主觀評價。
采用成對比較法時先將聲樣本成對組合,然后評價主體根據事先規定的評價標準(煩躁度)對這些聲樣本打分,此種方法適合沒有評價經驗的人員且評價結果較準確[18]。
3.2.2 主觀評價試驗的結果分析
主觀評價試驗結束后,使用SPSS軟件計算評價主體之間的相關系數,將相關系數的算術平均值作為評價主體的相關系數值,相關系數值越高表示該評價主體的穩定性越好[19],如表2所示。
由于表2中第6個評價者、第15個評價者和第18個評價者的相關系數低于0.75,為保證實驗的準確性應將其評價結果刪除。再對各個聲樣本的打分進行集總平均,并對結果進行歸一化處理,最終得到各個工況聲樣本的主觀評價值,如表3所示。本次試驗中主觀煩躁值越高,動力耦合機構處的聲品質越差。
3.3.1 心理聲學參數的計算
選取響度、波動度、尖銳度、音調度和粗糙度5個心理聲學參數用于聲品質的研究。在對采集到的聲樣本進行預處理后,使用Artemis軟件計算聲樣本的心理聲學參數值,計算得到的54個聲信號的心理聲學參數值見表4。
3.3.2 計權能量值的計算
利用Artemis中的濾波器對噪聲信號進行濾波,濾掉低于人耳聽閾的低頻噪聲。接著對處理后的聲樣本進行CEEMD 分解,共加入200個高斯白噪聲,集總平均次數為200次,得到聲樣本的各階IMF分量,圖1為第一個聲樣本的各階IMF分量。從圖中可以看出IMF分量的能量值隨階數的上升越來越小,波動也趨于平穩。然后使用相關系數r分析各階IMF分量和原信號間的相關程度,具體的計算公式如下:

表2 評價主體斯皮爾曼相關系數

表3 聲樣本主觀評價值

表4 聲樣本的心理聲學參數

其中:x表示IMF分量,y表示原信號,和分別表示IMF分量的平均值和原信號的平均值。相關系數r值較大,表示分解的結果能反映出原信號的更多特征。表5為穩態工況聲樣本經過CEEMD 分解后的各階IMF分量之間的相關系數,從表5中可以看出從第14階開始聲樣本的IMF分量值與前幾階的數值相差一個數量級,則14階往后的IMF分量是趨勢項,可忽略。

表5 各階IMF分量和原信號的相關系數
對相關系數較高的7個IMF分量(IMF5、IMF6、IMF7、IMF8、IMF9、IMF10、IMF11)進行HT,得到相應的瞬時頻率,分析瞬時頻率主要分布的頻率帶,對應臨界頻率帶,可以得到各階IMF的臨界頻率值。根據式(14)和式(15)對這7個IMF分量進行臨界頻帶計權,得到計權后的IMF分量和相應的計權能量值。各聲樣本計權能量值的計算結果如表6所示。
為對比依據心理聲學參數和依據CEEMD-HT法提出的計權能量值所建模型的預測精度,這里建立兩個RVM評價模型,并將評價模型的預測結果與聲品質主觀評價試驗結果進行對比。評價模型1以計權能量值作為RVM模型的輸入,以主觀煩躁度值作為RVM模型的輸出;評價模型2以5個心理聲學參數值(響度、波動度、尖銳度、音調度、粗糙度)作為RVM模型的輸入,以主觀煩躁度值作為RVM模型的輸出。聲品質的主觀評價試驗和兩個RVM 評價模型均使用同樣的聲樣本集(即上文提到的54個聲樣本)。
選擇第1~45個聲樣本為RVM模型的訓練樣本,第46~54個聲樣本為RVM模型的預測樣本,相關向量機模型的預測結果與實際主觀評價值的比較如圖2所示。由圖2可知,基于兩種客觀參量建立的相關向量機模型的預測結果與主觀評價試驗結果有較好的一致性,且第1個模型的預測值與主觀評價值更接近。第1個模型預測值的最大相對誤差為6.72%,平均相對誤差為3.14%,第2個模型預測值的最大相對誤差為8.98%,平均相對誤差為6.64%,如表7所示。這是因為由CEEMD-HT 法提取的計權能量值不僅考慮聲信號在時域上和頻域上的特征,還考慮人的聽覺特性,增強了原信號中高頻成分的影響。由此可得基于CEEMD-HT 提取的計權能量值建立的聲品質評價模型預測精度更高,也驗證了從時頻聯合域上提取噪聲信號特征的方法能更客觀地體現聲信號對人的主觀感受的影響,可提高聲品質評價模型的準確性。

表6 各階IMF分量的計權能量值

表7 RVM評價模型的預測誤差

圖1 第1個聲樣本各階IMF分量
本文提出一種從時頻聯合域上分析聲信號特征、提取聲品質客觀參量、構建聲品質評價模型的方法。通過具體的實例驗證可以得出以下結論:

圖2 聲樣本評價模型的評價結果
(1)基于CEEMD 和HT的客觀參量提取方法將瞬時頻率所在的臨界頻帶值作為計權值,增強了信號中高頻成分對整個信號的影響,更客觀地體現聲信號對人的影響,保證聲品質評價模型的準確度。
(2)基于CEEMD-HT法建立的聲品質評價模型的預測值與實際主觀評價值間的相對誤差更小,說明了基于從時頻聯合域提取的計權能量值建立的RVM 評價模型的預測結果比基于心理聲學參數建立的評價模型更加符合人的主觀感受。
從最終結果可以看出該方法的有效性和優越性,因此這種基于時頻聯合域提取聲品質客觀參量的方法不僅可以減少主觀評價試驗中人力和物力的投入,降低試驗成本,還可以更客觀地體現聲信號對人的影響,提高聲品質評價模型的預測精度。