馬志遠,王洪波,孫 晴
(湖南大學 汽車車身先進設計制造國家重點實驗室,長沙410082)
關門聲品質是消費者對車輛最初的直觀感受之一,直接影響消費者的購車意愿。為得到準確的聲品質評價結果,往往要進行主觀評價實驗,但該過程所花費的時間和人力較多,且評價結果隨人群差異有較大波動。為此,國內外學者研究出了一些聲品質預測方法。
關門聲預測主要分兩個方面研究:信號特征參數和預測模型。在信號特征參數的研究中,主要有心理學參量、小波熵系數[1]、信號能量、峰值、均值[2]等。預測模型的研究有多元非線性回歸、神經網絡和支持向量機等。傳統心理學參量是基于頻域的計算方法得到的,對非穩態噪聲的預測效果不佳[3]。對于同一類噪聲,不同的預測模型在預測精度和預測效率上有較大的差異。信號特征的提取與預測模型的選擇對關門聲品質預測具有重要意義。
相比其他時頻分析方法,EEMD[4]并不涉及到任何頻域的內容,完全由自身性質出發,克服了傅氏變換在處理非線性、非平穩信號的不足,同時解決了EMD分解中的模態混疊問題;基于EEMD分解的樣本熵[5]能有效反映序列的復雜度,可有效表征信號特征;小波在緊支集中能任意逼近非線性連續函數的特點和它在時頻域都有分辨的特點,使得以小波分析理論為基礎構造的小波神經網絡更適合于學習局部非線性和快速變化的函數[6]。依據上述方法的特征,本文以汽車關門聲為研究對象,以得到準確高效的關門聲品質預測值為目標,提出了基于EEMD 分解的樣本熵和小波神經網絡的聲品質預測模型。通過與心理學參數和BP神經網絡對比,突出了本模型在關門聲品質預測中的優勢。
選用德國朗德公司(Head Acoustics)的數字式仿 真 人 工 頭HMS III(head manual system)以 及SQLab II多通道數據采集記錄器及前端進行關門聲樣本的采集工作。該系統模擬了人的整個聽覺系統,使得其采集的聲樣本能夠準確記錄聲場環境的空間信息,從而保證所采信號用于聲品質的主客觀分析時具有更高的準確度。關門聲品質測量實驗對測量環境有較高的要求,由于實驗條件限制,實驗是在安靜空曠的室外進行的;在采集聲樣本時,汽車為空載,所有車窗處于關閉狀態,輔助裝置停止工作;關門時,保證每輛車的關門角度為60°左右,關門速度控制在1.2±0.05 m/s。設置人工頭系統的采樣率為48 kHz,采樣時間為5 s。實驗選取了12輛不同類別的轎車作為研究對象,共采集得到65個關門聲樣本。聲樣本采集實驗如圖1所示。

圖1 關門聲樣本采集實驗
通過后期對比分析,從中選取26個主觀感覺不同的聲樣本作為本文的分析樣本。將樣本編號為s1-s26。其中聲樣本s1 的時域波形如圖2所示。(注:圖中只顯示了0.7 s的數據)

圖2 聲樣本s1的時域波形
1.2.1 主觀評價過程
聲品質的主觀評價以人為主體,將人工頭錄制的噪聲進行回放,評審人員依據一定的規則對聲樣本的進行評分。常用的聲品質主觀評價方法有排序法、等級評分法、成對比較法、語義細分法等。等級評分法相比其他方法具有簡單快捷,工作量相對較小,評價結果為等級評分數值,便于后續處理分析的優點。本文選擇等級評分法對26 個關門聲樣本進行聲品質評分。以國際上通用的10 刻度等級作為主觀評分量化表法,評分等級如表1所示。

表1 主觀評價試驗評分等級
選取33 名聽力正常、身體健康、年齡在20-45歲之間的在校師生作為主觀評審團成員實施主觀評價實驗,其中男性23名,女性10名。在主觀評價前,先對評價者做相關聽音訓練,確保評價結果的可靠性;聽音實驗在安靜室內進行,采用HD650 型高保真耳機對聲樣本進行回放。為保證評價結果的可靠性,對每個關門聲樣本的全部評價結果舍去最大最小值后取平均值作為該樣本的主觀聲品質得分。部分結果如表2所示。
1.2.2 心理學客觀參數
雖然主觀評價能夠反映評價者對聲音的主觀感受,得到的評價結果更加真實,但由于主觀評價也會受到評價主體間認知、經驗等各種因素的影響,所以很多學者期望采用和心理學相關的聲學參量來量化人們的主觀感受。常用的客觀心理學參數主要有響度、尖銳度、粗糙度、抖動度等。關門聲屬于典型的沖擊性信號,在以往對于關門聲評價有如下幾種指標[7]:主沖擊時間、低頻延續、高頻成分、峰值聲壓級。本文基于文獻[8]來選取心理聲學客觀參數,主沖擊時間對應著響度;低頻延續對應著抖動度,反映了低頻變化;高頻成分對應著尖銳度及粗糙度,尖銳度反映了高頻成分,粗糙度反映了高頻變化;峰值聲壓級對應著A 計權聲壓級。應用軟件Head Artemis7.0 對所有聲樣本的所選心理學客觀參數進行計算。部分結果如表2所示。
EEMD 是對EMD(Empirical Mode Decomposition)改進得到的一種自適應信號處理方法,繼承了EMD 可以按照信號的局部特性實現相應的時頻分解的優點,且有效解決了模態混疊現象,使分解得到的IMF 分量具有更為集中的頻率信息,尤其適用于非線性、非平穩信號的研究。EEMD 算法的核心在于利用高斯白噪聲零均值的統計特性,算法的具體步驟如下:
(1)確定分析信號x(t),向其添加幅值系數為ε的高斯白噪聲,設置迭代次數為N0次,即

式中:wj(t)為第j次添加的白噪聲序列;xj(t)為染噪信號。
(2)對xj(t)進行EMD分解,得到IMF分量;
(3)重復步驟(1)、(2)N0次,且每次采用不同的白噪聲序列;
(4)將所有的IMF分量按層取平均值。即

式中:IMFji為第j次分解的第i層IMF分量。
(5)得到EEMD的分解結果為

式中:rˉ為N0次分解趨勢項的均值。
樣本熵是一種量化時間序列復雜性的度量方法,計算給定時間序列條件概率的自然對數。樣本熵具有得到穩定估計值所需的數據短、抗噪聲和干擾能力強、在參數大取值范圍內一致性好等特點[9],非常適合工程噪聲、振動信號的分析。
對于長度為N的時間序列{u(n)|n=1,2,…,N},給定維數m及相容極限r,樣本熵的計算步驟如下:
(1)將原始數據劃分為一組m維的矢量:X(i)=[u(i),u(i+1),…,u(i+m-1)],i=1,2,…,N-m+1;
(2)定義矢量X(i)與X(j)之間的距離為兩矢量對應元素的最大差值的絕對值,即

(3)對于給定X(i),統計d[X(i),X(j)]<r的數目,記為Bi,并計算其與距離總數的比值,記為Bmi(r)

i,j=1~N-m+1且i≠j
(4)計算Bmi(r)的平均值,記為Bmarg(r)

(5)維度變為m+1,重復(1)-(4)步可得Bm+1arg(r)。這樣Bmarg(r)和Bm+1arg(r)分別為序列在給定相容極限r下匹配m個點和匹配m+1個點的條件概率。
(6)樣本熵的定義為

當N為有限值時,可用下式估算

由樣本熵的定義式可知,當序列長度N一定時,樣本熵的大小與維度m及相容極限r有關。根據Pincus[5]的研究結果,取m=1~2,r=(0.15~0.25)*std(std 為原始序列X(n)的標準差)時,計算得到的樣本熵具有較為合理的統計特性,因此本文取m=2,r=0.2*std。另外,序列長度N的大小也會影響樣本熵值,序列長度越長,樣本熵越穩定,但計算量也會增加。關門聲是一個沖擊噪聲,由圖1的關門聲時域波形可知關門聲的持續時間在0.5 s以內,本文考慮到計算結果合理性與計算復雜度的影響,將所有聲樣本都截取成0.7 s 的數據共33 600 個數據點用于信號特征提取。
以關門聲樣本s1為例,對其截取的0.7 s數據進行信號特征提取的過程如下:

表2 聲樣本的心理學客觀參數值和主觀評分值
(1)高通濾波。由信號的頻譜可知,信號在20 Hz 以下具有較大的幅值,而20 Hz 以下的聲音不在人耳可聽聲頻率范圍內,應予以濾除。
(2)對濾波后的信號進行EEMD 分解。根據研究經驗[4],設置迭代次數為100 次、高斯白噪聲幅值系數為0.4;樣本的前10層分解的結果如圖3所示。

圖3 聲樣本s1的EEMD分解結果
(3)計算EEMD分解的各IMF分量的樣本熵。
(4)將各層分量按分解層順序組成一個10 維特征向量,此即為該樣本信號的基于EEMD 分解的樣本熵特征向量。
將所有研究樣本的信號特征向量提取后記錄在表3中用于后續分析。由于篇幅有限,在此只顯示部分計算結果。
小波神經網絡是在BP神經網絡的基礎上,用神經網絡的權值代替離散小波變換中的系數而構成。小波網絡的基元和整個結構是依據小波分析理論確定的,可以避免BP 神經網絡等結構設計的盲目性;其次小波網絡有更強的學習能力,精度更高;最后對同樣的學習任務,小波網絡結構更簡單,收斂速度更快。小波神經網絡拓撲結構如圖4所示。

圖4 小波神經網絡拓撲結構
設輸入層到隱含層的連接權值為ω1ij,隱含層到輸出層連接權值為ω2jk,輸入向量X=(X1,X2,…,Xn)輸出向量Y=(Y1,Y2,…,Ym)。則可得隱含層神經元的輸入為

隱含層小波函數的表達式為

式中:aj、bj分別為隱含層第j個節點的小波基函數的伸縮因子與平移因子,ψ(x)為母小波函數;
聯立式(9)、式(10)式得隱含層的輸出為

從而可得模型的輸出為

本文選用基于EEMD 分解的樣本熵的10 維特征向量作為模型的輸入,輸出為聲樣本的主觀評分值。即可確定輸入層節點數目為10,輸出層節點數目為1。隱含層的節點數一般按下式確定。

表3 關門聲樣本在各層IMF分量下的樣本熵值

式中:n為隱含層節點數目,m為輸入層節點數目。由此確定小波神經網絡模型結構為10-21-1。選用Morlet小波作為隱含層的傳輸函數,其表達式為

同時,為顯示基于EEMD 分解的樣本熵特征向量及小波神經網絡模型的優勢,建立了基于EEMD分解的樣本熵的BP網絡預測模型、基于心理學客觀參數的小波神經網絡預測模型、基于心理學客觀參數與BP 神經網絡的預測模型。心理學參量如表2所列;BP網絡的傳輸函數選用sigmoid,隱含層神經元數目由n=i+o+a(i、o 分別為輸入輸出層神經元的個數,a取1~10)確定。最終確定各網絡的結構分別為10-12-1、5-11-1、5-8-1。從26 個聲樣本中選取前20 個樣本用于模型的訓練,剩余的6 個樣本用于模型檢測,并對輸入輸出樣本進行歸一化處理。各網絡訓練時采用默認Levenberg-Marquardt算法,設置訓練精度0.01 為網絡收斂條件。由于神經網絡每次的運算結果不同,各模型預測結果取模型運行100次后的均值,如圖5和表4所示。
其中表4中的決定系數用于表征模型的預測效果,其計算公式如下
式中:yi分別為樣本i的主觀評分實際值與預測值,為實際值的均值。決定系數越大,預測越準確。可以看出,模型#1 預測效果最好,平均相對誤差為2.52,均方誤差函數為0.23,決定系數為0.971 1。對比模型#1 和#3、#2 和#4,可知IMF 樣本熵較心理學參數更優;對比模型#1 和#2、#3 和#4 可知小波網絡較BP網絡預測更準確,運行時間更短。模型#1更適合于關門聲品質預測。
對采集的關門聲樣本進行EEMD 分解,得到反映時頻特征的IMF 分量。在此基礎上,計算IMF 分量的樣本熵,并按順序組合成10維特征向量。由此向量預測汽車關門聲品質的效果較心理學客觀參數更優;構建了基于Molert 小波基的小波神經網絡的關門聲品質預測模型。并將之與BP 網絡構建的模型作為對比,結果顯示基于小波神經網絡的預測模型精度更高,訓練速度更快。綜上,基于EEMD分解的樣本熵與小波神經網絡的聲品質預測模型可有效應用于汽車關門聲品質預測。

圖5 各模型的關門聲品質預測結果

表4 各模型的關門聲品質預測效果對比