李志偉,蘇 宇,張 舜,王青春*
(1.北京林業大學 工學院,北京 100091;2.安徽路必達智能科技有限公司,安徽 合肥 230031)
隨著社會經濟的快速發展、生活水平的顯著提高,汽車使用量快速增多,隨之帶來的汽車噪聲問題也越來越嚴重。噪聲會對人的聽力、視覺、神經系統和內分泌系統等造成傷害。汽車噪聲是道路交通噪聲的主要來源,輪胎是汽車噪聲重要的噪聲源之一,尤其是汽車的行駛速度達到70 km·h-1以上時,輪胎噪聲是汽車噪聲的主要組成部分[1]。為了減少噪聲污染,世界多國對輪胎噪聲有嚴格規定[2]。輪胎通常采用經驗設計方法,其噪聲性能需對成品輪胎進行試驗來獲取,在設計輪胎花紋的初期很難對輪胎的噪聲性能進行有效評估,具有很大的盲目性[3]。因此,開發預測輪胎花紋噪聲值的模型顯得尤為重要。
對輪胎花紋噪聲值的預測研究通常采用理論解析方法得出若干半經驗理論公式,或采用有限元分析方法對輪胎模型進行噪聲仿真。李福軍等[4]通過對不同花紋輪胎發聲機理的研究,建立預測數學模型,模擬計算花紋溝的發聲情況,結果顯示,花紋溝的深度和寬度對輪胎噪聲的影響不大,而花紋溝的角度對輪胎噪聲的影響較大。蔡昶文[5]采用數值仿真驗證泵吸噪聲理論,并對不同強制位移下輪胎花紋溝的泵吸噪聲進行分析,實現了對輪胎噪聲的量化模擬及預測。馮希金等[6]以輪胎花紋和胎冠進行三維建模得到的加速度場作為聲源,采用有限元方法對輪胎滾動噪聲進行分布預測,證明頻率在1 000 Hz以下的輪胎滾動噪聲主要是由花紋的沖擊振動引起的。然而,采用上述方法對輪胎噪聲進行預測的準確率較低,花費時間較長,并且在實際運用中很難批量處理復雜花紋的輪胎,因此研究輪胎花紋結構與花紋噪聲值之間的關系十分困難。
近年來,深度學習技術在人工智能領域有著飛速的發展,因其學習能力強、覆蓋范圍廣、適應性好等優點,在圖像識別、自然語言處理等領域有著廣泛應用。S.LUCAS等[7]利用2個人工神經網絡ANN1和ANN2分別預測了輪胎的花紋噪聲和非花紋噪聲,其中ANN1的輸入是由數字化三維胎面花紋計算得來的胎面輪廓譜和空氣體積速度譜。優化后的神經網絡能很好地預測車輛行駛過程中輪胎與路面相互作用引發的噪聲。清華大學的項大兵等[3]在大量不同花紋輪胎噪聲試驗的基礎上,建立了輪胎花紋幾何結構與噪聲試驗結果之間的BP神經網絡模型,采用該模型預測輪胎噪聲的準確度達到了85%。韓國仁荷大學的L.SANGKWON 等[8]提取28條試驗輪胎花紋印痕的圖像特征,將花紋圖像和實測功率譜分別作為卷積神經網絡(CNN)的輸入和輸出,預測功率譜與實測功率譜的相似度達到89%。
本工作提出了一種基于深度學習中CNN的預測方法,其不依賴于物理理論模型,而是提取輪胎花紋的圖像特征,通過訓練學習輸出不同花紋圖像對應預測噪聲值的數學模型,并對比研究CNN模型和BP神經網絡模型對相同輪胎花紋噪聲值的預測精度。
基于CNN模型預測輪胎花紋噪聲值的流程如圖1所示,主要有對輸入圖像的預處理、構建神經網絡和預測輪胎花紋噪聲值幾部分。輪胎花紋圖像經過處理后,直接輸入到搭建好的CNN中學習、訓練,并預測噪聲值。

圖1 基于CNN模型預測輪胎花紋噪聲值的流程圖
輪胎花紋圖像在輸入CNN模型之前需要進行預處理。首先選取可以體現整個輪胎花紋特征的區域進行剪切,對剪切后的圖像進行銳化處理以增強花紋溝的邊緣輪廓,使花紋溝與花紋塊清晰可分辨,然后用高斯濾波等方式去除圖像上的噪點,對圖像進行優化。忽略花紋深度造成的影響[2],將圖像進行灰度處理以突出花紋溝和花紋塊的形狀特征,如圖2所示。

圖2 輪胎花紋圖像處理
經過灰度處理的輪胎花紋圖像的像素較大,為400×400,若直接輸入到CNN模型中,CNN提取圖像特征的時間過長,為了縮短CNN模型的訓練時間,需要在不丟失與圖像噪聲有關信息的前提下,采用小波變換的方法將圖像的像素壓縮至100×100,壓縮前后圖像如圖3所示。

圖3 壓縮前后圖像
從圖3可以看出,壓縮前后圖像的花紋溝、花紋塊沒有明顯差異。
灰度化后圖像的像素為0~255,為減少圖像輸入CNN后模型的運算量,將灰度化后輪胎圖像的像素用公式(1)歸一化至0~1,即
式中,Pold為歸一化前的像素值,Pnew為歸一化后的像素值。
CNN在圖像識別領域有著重要的應用,選擇CNN來預測輪胎花紋噪聲值。CNN是包含卷積操作、權值共享、局部連接的前饋神經網絡,其主要包括輸入層、卷積層、池化層、全連接層和輸出層[9]。輸入層的作用是將圖像輸入網絡。卷積層的作用是提取輸入圖像的信息,被提取的圖像信息被稱為圖像特征,圖像特征由圖像中的每個像素通過獨立或者組合的方式體現,比如圖像的紋理特征、顏色特征等。池化層的作用是對圖像特征進行挑選,通過降低特征圖像的分辨率獲得具有空間不變性的特征,起到二次提取特征的作用[10],常見的池化操作有最大池化和平均池化。全連接層的作用是將池化層得到的特征矩陣轉化成一維的特征向量,數據將進行由多到少的映射,實現端到端的學習過程,提高網絡的魯棒性。數據從全連接層到輸出層會再一次減少,變成更低維的向量,這個向量即為噪聲預測值。本工作構建的CNN模型結構如圖4所示。CNN模型含有3個卷積層,每個卷積層后各有1個池化層,最后有1個全連接層。3個卷積層的卷積核大小均為3×3,分別有8,16和32個;3個池化層的池化核大小均為2×2,分別有8,16和32個。花紋圖像經過卷積、池化提取特征后,將二維數據壓縮成一維數據輸入到全連接層,全連接層的輸出數據即為輪胎花紋的噪聲值。為了提高模型的預測精度,本文在用CNN模型預測輪胎花紋噪聲值時,將不同輪胎花紋的噪聲值標簽用公式(2)進行歸一化處理,即模型在訓練和測試后得到的輸出值(P)均處于0~1之間,再將P通過公式(3)進行反歸一化處理,得到真實的噪聲值標簽(Lt)。

圖4 CNN模型結構
式中,L為當前噪聲值標簽,Lmin為最小噪聲值標簽,Lmax為最大噪聲值標簽。
本工作采用某公司提供的商用輪胎樣本進行花紋噪聲預測,樣本總數為94個,按照7∶3的比例將樣本隨機劃分為訓練集和測試集,即將65個樣本的花紋灰度圖像作為訓練集的輸入,將29個樣本的花紋灰度圖像作為測試集的輸入,輸出為輪胎花紋所對應的噪聲值。
本工作采用的CNN模型是基于輪胎花紋圖片數據集,使用Python編程語言,在Tensorflow環境平臺搭建完成的。通常,CNN使用學習算法來調整其自由參數(偏差和權重),以獲得理想的網絡輸出。用于此目的的最常見的算法是反向傳播,反向傳播計算目標(成本/損失/性能)函數的梯度,以確定如何調整網絡的參數,以最小化影響性能的錯誤。本工作采用的AdaGrad算法是一種具有特定參數學習率的優化器,可以根據參數在訓練期間的更新頻率進行自適應調整。該優化算法在陡峭處的學習速率小,防止振蕩,在較為平緩處的學習速率較大,使參數能夠快速更新,在一定程度上可以避免越過極小值點,提高網絡模型預測的準確度,學習效率較高。AdaGrad的計算公式如下:
式中:t為當前迭代次數;gi為函數第i次迭代的梯度;σt為所有梯度的均值平方根;Ψ為常數,初始值為1×10-7(為了防止分母為0的情況);lr為學習率,初始值為0.01。
激活函數使用Relu,當輸入值大于0時,輸出值等于輸入值,當輸入值小于或等于0時,輸出值為0。由于輸出值總是非負數,使用Relu可以消除激活函數中的“梯度消失”問題,這對CNN模型學習非常有幫助。損失函數采用均方誤差、評價函數采用平均絕對誤差來表示模型的預測值與真實值的偏差程度,從而衡量模型的可靠性。訓練CNN模型的一個常見問題是過度擬合,導致經過訓練的網絡在測試集上的性能不佳,這會影響模型對未顯示的數據進行概括的能力,可以采用Dropout層隨機刪除部分神經元以防止過度擬合,其參數值設置為0.2,表示隨機20%的神經元為零權重。
而對于BP神經網絡的測試訓練,用到的輪胎花紋圖像樣本也為灰度圖像,用PCA降維法從中提取100個相互獨立的特征參數輸入到模型中。本工作構建的BP神經網絡也為3層,分別為輸入層、隱含層和輸出層,輸入層和隱含層各有100個神經元。文獻[8]中BP神經網絡的輸出層為10個神經元,將輸出的預測噪聲值標簽以1 dB為識別精度劃分為70,71,72...79,共10類。本工作為與CNN模型的預測效果進行對比,設定BP神經網絡的輸出神經元為1個,即輪胎通過噪聲的聲壓級水平。數據在隱含層和輸出層的傳遞函數均為tanh函數,學習率為0.1,動量因子為0.1,經過1 000次迭代訓練,平均擬合誤差控制在0.2 dB以內。
CNN模型訓練過程中的損失函數與評價函數如圖5所示。

圖5 CNN模型訓練過程中的損失函數和評價函數
從圖5可以看出,CNN模型經過100次訓練后的損失函數值可達到0.01,評價函數值可達到0.05,訓練輪次為20次左右趨于穩定。
模型訓練結束后,用測試集的29個樣本對預報模型進行檢測,檢測結果誤差分析如表1所示。用公式(6)計算絕對誤差(AE),用公式(7)計算相對誤差(RE)。

表1 CNN模型檢測結果誤差分析
式中,Pc為每個測試集樣本的花紋噪聲預測值,T為每個測試集樣本的花紋噪聲真實值。
經過計算,BP神經網絡模型測試集中29個樣本噪聲值的平均絕對誤差為0.713 dB,平均相對誤差為0.95%;CNN模型測試集中29個樣本噪聲值的平均絕對誤差為0.591 dB,平均相對誤差為0.81%,其中15個樣本噪聲值的誤差在0~0.5 dB之間,9個樣本噪聲值的誤差在0.5~1.0 dB之間,5個樣本噪聲值的誤差大于1.0,可見CNN模型比BP神經網絡的預測準確度高。
在輪胎花紋噪聲值預測中,相比于BP神經網絡,采用CNN的優點如下:(1)BP神經網絡不能將圖像直接輸入到網絡模型中,需要提取一定數量的主成分特征來代替圖像,然后將主要成分特征輸入到BP神經網絡訓練學習,而CNN在圖像處理、模式識別領域有著重大應用,可以將圖片直接輸入CNN,通過卷積、池化操作來學習圖片的相應特征,在模式分類領域其可以直接輸入原始圖像,減少對圖片復雜的初期預處理工作;(2)BP神經網絡每一層都是全連接的,需要訓練的參數多,導致模型學習速度慢,訓練困難,而CNN具有局部感知和參數共享的特點,局部感知使每個神經元不需要感知圖像中的全部像素,只需要感知其所對應的局部區域,權值共享結構降低了模型的復雜程度,減少了權值的數量,因此學習和訓練的速度較快。
采用CNN預測輪胎花紋噪聲的結果仍然存在與真實值相差大于1 dB的情況,分析原因如下:(1)輸入CNN模型的輪胎花紋圖像只考慮花紋塊和花紋溝的排布形式,忽略花紋溝的深度和花紋壁的傾斜角度的影響;(2)采集的輪胎花紋樣本數量太少,對于深度學習網絡,樣本數量越多,模型的學習和預測能力越好,魯棒性越強;(3)CNN模型的結構層數、參數等還需要進一步優化調整;(4)在劃分訓練集和測試集時按照一定比例隨機劃分,導致模型每次的預測效果可能因樣本差異而不同。
輪胎花紋噪聲值受多種因素影響且每種因素非獨立作用,存在相互耦合的現象,現有的輪胎花紋噪聲預測方法難且預測精度低,針對這一問題,本工作基于圖像處理和深度學習搭建了預測不同輪胎花紋噪聲值的CNN模型,并對輸入CNN的噪聲值標簽進行歸一化與反歸一化的處理,使該模型對花紋噪聲值的預測平均誤差達到0.591 dB,平均相對誤差能達到0.81%。與BP神經網絡相比,CNN模型具有更高的預測精度,滿足輪胎花紋設計初期對噪聲值預測的準確度要求,在輪胎投入生產之前,輪胎設計師可以利用預測花紋噪聲的數學模型對輪胎花紋進行噪聲值預測,從而對花紋的排布方式進行優化,降低輪胎花紋噪聲,減少研發成本。