張 坤,顧曉輝,邸 憶
(南京理工大學,南京 210094)
現代陸地戰場中,坦克與直升機成了主要武裝力量,它們火力猛、機動性強并具有很好的裝甲防護能力。這兩者的聲信號具有短時、強噪聲、非線性、非平穩且無先驗信息的特點[1]。小波與經驗模態分解(EMD)是處理非平穩信號的常用方法,主要思想是將信號分解為各個頻率分量再進行處理。但小波需確定基函數,故適應性較差;EMD 存在模態混疊現象[2],分解的精度會受影響。2014 年由Dragomiretskiy[3]等人提出的變分模態分解(VMD),將信號通過自適應維納濾波組,分解可得到調頻-調幅性質的模態分量[4]。其方法具有良好的理論依據,能成功地將兩個頻率相近的諧波信號分離,在自適應與分解精度上要優于前兩種方法。
為了提高快速性,可利用分形維數特征來描述一維信號[5-9]。分形維數有容量維數與信息維數,通常用盒計數法計算。盒計數法采用了規則劃分網格的方式,導致分形維數估計不夠準確且計算量大。
針對不同戰場聲學目標的識別問題,以分形維數為特征向量利用BP 神經網絡對聲目標進行識別,達到對聲目標快速識別的目的。由于文獻[8]提出的EMD 與盒計數法融合的方法是目前運用分形與信號分解工具處理非平穩、非線性信號的常用方法,將該方法與本文提出的方法在信號分解質量、特征提取的可分性以及聲識別效果上進行對比,說明了文獻[8]方法在處理聲信號方面的不足,而本文方法更具有優勢。
VMD 方法是將原信號f(t)在變分框架下,分解為k 個估計帶寬和最小的模態分量。類似于EMD稱為本征模態分量函數(IMF)。
模態分量的表達形式如下:

對每個IMF 進行單邊希爾伯特變換,得到信號單邊頻譜,然后調制到估計的中心頻率上,通過解調獲得各個模態的帶寬,最后通過調節信號的高斯平滑來估計信號的帶寬和,即為梯度的二范數的平方,構造出如下變分模型:



將式(3)變換到頻域,求極值得到IMF 的uk(t)與ωk(t)的表達式:


數學形態學的基本運算包括腐蝕與膨脹[10]。設f(n)和g(m)分別定義在F={0,1,2,…,N-1}和G{0,1,2,…,M-1}的離散函數,且N>>M,f(n)為輸入信號,g(m)為結構元素。
則f(n)關于g(m)的腐蝕定義為:

則f(n)關于g(m)的膨脹定義為:

采用這兩種運算可構筑信號的輪廓線,從而完整覆蓋信號,為分形維數的計算提供基礎。
假設離散時間信號f(n),n=0,1,2,…,N,單位結構元素定義為g,在尺度ε 下所用結構元素定義為:

則信號在尺度ε 下的形態覆蓋面積Ag(ε)為:

根據容量維數定義可知:當ε→0 時,有如下滿足關系:


單一容量維數僅考慮了覆蓋的個數,而未考慮每個覆蓋中包含結構元素的個數分布。根據在不同尺度ε 下對信號f 的膨脹與腐蝕定義,可定義一個反映結構元素分布函數Pi(ε):


和計算容量維數一樣,采用最小二乘法擬合數據點,即可得信息維數DI。
結合VMD 與數學形態學分形維數,提出的聲目標特征提取方法的步驟如圖1 所示:
步驟1:獲取聲信號,對信號進行頻譜分析,確定能量的主要集中頻段0~fmaxHz。
步驟2:對信號進行VMD 分解,初始化分解的IMF 個數k=2,懲罰因子α 與帶寬使用默認值α=2 000=0。
步驟3:以步驟2 中的參數進行分解,觀察各IMF 分量中心頻率最大值ωk與主要能量集中頻段的關系,若在頻段區間內即ωk<fmax,則可繼續分解;若ωk>fmax,則IMF 個數為k。
步驟4:確定結構元素g 與尺度ε,對分解出的IMF 分量進行膨脹與腐蝕運算,根據式(9)得到各IMF 分量的形態學覆蓋情況。
步驟5:改變分解的尺度ε,根據式(10)~式(12)計算各IMF 分量容量維數與信息維數。
步驟6:分別對多段坦克與直升機聲樣本重復上述步驟,將該段聲信號的各個IMF 的容量維數與信息維數作為特征向量。
步驟7:將提取出的特征放入BP 神經網絡分類器中進行訓練、測試,檢驗識別效果。
采用聲傳感器對這兩類聲音進行采集,采樣頻率為20 kHz。對這兩類聲信號進行頻譜分析,測量信號長度為1 024 個采樣點。原始目標信號與相應頻譜如圖2 所示。

圖2 戰場聲信號與相應頻譜
通過兩者頻譜圖可知,坦克與直升機聲的主要能量集中在0~3 000 Hz 左右,故由VMD 分解產生的IMF 分量的頻率范圍應在0~3 000 Hz。VMD 分解需要確定分解的IMF 數量k,數量太少,會導致分量混疊,數據會失真;分解IMF 數量過多,又會造成運算量增大,不利于快速識別。通過中心頻率來估計IMF 的分解數量。當IMF 的中心頻率超過3 000 Hz時即停止分解。對直升機與坦克聲信號進行VMD分解,得到各模態中心頻率如表1 所示。

表1 坦克與直升機聲不同k 值對應的中心頻率
由表1 可知,當坦克聲IMF 個數為4 時,最高中心頻率達到7 500 Hz,超過3 000 Hz,而當IMF 個數為3 時,最高中心頻率為2 988 Hz,接近3 000 Hz,故IMF 分量數為3 是最合適的。表1 中直升機聲信號VMD 分解的IMF 個數為3 與4 時,最大中心頻率接近3 000 Hz,且兩者差距不大,故可認為已經過分解[10],則IMF 個數確定為3。
對一組典型的坦克聲作VMD 分解得到各模態信號,并與EMD 分解方法進行對比圖3 與圖4 為VMD 分解和EMD 分解后的信號與頻譜圖。

圖3 坦克聲VMD 分解后信號及相應頻譜

圖4 坦克聲EMD 分解后信號及相應頻譜
將圖3(b)與圖4(b)對比,EMD 各模態存在明顯的頻譜混疊現象。分量C1與C2在1 000 Hz~3 000 Hz 存在混疊,而C2與C3在0~2 000 Hz 存在混疊。而VMD 各分量幾乎不存在混疊現象,各IMF分量分別代表0~1 000 Hz、1 000 Hz~2 500 Hz 與2 500 Hz~4 000 Hz不同頻段的信號分布。同時EMD會分解出較多的IMF 分量,而VMD 的分解數目可根據需要設定,相對EMD 計算量更小。
通過VMD 分解后,坦克與直升機聲信號均被分成3 個代表不同頻段的IMF 分量,為獲取信號分形維數特征,利用數學形態學方法計算各IMF 分量的容量維數與信息維數。運用數學形態學方法估計分形維數時,關鍵是單位結構元素的選取與尺度的選擇。為減小運算量且提高覆蓋信號的質量,結構元素選擇矩形結構g={1,1,1,1,1,1}。在尺度選擇上,因為是線性擬合,采用連續取值會造成計算量較大,故尺度采用離散化取值,最大尺度要求不超過信號長度的一半[11]。本文設置的尺度為[2,4,8,16,32,64,128,256]。

圖5 坦克聲IMF1 信號形態學覆蓋
對信號進行形態學覆蓋,圖5 為選取尺度8 與32 的結構元素對坦克聲分量IMF1 的形態學覆蓋結果。圖5 中下方黑線為信號腐蝕的結果,上方黑線為信號膨脹的結果,這上下兩組信號即對信號形成形態學覆蓋。再由式(10)與式(12)的線性關系進行最小二乘擬合,得到基于數學形態學的容量維數與信息維數。選擇10 個典型坦克聲樣本與10 個直升機聲樣本計算各自模態的兩種維數,并用文獻[8]的方法與本文結果進行比較得到如圖6 與圖7所示的數據分布。

圖6 文獻[8]方法計算所得不同目標形態學分形維數分布

圖7 本文方法計算所得不同目標形態學分形維數分布
將圖6 與圖7 對比,本文方法提取的特征向量具有更好的區分性,采用文獻[8]提取的兩類聲信號特征則容易形成維數混疊。由圖7 得到直升機聲各IMF 的容量維數與信息維數均大于坦克聲相應IMF的維數,具有較好的區分性,故以VMD 分解出的各IMF 分量的兩種維數構建的聲特征向量,能夠較好地區分不同類型的聲學目標。此外,形態學方法僅需要進行加減運算,比盒計數法具有更快的運算速度。


表2 采用本文方法提取的特征向量
從這140 組聲音中隨機抽取70 組作為訓練集,剩下70 組作為測試集,識別結果如表3 所示。由表3 識別結果,運用本文方法提取的特征對兩種聲信號進行識別取得了較高識別率,分別達到了97.2%與91.2%。而采用文獻[8]的方法在同等條件下,識別率為67.2%與78.3%,本文方法的識別率要高很多。同時由于VMD 與數學形態學方法結合相對于EMD 與盒計數法的優越性,計算的效率與準確度也更高。因此,本文提出的識別方法是一種較好的選擇。

表3 兩種方法的坦克聲與直升機聲識別結果
根據戰場聲信號能量主要集中頻段,本文運用變分模態分解將信號分解為3 個IMF 分量;相比EMD 分解方法,VMD 分解出的各IMF 分量不存在頻譜混疊且分解的IMF 數能夠調整,節省計算量的同時得到更精確的分解結果。運用數學形態學方法計算了兩類聲信號各個IMF 的容量維數與信息維數,相比盒計數法計算的維數,具有更好的區分性和更快的速度。利用BP 神經網絡分類器進行比較,得出了更高的識別率且運算速度更快,體現了基于VMD 融合數學形態學的聲目標識別方法的優越性。