999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于優化的正交匹配追蹤聲音事件識別

2017-10-13 10:56:01陳秋菊
電子與信息學報 2017年1期
關鍵詞:特征優化信號

李 應 陳秋菊

?

基于優化的正交匹配追蹤聲音事件識別

李 應*陳秋菊

(福州大學數學與計算機學院 福州 350116)

針對各種環境聲對聲音事件識別的影響,該文提出一種基于優化的正交匹配追蹤(Orthogonal Matching Pursuit, OMP)聲音事件識別方法。首先,利用OMP稀疏分解并重構聲音信號,保留聲音信號的主體部分,減小噪聲的影響。其中,使用粒子群(Particle Swarm Optimization, PSO)算法優化搜索最優原子,實現OMP的快速稀疏分解。接著,對重構聲音信號提取Mel頻率倒譜系數(Mel-Frequency Cepstral Coefficients, MFCCs),與OMP時-頻特征和基頻(PITCH)特征,組成優化OMP的復合特征。最后,通過優化OMP復合特征,使用隨機森林(Random Forests, RF)對40種聲音事件在不同環境不同信噪比下進行識別。實驗結果表明,優化OMP復合特征結合RF的方法能有效地識別各種環境下的聲音事件。

聲音事件識別;正交匹配追蹤;稀疏分解;粒子群優化;隨機森林

1 引言

近年來聲音事件識別引起廣泛的關注。聲音事件的識別在音頻取證[1]、環境聲音識別[2]、聲場景分析[3]、環境安全監控[4]、定位跟蹤和聲源分類[5]、病人監護[6]和非正常事件檢測[7]等領域具有重要意義。

上述方法在聲音事件識別上取得一定的效果。然而,真實環境中存在著復雜多變的噪聲,它們對聲音事件識別產生較大的干擾。常用的降低噪聲影響的方法有維納濾波[13],卡爾曼濾波[14],小波增強[15],多頻帶譜減法[16]等。這些方法需要先驗地獲得待檢測信號或噪聲信號的統計特性。基于匹配追蹤(Matching Pursuit, MP)的方法利用信號的稀疏性,將信號稀疏分解重構進行自適應表示,不需要先驗地獲得待檢測信號和噪聲信號的統計特性,適合于各種環境下聲音事件的識別。

關于MP的研究,主要有:Chu等人[17]把MP結合Mel頻率倒譜系數(Mel-Frequency Cepstral Coefficients, MFCCs),用kNN和高斯混合模型(Gaussian Mixture Model, GMM)分類器對聲音事件進行分類識別;Wang等人[18]利用MP從Gabor字典中選擇重要的原子,用主成分分析(Principal Component Analysis, PCA)和線性判別分析(Linear Discriminant Analysis, LDA)確定聲音事件的特征,采用SVM分類器對聲音事件進行分類識別;Mallat等人[19]提出利用過完備原子字典將原信號進行稀疏分解,通過稀疏逼近重構信號。由于MP在稀疏分解時需要迭代次數較多,收斂較慢,文獻[20]在MP的基礎上提出正交匹配追蹤(Orthogonal Matching Pursuit, OMP)算法,該算法可以在較少的迭代中完成信號的收斂。

然而,OMP稀疏分解在搜索最優原子時存在計算復雜度高的問題。為了實現OMP快速稀疏分解,本文提出基于優化的OMP聲音事件識別方法。首先,從聲音事件樣本庫中選擇聲音事件,將其分為訓練樣本集和測試樣本集;然后,在保證收斂精度的前提下,采用粒子群優化算法(Particle Swarm Optimization, PSO)對選擇的樣本進行OMP稀疏分解;接著,對重構信號提取優化OMP復合特征;最后,使用隨機森林[21](Random Forests, RF)對優化OMP復合特征進行分類識別。為此,本文進行如下組織:第2節介紹OMP稀疏分解重構的基本原理;第3節提出基于優化的OMP聲音事件識別架構;第4節給出各種環境下,聲音事件識別的實驗設計;第5節為實驗的結果與分析;第6節對本文進行總結。

2 OMP稀疏分解

OMP算法在MP算法的基礎上利用Gram- Schmidt方法將選擇的最優原子與已選擇原子集合進行正交化處理,以保證在相同精度的前提下,收斂速度更快。

2.1 OMP字典

實現OMP稀疏分解的關鍵在于選擇一個過完備的字典。本文選擇的Gabor字典[19]是由一個調制的高斯窗函數構成。

(2)

圖1 不同時-頻參數的原子波形

2.2 OMP信號稀疏分解

(4)

即對聲音信號進行OMP稀疏分解重構。

如果以重構信號和原始信號的均方誤差(Mean Squared Error, MSE)

圖2為褐雨燕聲音信號經過OMP稀疏分解重構后的質量MSE圖。從圖2中可以看出,隨著稀疏度增加,MSE值逐漸減小,即重構信號的質量越來越好。當稀疏度在10以上時,MSE下降逐漸平緩,并且逐漸趨于0。

3 優化的OMP聲音事件識別架構

3.1 PSO最優原子搜索策略

PSO的基本思想是利用粒子之間的協作與競爭,實現對復雜空間最優解的搜索[22,23]。在每一次的搜索中,粒子通過跟蹤兩個“極值”來更新自己的信息,一個是當前粒子的極值點;另一個是當前整個粒子種群找到的最優解,即全局極值點。

圖2 OMP稀疏分解重構信號的MSE

對OMP稀疏分解,瓶頸主要集中在2.2節步驟(2)的最優原子搜索過程。為此,我們利用PSO對最優原子搜索過程進行優化。

PSO優化搜索詳細過程如下:

(2)更新每個粒子的速度與位置。判斷粒子的速度是否超出界限,如果出界更新;判斷粒子的位置是否在過完備原子字典中,如果不在,則取邊界值代替粒子的位置。

(10)

重復多次上述過程,實現優化的OMP信號稀疏分解,保存分解結果并重構信號。

3.2 優化OMP復合特征提取

OMP稀疏分解采用的Gabor原子是由調制的高斯窗函數構成,而高斯型函數在時域和頻域都是局部化的,其局部特性保證了原子時-頻參數能夠較好地刻畫信號的非平穩時變特性。OMP稀疏分解將待提取的有用信息作為稀疏成分,將噪聲作為殘差成分,對噪聲進行低維投影后,噪聲不具有稀疏性[24]。在重構信號時,殘差部分的噪聲很難恢復,從而達到消除噪聲成分,增強聲音事件信號的目的。

通過優化OMP稀疏分解聲音信號,獲得表示該信號的時-頻參數組中伸縮因子和頻率因子的均值和標準差,構成OMP特征。對于長度為幀的聲音信號,,,其中,第幀OMP特征可以表示為

對于聲音信號,重構精度隨著稀疏度的增加而不斷提升。但是,稀疏度過高,在重構聲音信號主體時,噪聲信號的重構比例也會相應地提升。所以,在保證重構精度的前提下,本文經過實驗確定OMP稀疏分解稀疏度為20時重構效果最好。

由于OMP特征維數較少,單獨使用OMP特征的識別效果不理想。MFCCs將線性頻譜映射到基于聽覺感知的Mel非線性頻譜中再轉換到倒譜上,能夠較好地刻畫聲音特征,但是在噪聲環境下,MFCCs的性能大幅下降。此外,真實環境中不同聲音存在不同的PITCH范圍,而PITCH作為特征描述聲音具有很好的區分性。針對這些問題,本文提取優化OMP稀疏分解后重構聲音信號的MFCCs特征和PITCH特征,來補充OMP特征,組成一個優化OMP復合特征。

3.3 RF識別

RF是一種利用多個決策樹分類器來對數據進行判別的集成分類器算法[21]。其原理是通過自助重采樣(Bootstrap)技術[21],對原始訓練樣本集有放回地隨機抽樣次,生成新的個訓練數據集。然后這些新生成的個訓練數據集,按照決策樹的構建方法生長成棵決策樹,并組合在一起形成森林。測試數據的判別結果由森林中棵樹投票形成的分數而定。

本文通過提取的優化OMP復合特征訓練RF,進行各種環境下聲音事件的識別。使用RF對未知測試樣本的識別過程如下:首先,將待測試聲音樣本的特征置于RF中所有棵決策樹的根節點處;然后,按照決策樹的分類規則,從根節點處向下傳遞到一個葉節點處,這個葉節點對應的類標簽就是這棵決策樹對特征所屬類別所做的投票;最后,RF中的棵決策樹均對每一個待測試聲音樣本的特征的類別進行投票,統計這個投票,其中票數最多的便成為特征對應的類標。

4 實驗設計

4.1聲音樣本

實驗采用的40類聲音均來自Freesound[25]聲音數據庫。分為哺乳動物叫聲、鳥叫聲和昆蟲叫聲3大類,每類聲音有30個樣本,具體如表1所示。每個樣本是單聲道“.wav”格式,采樣率為44.1 kHz,聲音長度為2 s,量化精度為16位的聲音片段。為了保持實驗數據的相對獨立性,訓練聲音樣本和測試聲音樣本沒有重復數據。從每一類樣本中隨機選取20個純凈聲音樣本作為訓練樣本,剩余的10個樣本混合不同的環境噪聲組成多組測試樣本。實驗用到的3種噪聲為SONY ICD-UX512F錄音棒以44.1 kHz的采樣頻率錄取的真實環境噪聲,分別為風聲、雷雨聲和雨天湖邊聲。按信噪比0 dB, 10 dB, 20 dB, 30 dB混入純凈聲音用于測試。

表1聲音事件樣本集

類別聲音構成種類樣本數 哺乳動物蝙蝠、熊、貓、猩猩、奶牛、鹿、狗、海豚、驢、大象、獅子、猴子、馬、豬、海豹、海獅、羊、老虎、鯨、羚羊、狼21630 鳥類赭紅尾鴝、禿鷹、烏鴉、杜鵑、鴿子、喜鵲、貓頭鷹、海鷗、鴨子、天鵝、燕鷗、褐雨燕、知更鳥13390 昆蟲蜜蜂、蚊子、蟋蟀、蟬、蚱蜢、蒼蠅6180 環境噪聲風聲、雨天湖邊聲、雷雨聲33

4.2 參數設定

(1)提取MFCCs特征中,采用24階Mel三角帶通濾波器組,提取12維離散余弦變換系數,加上對數能量作為第13維特征;采用循環平均幅度差函數(Circle Average Magnitude Difference Function, CAMDF)提取每幀聲音信號的1維PITCH特征;對于APNCC特征,采用32階的Gammatone濾波器,提取12維離散余弦變換系數。

(2)PSO算法中的參數根據文獻[22,23]以及多次實驗的經驗做如下設定:種群大小為20,最大迭代次數為20次,粒子搜索范圍最大值為聲音長度,速度最大值為,收斂因子為0.729,學習因子為2,權重最大值為0.95,最小值為0.4,變異概率為0.2。

(3)在對比實驗中用到APNCC方法[11]和MP方法[18]。其中,APNCC方法[11]是對聲音信號提取APNCC特征,放入SVM分類器進行分類識別;MP方法[18]是采用PCA和LDA對聲音信號做降維處理后提取MP特征,放入SVM分類器進行分類識別。這兩種方法中用到的SVM分類器參數設置是直接利用LIBSVM[26]工具箱進行SVM的訓練和測試建模。其中,核函數為徑向基核函數,懲罰因子,核參數。

(4) RF分類器中的兩個參數:決策樹的個數和分類屬性個數,綜合考慮本文實驗樣本數量和特征維度以及文獻[21]建議,分別設置為500和5。

5 實驗與結果分析

5.1 優化OMP稀疏分解計算量

優化OMP稀疏分解和原始OMP稀疏分解計算量比較。表2給出一個包含2個有效音節、長度為2 s的山斑鳩聲音信號,在稀疏度為20時,采用原始OMP方法和優化OMP方法,對聲音信號進行稀疏分解時的計算量和重構信號的質量評估。其中,重構信號的質量評估采用2.2節中提到的均方誤差MSE。

從表2可以看出,原始OMP方法的MSE值為0.005,而優化OMP方法的MSE值為0.007,比原始OMP方法的MSE值高0.002。也就是說,在重構質量相近的前提下,經過PSO優化后的OMP方法,在時耗上比原始OMP提高近70倍,在搜索次數和內積次數的計算量上比原始OMP提高近300倍。其機理在于原始OMP搜索找到全部原子,而PSO優化OMP后找到的原子都是最優的,原子較少,是原始OMP的部分原子。從而也說明了經過PSO優化的OMP能有效降低最優原子搜索過程的計算復雜度,提高了搜索效率,實現了OMP的快速稀疏分解。

表2 OMP稀疏分解計算量與重構信號的質量評估

5.2優化OMP稀疏分解對聲音信號的增強

優化OMP稀疏分解重構信號與小波[15]和多頻帶譜減法[16]兩種聲音增強方法的對比。圖3(a)和圖3(f)是一段包含2個有效音節的山斑鳩聲音信號的波形和聲譜圖,圖3(b)和圖3(g)是對該聲音信號添加10 dB的流水噪聲的波形和聲譜圖。圖3(c)和圖3(h)是采用小波增強對圖3(b)和圖3(g)進行重構后的波形和聲譜圖。圖3(d)和圖3(i)是采用多頻帶譜減法進行重構后的波形和聲譜圖。而圖3(e)和圖3(j)是經過優化OMP稀疏分解后進行重構的波形和聲譜圖。從圖3中可以看出,采用小波增強和多頻帶譜減法對帶噪聲音信號增強后,噪聲殘留成分較多。經過優化OMP稀疏分解重構后,聲音信號的主體部分得到保留,而與信號相關度低的噪聲信號被去除,聲音增強效果較好。圖3(e)和圖3(j)初步說明,優化OMP稀疏分解在聲音增強性能上優于小波增強和多頻帶譜減法。

圖3 優化OMP稀疏分解重構信號與相關方法的波形和聲譜圖對比

5.3在無環境聲和不同環境不同信噪比下比較

這里,我們選取OMP特征、MFCCs特征、OMP+MFCCs特征和優化OMP復合特征(表、圖中的CFeature),進行識別率對比。在無噪聲條件下進行的識別率實驗,結果如表3所示。由表3可知,在無噪聲條件下,除了OMP特征外,其它3個特征對聲音事件的識別率都較高。單獨使用OMP特征,由于特征維數過低,識別效果不理想。而采用OMP特征和MFCCs特征結合后,識別效果得到大幅提升,再用PITCH特征補充后,優化OMP復合特征識別效果達到最佳。

表3無噪聲條件下不同特征的比較

方法MFCCsOMPOMP+MFCCsCFeature 識別率(%)89.053.392.398.5

對測試樣本分別添加信噪比為0 dB, 10 dB, 20 dB和30 dB的3種環境聲,4個不同特征的平均識別率如表4所示。從表4中可以看出,MFCCs特征的平均識別率最低,說明MFCCs特征不適合噪聲環境下的聲音事件識別。OMP特征的平均識別率稍好于MFCCs特征,但是效果也不理想。而優化OMP復合特征平均識別率比MFCCs特征、OMP特征和OMP+MFCCs特征分別高38.5%, 35.2%和11.8%,說明經過OMP特征、MFCCs特征和PITCH特征的結合,形成的優化OMP復合特征,能有效地提高識別性能,具有較好的抑制環境噪聲的特性。

表4不同特征在不同噪聲環境下的平均識別率

噪聲類型不同特征提取方法的平均識別率(%) MFCCsOMPOMP+MFCCsCFeature 風聲43.947.668.183.7 雷雨聲40.143.673.282.4 雨天湖邊37.740.160.371.2 均值40.543.867.279.0

圖4表示4個特征在3種環境聲下,不同信噪比的識別率。從圖4我們可以看出,不同的噪聲環境,對識別性能的影響不一樣。相比起來,雨天湖邊噪聲環境對識別率的影響最大,而風聲和雷雨聲噪聲的影響相對較小。優化OMP復合特征識別率遠高于單獨的OMP特征和MFCCs特征,也優于OMP+MFCCs特征,從而說明優化OMP復合特征是一個較好的特征,適合用于各種環境下的聲音事件識別。

5.4不同聲音增強方法在不同環境和信噪比下比較

利用風聲、雷雨聲和雨天湖邊聲來模擬真實的環境聲音。分別對測試樣本添加信噪比為0 dB, 10 dB和20 dB的3種環境聲,提取它們的優化OMP復合特征(圖中的CFeature),同樣,也分別提取它們經小波[15]和多頻帶譜減法[16]增強后的兩組MFCCs。采用RF分別對3組特征進行識別。圖5給出3種方法和不同噪聲環境下得到的識別率。從圖5可以看出,3種聲音增強方法中,在各種環境各種信噪比下,小波增強的性能相對來說較差,其平均識別率為42.6%。多頻帶譜減法的平均識別率為57.6%,而優化OMP復合特征的平均識別率為69.2%,從而說明了在各種環境及各種信噪比下,優化OMP復合特征抑制噪聲的效果優于小波和多頻帶譜減法。

圖4 4種特征在3種噪聲環境下不同信噪比的識別率

圖5 3種噪聲環境下不同方法的識別率

圖6 本文方法與新方法在3種環境下的識別率

表5不同方法3種噪聲下不同信噪比的平均識別率

方法3種噪聲下不同信噪比的平均識別率(%) 0 dB10 dB20 dB30 dB均值 本文方法43.771.889.895.275.1 APNCC-SVM[11]33.454.570.176.958.7 MP-SVM[18]18.747.159.467.148.1

5.5 與新方法的比較

我們把優化OMP復合特征結合RF的方法與文獻[11]中APNCC結合SVM的方法和文獻[18]中MP結合SVM的方法分別進行比較。在3種噪聲環境下的識別效果如圖6所示。同時,在表5中也給出在3種噪聲下,本文方法與APNCC結合SVM的方法[11]和MP結合SVM的方法[18]在不同信噪比下的平均識別率。從圖6及表5可以看出,在3種噪聲環境下,MP結合SVM的方法的識別率最低,尤其在0 dB時,都無法正常地進行聲音事件的識別。APNCC結合SVM的方法的識別效果高于MP結合SVM的方法,但其識別效果還是差于本文優化OMP復合特征結合RF的方法。本文提出的方法,在3種噪聲環境下,無論是高信噪比還是低信噪比,識別率都高于APNCC結合SVM和MP結合SVM的方法。

6 結束語

實驗表明,本文提出的優化OMP復合特征結合RF的聲音事件識別方法,能有效進行各種環境下不同信噪比聲音事件的識別。而且在不同環境不同信噪比下,本文方法與現有的APNCC結合SVM的方法和MP結合SVM方法進行比較,識別性能有一定優勢。說明本文提出的方法對于各種環境下聲音事件識別具有一定效果。下一階段,我們將結合聲譜圖等方法,研究分析聲音信號更為微弱,環境更為復雜和信噪比更低的聲音事件識別。

[1] MALIK H. Acoustic environment identification and its applications to audio forensics[J]., 2013, 8(11): 1827-1837. doi: 10.1109/tifs.2013.2280888.

[2] HEITTOL T, MESAROS A, VIRTANEN T,. Sound event detection in multisource environments using source separation[C]. CHiME 2011 Workshop on Machine Listening in Multisource Environments, Florence, Italy, 2011: 36-40.

[3] SHI Z, HAN J, ZHENG T,. Identification of objectionable audio segments based on pseudo and heterogeneous mixture models[J].,,, 2013, 21(3): 611-623. doi: 10.1109/tasl.2012.2229980.

[4] NTALAMPIRAS S, POTAMITIS I, and FAKOTAKIS N. An adaptive framework for acoustic monitoring of potential hazards[J].,,, 2009, 2009(1): 1-15. doi: 10.1155/2009/594103.

[5] ZHAO H and MALIK H. Audio recording location identification using acoustic environment signature[J]., 2013, 8(11): 1746-1759. doi: 10.1109/tifs.2013.2278843.

[6] VARGHEES V N and RAMACHANDRAN K I. A novel heart sound activity detection framework for automated heart sound analysis[J]., 2014, 13: 174-188. doi: 10.1016/j.bspc.2014.05.002.

[7] NTALAMPIRAS S, POTAMITIS I, and FAKOTAKIS N. On acoustic surveillance of hazardous situations[C]. IEEE International Conference on Acoustics, Speech and Signal Processing, Taipei, China, 2009: 165-168. doi: 10.1109/icassp. 2009.4959546.

[8] MCLOUGHLIN I, ZHANG H, XIE Z,. Robust sound event classification using deep neural networks[J].,,, 2015, 23(3): 540-552. doi: 10.1109/taslp.2015.2389618.

[9] SHARAN R V and MOIR T J. Robust audio surveillance using spectrogram image texture feature[C]. IEEE International Conference on Acoustics, Speech and Signal Processing, South Brisbane, Australia, 2015: 1956-1960. doi: 10.1109/icassp.2015.7178312.

[10] DENNIS J, TRAN H D, and CHNG E S. Image feature representation of the subband power distribution for robust sound event classification[J].,,, 2013, 21(2): 367-377. doi: 10.1109/tasl.2012.2226160.

[11] 顏鑫, 李應. 利用抗噪冪歸一化倒譜系數的鳥類聲音識別[J]. 電子學報, 2013, 41(2): 295-300. doi: 10.3969/j.issn.0372-2112. 2013.02.014.

YAN X and LI Y. Anti-noise power normalized cepstral coefficients in bird sounds recognition[J]., 2013, 41(2): 295-300. doi: 10.3969/j.issn.0372-2112. 2013.02.014.

[12] LI Y and WU Z. Animal sound recognition based on double feature of spectrogram in real environment[C]. IEEE International Conference on Wireless Communications & Signal Processing, Nanjing, China, 2015: 1-5. doi: 10.1109/ wcsp.2015.7341003.

[13] CHANG K M and LIU S H. Gaussian noise filtering from ECG by Wiener filter and ensemble empirical mode decomposition[J]., 2011, 64(2): 249-264. doi: 10.1007/s11265-009-0447-z.

[14] LEE Y K, JUNG G W, and KWON O W. Speech enhancement by Kalman filtering with a particle filter-based preprocessor[C]. IEEE International Conference on Consumer Electronics, Las Vegas, NV, USA, 2013: 340-341. doi: 10.1109/ice.2013.6486919.

[15] VERMA N and VERMA A K. Real time adaptive denoising of musical signals in wavelet domain[C]. Nirma University International Conference on Engineering, Ahmedabad, India, 2012: 1-5. doi: 10.1109/nuicone.2012.649323.

[16] 周曉敏, 李應. 基于 Radon 和平移不變性小波變換的鳥類聲音識別[J]. 計算機應用, 2014, 34(5): 1391-1396. doi: 10. 11772/j.issn.1001-9081.2014.05.1391.

ZHOU X and LI Y. Bird sounds recognition based on Radon and translation invariant discrete wavelet transform[J]., 2014, 34(5): 1391-1396. doi: 10.11772/j.issn.1001-9081.2014.05.1391.

[17] CHU S, NARAYANAN S, and KUO C C J. Environmental sound recognition with time-frequency audio features[J].,,, 2009, 17(6): 1142-1158. doi: 10.1109/tasl.2009. 2017438.

[18] WANG J C, LIN C H, CHEN B W,. Gabor-based nonuniform scale-frequency map for environmental sound classification in home automation[J]., 2014, 11(2): 607-613. doi: 10.1109/tase.2013.2285131.

[19] MALLAT S G and ZHANG Z. Matching pursuits with time-frequency dictionaries[J]., 1993, 41(12): 3397-3415. doi: 10.1109/78.258082.

[20] SOUSSEN C, GRIBONVAL R, IDIER J,. Joint k-step analysis of orthogonal matching pursuit and orthogonal least squares[J]., 2013, 59(5): 3158-3174. doi: 10.1109/tit.2013.2238606.

[21] BREIMAN L. Random forests[J]., 2001, 45(1): 5-32. doi: 10.1023/A:1010933404324.

[22] KENNEDY J. Particle Swarm Optimization[M]. Washington, US: Springer, 2011: 760-766. doi: 10.1007/978-0-387-30164- 8_630.

[23] 馬超, 鄧超, 熊堯, 等. 一種基于混合遺傳和粒子群的智能優化算法[J]. 計算機研究與發展, 2015, 50(11): 2278-2286. doi: 10.7544/issn1000-1239.2013.20111484.

MA C, DENG C, XIONG Y,. An intelligent optimization algorithm based on hybrid of GA and PSO[J]., 2015, 50(11): 2278-2286. doi: 10.7544/issn1000-1239.2013.20111484.

[24] LI S and FANG L. Signal denoising with random refined orthogonal matching pursuit[J]., 2012, 61(1): 26-34. doi: 10.1109/tim.2011.2157547.

[25] Universitat Pompeu Fabra. Repository of sound under the creative commons license[OL]. http://www.freesound.org, 2012.5.14.

[26] CHANG C C and LIN C J. LIBSVM: A library for support vector machines[J]., 2011, 2(3): 1-27. doi: 10.1145/1961189. 1961199.

李 應: 男,1964年生,教授,研究方向為多媒體數據檢索、信息安全.

陳秋菊: 女,1989年生,碩士生,研究方向為多媒體數據檢索.

Sound Event Recognition Based on Optimized Orthogonal Matching Pursuit

LI Ying CHEN Qiuju

(,,350116,)

A sound event recognition method based on optimized Orthogonal Matching Pursuit (OMP) is proposed for decreasing the influence of sound event recognition on various environments. Firstly, OMP is used for sparse decomposition and reconstruction of sound signal to decrease the influence of noise and reserve the main body of sound signal, where Particle Swarm Optimization (PSO) is adopted to accelerate the best atom searching in the process of sparse decomposition. Then, an optimized composited feature of Mel-Frequency Cepstral Coefficients (MFCCs), time-frequency OMP feature, and PITCH feature is extracted from reconstructed signal. Finally, Random Forests (RF) classifier is employed to recognize 40 classes of sound events in different environments and Signal-to-Noise Rates (SNRs). The experiment result shows that the proposed method can effectively recognize sound events in various environments.

Sound event recognition; Orthogonal Matching Pursuit (OMP); Sparse decomposition; Particle Swarm Optimization (PSO); Random Forests (RF)

TP391.42

A

1009-5896(2017)01-0183-08

10.11999/JEIT160120

2016-01-26;改回日期:2016-12-06;

2016-12-14

李應 fj_liying@fzu.edu.cn

國家自然科學基金(61075022)

The National Natural Science Foundation of China (61075022)

猜你喜歡
特征優化信號
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
基于FPGA的多功能信號發生器的設計
電子制作(2018年11期)2018-08-04 03:25:42
抓住特征巧觀察
主站蜘蛛池模板: 亚洲欧美人成人让影院| 亚洲手机在线| 日本精品视频| 欧美一级夜夜爽www| 国产高清又黄又嫩的免费视频网站| 91成人试看福利体验区| 在线观看国产精品第一区免费| a毛片在线播放| 色偷偷男人的天堂亚洲av| 国产精品冒白浆免费视频| 免费国产一级 片内射老| 欧美在线综合视频| 午夜欧美在线| 国产va在线观看| 99re精彩视频| 成人午夜在线播放| 国产va免费精品观看| 色欲国产一区二区日韩欧美| 亚洲国产中文综合专区在| 亚洲一级毛片| 国产精品三区四区| 大香网伊人久久综合网2020| 亚洲成人黄色在线| 成人av专区精品无码国产 | 国产亚洲日韩av在线| 狠狠干综合| 特级毛片免费视频| 国产主播一区二区三区| 黄色不卡视频| 欧美一区精品| 日韩a在线观看免费观看| 青青草国产在线视频| 动漫精品中文字幕无码| 亚洲无码免费黄色网址| 少妇人妻无码首页| 伊人AV天堂| 天堂在线视频精品| 制服无码网站| 日韩高清无码免费| 国产成人高清亚洲一区久久| 欧美成人一级| 91成人免费观看| 成人免费一区二区三区| 日本爱爱精品一区二区| 九色视频一区| 在线观看亚洲成人| 国产一区二区精品高清在线观看| 亚洲免费成人网| AV老司机AV天堂| 18禁高潮出水呻吟娇喘蜜芽| 91精品专区国产盗摄| 国产后式a一视频| 欧美亚洲香蕉| 国产精品七七在线播放| 国产在线98福利播放视频免费 | 国产本道久久一区二区三区| 九九线精品视频在线观看| 最新亚洲av女人的天堂| 国产成人区在线观看视频| 永久成人无码激情视频免费| 国产91丝袜在线播放动漫| 日韩国产综合精选| 精品撒尿视频一区二区三区| 国产成人一区免费观看| 国产精品第一区| 精品国产香蕉伊思人在线| 92精品国产自产在线观看 | 日韩AV手机在线观看蜜芽| 国产美女在线免费观看| 国产免费福利网站| 国产成人精品日本亚洲| 国产成人无码综合亚洲日韩不卡| 在线永久免费观看的毛片| 国产精品一区二区不卡的视频| 国产精品成人一区二区不卡| 亚洲日韩AV无码精品| 91成人在线免费视频| 67194亚洲无码| 波多野结衣一区二区三区四区 | 国产一区二区丝袜高跟鞋| 精品久久久久久中文字幕女| 波多野衣结在线精品二区|