摘要:提出了一種基于頻域信噪比和復雜信號檢測的語音活動檢測方法(VAD)。首先對每一幀語音信號進行傅利葉變換。將頻域內信號劃分成幾個頻帶,求得每一個頻帶的信噪比,利用估計得到的噪聲能量產生一個閾值,并進行VAD的預判,得到一個判定結果。其次,利用音樂信號的相關性,將高通后自相關系數與閾值進行比較,得出另一個判定結果。最后,聯合兩個判定結果,得出最終的判定。實驗表明,這種算法可以較好地應用于復雜語音活動檢測。
關鍵詞:語音活動檢測;信噪比;復雜信號;自相關系數
引言
語音活動檢測是語音通信中的一項重要技術。在噪聲抑制、語音增強中,正確地檢測語音和噪聲,直接影響到這些算法的性能。在VoIP(voice overIP)中,VAD也擔當著重要的角色,通過VAD檢測,可以節省帶寬,在有限帶寬中,提供更好質量的語音。
VAD算法一般是利用語音信號與噪聲信號的特性不同,提出一些特征值,并與閾值進行比較,從而得到判定結果。現在VAD算法中,有短時能量檢測、過零率檢測、自適應能量檢測、線性預測模型檢測、基音周期檢測、概率檢測等方法。
本文提出的基于頻域和復雜信號檢測相結合的方法,語音信號被劃分成不同的頻帶,算出每一個頻帶的信號能量和背景噪聲,結合高通自相關系數,可較好地完成VAD檢測。
注:本文中所涉及到的圖表、注解、公式等內容請以PDF格式閱讀原文