程小偉,王健,曾慶寧,謝先明,龍超
?
噪聲環境下穩健的說話人識別特征研究
程小偉,王健,曾慶寧,謝先明,龍超
(桂林電子科技大學信息與通信學院,廣西桂林 541004)
針對噪聲環境下說話人識別率較低的問題,提出一種基于正規化線性預測功率譜的說話人識別特征。首先對語音信號線性預測分析和正規化處理求出語音頻譜包絡,然后通過伽馬通濾波器組得到對數子帶能量,最后對特征參數進行離散余弦變換,得到了一種說話人識別特征正規化線性預測伽馬通濾波器倒譜系數(Regularized Linear Prediction Gammatone Filter Cepstral Coefficient, RLP-GFCC)。仿真結果表明,在噪聲環境說話人辨認試驗中,相比傳統特征美爾頻率倒譜系數(Mel Frequency Cepstral Coefficient,MFCC)和伽馬通濾波器倒譜系數(Gammatone Filter Cepstral Coefficient,GFCC)的系統識別率得到了明顯提高,對噪聲環境的魯棒性得到了增強。
線性預測;正規化;說話人識別;伽馬通濾波器組;魯棒性
說話人識別技術是一種重要的生物特征識別技術,應用于身份確認、信息安全、遠程控制等領域[1]。如何提取有效的說話人識別特征是識別技術的關鍵,說話人識別特征要能夠描述說話人聲道特性,有較高的區分度,對外界環境具有較強的魯棒性[2]。
線性預測理論應用于語音信號處理,能夠提供說話人的聲道模型[3],因此,線性預測系數(Linear Prediction Coefficient,LPC)成為比較普遍的說話人識別特征,基于線性預測理論的特征線性預測倒譜系數(Linear Prediction Cepstral Coefficient,LPCC)[4]能夠用于說話人識別特征。這些特征在安靜環境下能夠取得很高的識別率,但對噪聲環境的魯棒性卻很差。……