汪海彬 余正濤 毛存禮 郭劍毅



摘 要:目的的介紹有點散,請?zhí)釤捯幌氯绾蚊枋龈‘?dāng)?一般的寫法是針對...中存在的...問題,提出...方法針對說話人識別系統(tǒng)中存在的有效語音特征提取以及噪聲影響的問題,提出了一種新的語音特征提取方法——基于S變換的美爾倒譜系數(shù)(SMFCC)。該方法是在傳統(tǒng)美爾倒譜系數(shù)(MFCC)的基礎(chǔ)上利用S變換的二維時頻多分辨率特性,以及奇異值分解(SVD)方法的二維時頻矩陣有效去噪性,并結(jié)合相關(guān)統(tǒng)計分析方法最終獲得語音特征。采用TIMIT語音數(shù)據(jù)庫,將所提的特征和現(xiàn)有特征進(jìn)行對比實驗。 SMFCC特征的等錯誤率(EER)和最小檢測代價(MinDCF)均小于線性預(yù)測倒譜系數(shù)(LPCC)、MFCC及其結(jié)合方法LMFCC,比MFCC的EER和MinDCF08分別下降了3.6%與17.9%。實驗結(jié)果表明所提方法能夠有效去除語音信號中的噪聲,提升局部分辨率。
關(guān)鍵詞:S變換;奇異值分解;基于S變換的美爾倒譜系數(shù);高斯混合模型通用背景模型;說話人識別
中圖分類號: TN912.34補(bǔ)充中圖分類號及其對應(yīng)英文 文獻(xiàn)標(biāo)志碼:A英文標(biāo)題