摘要:關鍵詞確認是語音識別中一個重要的研究方向。對于關鍵詞確認系統來講,廢料模型的結構和類型對整個系統的性能有很大的影響。文中提出了一種基于音節格的廢料模型。實驗表明,與傳統的基于音素類的廢料模型相比,關鍵詞確認率有了很大的提高。
關鍵詞:關鍵詞確認;隱馬爾可夫模型;廢料模型;音素類;音節格
關鍵詞確認(Keyword Spotting , KWS)是語音識別中一個重要的研究方向,也是近幾年來在很多行業頗受重視的一個研究領域。一般來說,在說話人的正常話語中除了包含一些關鍵性詞匯外還可能包括一些非話語的咳嗽聲、呼吸聲、關門聲、音樂聲和背景噪聲等。在說話人的連續語音中確認出關鍵性的詞匯, 這就是關鍵詞確認技術[1]。相對于大詞匯量的識別系統,關鍵詞確認系統既精確,計算量又小,而且對于實際的語音數據有較大的彈性,因此在監聽、通信、語音輸入等方面都有著很好應用前景[2]。
關鍵詞確認重點之一是代表非關鍵詞語音的模型,不論識別系統的方法怎樣,大部分是采用廢料模型。當采用一般的模型作為廢料模型時,識別器傾向于把它們誤識為關鍵詞,從而降低了確認率。另一方面,對每個詞都構建廢料模型又是非常不現實的,而且使識別器的結構更復雜化,降低了系統的靈活性。兩者之間的平衡點就是使用不同類型和數量的廢料模型,這樣即使想要保證相當高的確認率,計算時間也是可以接受的。……