趙海濤,李相蓮,李 陽
(1.海軍駐南京924廠軍事代表室,江蘇 南京 211100;2.江蘇自動化研究所,江蘇 連云港 222061;3.海裝上海局,上海 200051)
語音控制研究的目的是使機器根據人類說話的語句或命令做出相應的反應,在語音識別技術的基礎上加入控制功能形成的語音操控系統在很多領域取得巨大的成功。語音識別技術是語音控制的主體,而在語音識別算法中,語音模板庫建立的質量的好壞直接影響了語音識別準確率的高低,在軍用語音操控系統或一些特殊行業中對語音識別的準確率要求極高,否則將可能以犧牲生命為代價。本文給出的基于修正后的Fisher準則的 LBG(Linde,Buzo,Gray)聚類算法,相比傳統的Fisher準則,能更有效地優化聚類,從多人混合語音段中提取出單人的純凈語音,為無監督的說話人自適應提供更可靠的說話人模板庫。
Fisher準則是模式識別中的一種降維準則,是特征抽取的有效方法之一,其目的是尋找一個最佳投影向量,使投影后的樣本可分離性好,即投影后樣本的類間方差最大且類內方差最小,利用Fisher準則及改進后的準則能提取出具有更好鑒別能力的最優判別矢量[1-5],目前被廣泛應用在圖像分割[6-9]、人臉識別[10-12]、說話人識別[13]、聚類分析[14-15]等模式識別領域。
Fisher準則的主要思想是使類內距離盡可能小,類間距離盡可能大。根據Fisher比來確定最佳聚類數目,得到最佳聚類結果,Fisher比越大,表明類之間的區分度就越大。本文選用單個特征的Fisher比作為準則,對特征進行排序,選出那些鑒別性能較強的特征,從而達到降維的目的并得到較優的識別性能。……