李雨柯
(作者單位:貴州省廣播電視監(jiān)測中心)
語音識別技術(shù)可以轉(zhuǎn)換輸入系統(tǒng)中的聲音信號,使其轉(zhuǎn)換為文字形式或預(yù)設(shè)的命令,語音識別技術(shù)使人們不用借助鼠標(biāo)、鍵盤等設(shè)備而通過語音進(jìn)行命令輸出,可以更加便捷高效地開展各項工作。語音識別技術(shù)自20世紀(jì)開始研發(fā),目前發(fā)展應(yīng)用已經(jīng)非常成熟,再加上計算機(jī)技術(shù)的發(fā)展,語音識別技術(shù)的應(yīng)用更加普及。語音識別技術(shù)中的核心內(nèi)容是針對語音信號利用動態(tài)規(guī)劃技術(shù)和線性預(yù)測分析技術(shù)進(jìn)行模型問題解決。
語音識別技術(shù)的主要識別方法包括4個方面。第一是基于聲學(xué)和語言學(xué)的識別方法,目前這一方法的普及程度仍然有限。第二是隨機(jī)模型法,其相關(guān)技術(shù)的發(fā)展已經(jīng)較為成熟,因而實踐應(yīng)用也比較廣泛。隨機(jī)模型法在語音識別過程中的主要流程包括特征提取、模塊訓(xùn)練和分類、模塊判斷等,涉及矢量量化技術(shù)、動態(tài)時間規(guī)整技術(shù)等。其中,馬爾可夫模型算法具有顯著的優(yōu)質(zhì)性和簡便性,語音識別效果更加理想,在語音識別系統(tǒng)中具有極為廣泛的應(yīng)用。第三是神經(jīng)網(wǎng)絡(luò)識別方法,是一種新興技術(shù),可以模擬人類神經(jīng)活動,且具有一定的人類特性,包括自動適應(yīng)、自主學(xué)習(xí)等,在映射能力和歸類能力方面具有優(yōu)異的表現(xiàn)。實踐應(yīng)用過程中,通過對傳統(tǒng)方法和神經(jīng)網(wǎng)絡(luò)識別方法的靈活融合,能夠有效彌補(bǔ)兩種方法的不足,令語音識別功能具有更高的效率。……