趙霞
摘要:隨著計(jì)算機(jī)技術(shù)的逐步發(fā)展,人與計(jì)算機(jī)之間的溝通方式有了更高的標(biāo)準(zhǔn),這也進(jìn)一步推動(dòng)了語(yǔ)音識(shí)別這項(xiàng)技術(shù)的進(jìn)步和發(fā)展,使之成為語(yǔ)音處理范疇當(dāng)中的重要內(nèi)容。語(yǔ)音識(shí)別目前在無(wú)噪音干擾的情況下,具有非常高的識(shí)別率,但是如果環(huán)境當(dāng)中存在噪音,那么這種識(shí)別率就會(huì)大大降低,因?yàn)樵胍魰?huì)導(dǎo)致訓(xùn)練模板和待識(shí)別模板無(wú)法進(jìn)行匹配。所以,對(duì)于語(yǔ)音識(shí)別技術(shù)來(lái)說(shuō),噪音是其發(fā)展過(guò)程中的重要阻礙,所以對(duì)于噪音環(huán)境下的語(yǔ)音識(shí)別算法進(jìn)行研究是非常有意義的。
關(guān)鍵詞:噪音環(huán)境;語(yǔ)音識(shí)別;功能分析
中圖分類號(hào):TP393? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)28-0224-02
在人們的工作和生活中,需要利用語(yǔ)言來(lái)進(jìn)行溝通和交流,通過(guò)語(yǔ)言來(lái)傳播多種信息。相比于文字來(lái)說(shuō),語(yǔ)言的傳播效率更高。隨著信息技術(shù)的不斷發(fā)展,計(jì)算機(jī)已經(jīng)成了人們生活和工作當(dāng)中的不可或缺的部分。因此,人們除了相互之間的交流之外,也需要和計(jì)算機(jī)進(jìn)行頻繁的交流和溝通。在這樣的背景之下,使得人們能夠通過(guò)語(yǔ)言和計(jì)算機(jī)來(lái)進(jìn)行溝通和交流,成了計(jì)算機(jī)發(fā)展過(guò)程中非常重要的內(nèi)容,所以對(duì)于語(yǔ)音識(shí)別技術(shù)的研究和發(fā)展具有重要的意義。
1 語(yǔ)音識(shí)別功能分析
語(yǔ)音識(shí)別技術(shù)涉及的學(xué)科領(lǐng)域非常廣泛,包括信號(hào)處理、語(yǔ)言學(xué)以及模式識(shí)別等等。這項(xiàng)技術(shù)目前被應(yīng)用到了信息處理和計(jì)算機(jī)等領(lǐng)域當(dāng)中,其具備的功能主要包括以下幾個(gè)方面。首先是文本輸入功能,所謂文本輸入就是將人類語(yǔ)言轉(zhuǎn)化為文本,從而使得文本的輸入過(guò)程變得更加便捷。其次是語(yǔ)音控制功能,所謂語(yǔ)音控制就是通過(guò)語(yǔ)音來(lái)完成計(jì)算機(jī)的工作過(guò)程,從而有效提升人類的工作效率。最后是身份識(shí)別,這有點(diǎn)類似于指紋和人臉識(shí)別,是將語(yǔ)音來(lái)作為識(shí)別的對(duì)象。
2 噪聲分類
2.1乘性噪聲
具體來(lái)看,語(yǔ)音和噪聲之間的關(guān)系實(shí)際上是相乘的,信號(hào)經(jīng)過(guò)頻譜后會(huì)出現(xiàn)衰弱現(xiàn)象,采集聲音裝置當(dāng)中的和信號(hào)傳輸過(guò)程中的衰弱情況都屬于乘性噪聲。乘性噪聲可以在某種情況下轉(zhuǎn)化為加性噪聲,而加性噪聲則是平時(shí)的主要研究目標(biāo)。
2.2加性噪聲
在語(yǔ)音信號(hào)當(dāng)中,噪音實(shí)際上是處于疊加狀態(tài)中的,所以從語(yǔ)音信號(hào)的角度來(lái)看,這種噪聲應(yīng)該被稱為加性噪聲。加性噪聲具體包括汽車聲音、人們的說(shuō)話聲音、家具的聲音以及風(fēng)扇的聲音等等。利用聲音采集裝置時(shí),加性噪聲和收集的語(yǔ)音兩者之間屬于相加的關(guān)系。這種噪聲對(duì)于語(yǔ)音識(shí)別率的影響是最大的。
2.3平穩(wěn)噪聲
生活中的大部分噪聲都屬于非平穩(wěn)噪聲,但這種噪聲研究起來(lái)較為困難,所以通常情況下是研究平穩(wěn)噪聲,因?yàn)檫@種造成屬于非時(shí)變?cè)肼暋?/p>
2.4沖擊噪聲
所謂沖擊噪聲,是指在較短的時(shí)間當(dāng)中出現(xiàn)劇烈變化的噪聲,例如槍聲,這種噪聲隨機(jī)程度較大,所以很難進(jìn)行分析和研究。
2.5緩變?cè)肼?/p>
緩變?cè)肼暿侵冈谙鄳?yīng)的時(shí)間當(dāng)中緩慢進(jìn)行變化的噪聲,例如人群形成的噪聲。
3 噪聲對(duì)語(yǔ)音識(shí)別的影響
語(yǔ)音識(shí)別率下降,是因?yàn)橛?xùn)練模板和識(shí)別模板之間的匹配過(guò)程受到了噪聲的影響,在平時(shí)的訓(xùn)練過(guò)程中,是處于安靜的環(huán)境當(dāng)中,且應(yīng)用的都是純凈語(yǔ)音。而在具體的應(yīng)用過(guò)程中,是一定的會(huì)存在噪音的。當(dāng)處于噪聲環(huán)境下時(shí),語(yǔ)音信號(hào)的參數(shù)會(huì)出現(xiàn)變化。而對(duì)于語(yǔ)音進(jìn)行識(shí)別的過(guò)程中,會(huì)發(fā)現(xiàn)其參數(shù)與數(shù)據(jù)庫(kù)中的內(nèi)容無(wú)法形成匹配,從而導(dǎo)致識(shí)別率下降。為了解決這個(gè)問(wèn)題,就必須去消除噪聲對(duì)于語(yǔ)音參數(shù)的影響。
4 噪聲環(huán)境下的語(yǔ)音識(shí)別算法研究
經(jīng)過(guò)了近些年來(lái)的研發(fā)過(guò)程,使得語(yǔ)音識(shí)別技術(shù)得到了迅速的發(fā)展,但是在具體的應(yīng)用過(guò)程中仍然存在一些問(wèn)題,例如在噪聲影響的情況下,語(yǔ)音識(shí)別率降低,因此對(duì)于噪聲環(huán)境下的語(yǔ)音識(shí)別進(jìn)行研究是非常重要的。現(xiàn)實(shí)環(huán)境中的大部分噪聲都屬于加性噪聲,因此下面將會(huì)把加性噪聲作為主要的研究?jī)?nèi)容。通常來(lái)看,噪聲都是處于非平穩(wěn)狀態(tài)下的,通過(guò)增強(qiáng)語(yǔ)音信號(hào)來(lái)消除掉信號(hào)中的噪聲從而獲得了增強(qiáng)語(yǔ)音的效果。而在這個(gè)過(guò)程中,實(shí)際上增強(qiáng)語(yǔ)音的主要目的就是提升語(yǔ)音信號(hào)信噪比,從而提升聲音的清晰程度。增強(qiáng)語(yǔ)音和加強(qiáng)噪聲環(huán)境中的語(yǔ)音識(shí)別率是相同的。通常情況下,在系統(tǒng)前端來(lái)完成語(yǔ)音增強(qiáng),消除冗余噪聲,從而避免因?yàn)樵肼暤某霈F(xiàn)而使得訓(xùn)練和識(shí)別模板無(wú)法匹配。從目前的情況來(lái)看,語(yǔ)音增強(qiáng)算法的應(yīng)用已經(jīng)變得非常廣泛,且應(yīng)用的方式都十分系統(tǒng)。噪聲的出處十分廣泛,處于不同場(chǎng)合的情況下所面臨的噪聲也各有不同,根據(jù)噪聲的不同,需要采取相對(duì)應(yīng)的語(yǔ)音增強(qiáng)方式。具體來(lái)看,語(yǔ)音增強(qiáng)算法具體包括了噪音對(duì)消算法、諧波增強(qiáng)算法、語(yǔ)音短時(shí)譜估計(jì)增強(qiáng)算法、小波分析語(yǔ)音增強(qiáng)算法等等。
4.1噪音對(duì)消算法
噪音對(duì)消算法屬于眾多算法當(dāng)中最為基本的算法之一,其原理是將噪聲語(yǔ)音中的噪聲直接去除掉,通常是采用雙麥克風(fēng)的方式來(lái)對(duì)信號(hào)進(jìn)行采集,兩個(gè)麥克風(fēng)一個(gè)用來(lái)采集噪聲語(yǔ)音,另一個(gè)用來(lái)采集噪聲,并將這兩個(gè)麥克風(fēng)采集到的頻譜分量相減,最后得到語(yǔ)音信號(hào)增強(qiáng)的效果。在這個(gè)過(guò)程中需要注意的是,保持好雙麥克風(fēng)的距離,避免相互之間形成干擾。當(dāng)噪聲背景較強(qiáng)時(shí),較為適宜采用這種方式來(lái)消除噪聲。另外一方面,在采集信號(hào)時(shí),可以安裝自適應(yīng)濾波裝置來(lái)提升采集效果。
4.2小波分析語(yǔ)音增強(qiáng)算法
通過(guò)小波分析語(yǔ)音增強(qiáng)算法,能夠?qū)τ谛〔ㄟM(jìn)行分解,從而完成信號(hào)的多分辨率分析。這種算法具有多種不同的特性,所以目前應(yīng)用的較為廣泛。小波分解后獲得的各層系數(shù)表現(xiàn)出了不同分辨率當(dāng)中信號(hào)的信息。由于語(yǔ)音和招生在各層系數(shù)當(dāng)中有著不同的特性,所以可以利用這種特點(diǎn)來(lái)實(shí)現(xiàn)噪聲去除。目前來(lái)看,最為常用的噪聲去除方法包括相關(guān)性噪聲消除法、模極大值噪聲消除法等等。首先是模極大值噪聲消除法,這種方法的原理是在各層小波系數(shù)中,語(yǔ)音信號(hào)和噪聲的模極大值所呈現(xiàn)出的規(guī)律各不相同,根據(jù)這一特點(diǎn)而提出的這種噪聲消除方法。當(dāng)脈沖噪聲點(diǎn)非常多或者信噪比較低的時(shí)候,這種消除方法是非常適用的。模極大值噪聲消除方法主要應(yīng)用于對(duì)高斯白噪聲的消除,通過(guò)這種方式去除噪聲會(huì)避免信號(hào)的震蕩,從而保持語(yǔ)音質(zhì)量的完好。但這種噪聲消除方法的缺點(diǎn)在于計(jì)算速度非常緩慢。其次是相關(guān)性噪聲消除方法,這種噪聲消除法主要是利用小波系數(shù)之間的相關(guān)特性。對(duì)于噪聲進(jìn)行分解之后,所獲得的小波系數(shù)之間不含有相關(guān)性,而這種造成消除方法正式基于這一特點(diǎn)而被研發(fā)的。噪聲所產(chǎn)生的能量基本上在小尺度上進(jìn)行分布,所以尺度逐漸變化后噪聲的強(qiáng)度會(huì)降低,從而對(duì)噪聲進(jìn)行有效的濾除,進(jìn)而將信號(hào)中的有用部分進(jìn)行保留。
5 結(jié)束語(yǔ)
隨著語(yǔ)音識(shí)別技術(shù)的高速進(jìn)步和發(fā)展,當(dāng)處于實(shí)踐環(huán)境當(dāng)中時(shí),這種技術(shù)的識(shí)別功能非常好,但是想要讓這種技術(shù)的實(shí)用性更強(qiáng),就必須解決噪聲的影響問(wèn)題,因?yàn)樵趯?shí)際的應(yīng)用過(guò)程中是不可能徹底避免噪聲干擾的,因此,對(duì)于語(yǔ)音識(shí)別系統(tǒng)進(jìn)行應(yīng)用的關(guān)鍵在于該系統(tǒng)在噪聲環(huán)境下所具備的性能。當(dāng)處于噪聲環(huán)境中時(shí),本文提出的幾種語(yǔ)音識(shí)別算法都能夠有效的消除噪聲,但是在其中仍然存在著一些不足,需要今后去不斷的探索和完善。
參考文獻(xiàn):
[1] 曹晶晶,許潔萍,邵聖淇.多噪聲環(huán)境下的層級(jí)語(yǔ)音識(shí)別模型[J].計(jì)算機(jī)應(yīng)用,2018,38(6):1790-1794.
[2] 劉晶.基于盲源分離和噪聲抑制的語(yǔ)音信號(hào)識(shí)別[J].計(jì)算機(jī)測(cè)量與控制,2018,26(12):140-144.
[3] 婁英丹,徐靜林,黃麗霞, 等.MLLR和MAP在遠(yuǎn)場(chǎng)噪聲混響下的語(yǔ)音識(shí)別研究[J].計(jì)算機(jī)工程與應(yīng)用,2019.
【通聯(lián)編輯:光文玲】