王順利 夏長(zhǎng)春 付嘉銘

摘 要 語(yǔ)音增強(qiáng)是語(yǔ)音處理的一個(gè)重要技術(shù),許多研究人員正通過不懈努力來尋求多種優(yōu)秀的語(yǔ)音增強(qiáng)算法,其目的是為了提高語(yǔ)音的清晰度和理解度。然而這兩個(gè)目標(biāo)是不相關(guān)的,有時(shí)甚至是相互矛盾的,因此語(yǔ)音增強(qiáng)系統(tǒng)是根據(jù)不同的應(yīng)用場(chǎng)合來選擇的。
關(guān)鍵詞 語(yǔ)音增強(qiáng) 語(yǔ)音信號(hào) 噪音污染 抑制干擾
中圖分類號(hào):TN912 文獻(xiàn)標(biāo)識(shí)碼:A
1語(yǔ)音增強(qiáng)技術(shù)的研究意義
1.1語(yǔ)音增強(qiáng)技術(shù)簡(jiǎn)介
語(yǔ)音信號(hào)處理是一種在信息高速公路中的應(yīng)用的關(guān)鍵技術(shù),新興的多媒體技術(shù),辦公自動(dòng)化,現(xiàn)代通信和智能系統(tǒng)技術(shù),它主要包括語(yǔ)音通信,語(yǔ)音合成,識(shí)別和語(yǔ)音增強(qiáng)。然而,在接收到語(yǔ)音信號(hào)的同時(shí),語(yǔ)音的干擾將不可避免地受到噪聲的影響。一些傳輸媒體,如通訊設(shè)備,電子音響和其他揚(yáng)聲器就會(huì)出現(xiàn)這種情況。這些語(yǔ)音干擾不僅會(huì)造成噪音污染,還會(huì)導(dǎo)致許多語(yǔ)音處理系統(tǒng)性能的急劇惡化。
語(yǔ)音增強(qiáng)作為一種預(yù)處理方案是抑制干擾的一種有效途徑,是語(yǔ)音信號(hào)的其他應(yīng)用基礎(chǔ)。通過對(duì)語(yǔ)音增強(qiáng)技術(shù)的深入研究,人們?cè)絹碓揭庾R(shí)到由于噪聲通常是隨機(jī)的,從帶有噪聲的語(yǔ)音信號(hào)中提取完全純化的原始語(yǔ)音信號(hào)幾乎是不可能的。
語(yǔ)音增強(qiáng)是一個(gè)非常復(fù)雜的技術(shù),不僅是數(shù)字信號(hào)處理的問題,還涉及到聽覺感知特性和人類的語(yǔ)音特征。同時(shí),多樣性的噪聲,即噪聲來源眾多,具有不同的應(yīng)用和不同的特點(diǎn),增加了語(yǔ)音增強(qiáng)的困難。因此,一勞永逸的設(shè)計(jì)一種算法是不可能的,噪音是唯一的,處理不同的噪聲就要使用不同的語(yǔ)音增強(qiáng)算法。如圖1所示,是噪聲對(duì)消法的原理框圖。
1.2語(yǔ)音增強(qiáng)技術(shù)的研究目的
由于受到環(huán)境噪聲的影響,語(yǔ)音通信過程中的干擾是不可避免的,從周圍的環(huán)境引發(fā)的噪聲嚴(yán)重影響了電子通信設(shè)備的語(yǔ)音信號(hào)采集。這些干擾將最終接收到的聲音是不純凈的原始語(yǔ)音信號(hào),而是受噪聲污染的語(yǔ)音信號(hào)。例如,安裝在汽車,飛機(jī),船只,機(jī)場(chǎng)內(nèi)的公共電話,干擾往往是由強(qiáng)背景噪聲引起的,嚴(yán)重影響通信的質(zhì)量。
實(shí)際語(yǔ)音常常帶有各種噪聲信號(hào),為了從噪聲信號(hào)中獲得純凈的語(yǔ)音信號(hào),減少噪音的干擾,就需要使用語(yǔ)音增強(qiáng)技術(shù)。因?yàn)橐话愕母蓴_信號(hào)是隨機(jī)信號(hào),想完全消除噪聲是不現(xiàn)實(shí)的,因此研究語(yǔ)音增強(qiáng)技術(shù)的目的主要是為了減少人們的疲勞,提高語(yǔ)音質(zhì)量,提高語(yǔ)音處理系統(tǒng)的識(shí)別能力,提升語(yǔ)音的清晰度,提高手機(jī)的識(shí)別率和抗干擾能力。
人耳對(duì)背景噪聲的抑制作用顯著,理解其機(jī)制有助于語(yǔ)音增強(qiáng)技術(shù)的發(fā)展。人類的聽覺系統(tǒng)可以從非平穩(wěn)噪聲中提取有用的信息,但有的語(yǔ)音增強(qiáng)采取了語(yǔ)音聽覺系統(tǒng)模擬技術(shù),這是人類未來科技的發(fā)展方向。許多環(huán)境噪聲是非平穩(wěn)的,所以很難找到一個(gè)共同的語(yǔ)音增強(qiáng)算法適用于各種噪聲環(huán)境。因此,非平穩(wěn)語(yǔ)音的隨機(jī)噪聲增強(qiáng)技術(shù)的研究具有十分重要的意義,這項(xiàng)工作將會(huì)在近幾年進(jìn)一步擴(kuò)展。
隨著語(yǔ)音激勵(lì)特點(diǎn)的深入分析研究,非線性語(yǔ)音信號(hào)的非平穩(wěn)性越來越受到人們的重視。傳統(tǒng)的線性分析技術(shù)也日益暴露出其對(duì)非線性信號(hào)處理的局限性,很難在理論和技術(shù)上有所突破,不同的研究方向開始進(jìn)展緩慢或停滯。因此,人們開始尋求新的數(shù)學(xué)方法分析語(yǔ)音信號(hào)的處理,各種非線性方法的研究是語(yǔ)音分析領(lǐng)域的一個(gè)熱門話題,如模糊理論,混沌分析和數(shù)學(xué)形態(tài)學(xué)。
2語(yǔ)音增強(qiáng)技術(shù)的研究背景
2.1語(yǔ)音增強(qiáng)技術(shù)的一般研究方法
語(yǔ)音增強(qiáng)技術(shù)成為語(yǔ)音數(shù)字信號(hào)處理的重要組成部分。語(yǔ)音增強(qiáng)是對(duì)帶噪語(yǔ)音進(jìn)行處理,以改善語(yǔ)音質(zhì)量,提高語(yǔ)音清晰度,可懂度和舒適度,使人們易于接受或提高語(yǔ)音處理系統(tǒng)的性能。環(huán)境噪聲污染使許多語(yǔ)音處理系統(tǒng)的性能急劇惡化。語(yǔ)音識(shí)別技術(shù)已經(jīng)取得了重大的進(jìn)展,進(jìn)入了實(shí)用階段。但目前的識(shí)別系統(tǒng)只能在安靜的環(huán)境中正常工作,在噪聲環(huán)境下,特別是在強(qiáng)噪聲環(huán)境下,語(yǔ)音識(shí)別率會(huì)受到影響。
由于語(yǔ)音生成模型的編碼參數(shù)比特率非常低,當(dāng)混合背景噪聲干擾嚴(yán)重時(shí)提取語(yǔ)音信號(hào),重建語(yǔ)音的質(zhì)量會(huì)急劇惡化,甚至完全無法理解。在這種情況下,語(yǔ)音增強(qiáng)作為一種預(yù)處理方法,是一種有效的方法,解決了噪聲污染。
2.2語(yǔ)音增強(qiáng)技術(shù)的應(yīng)用背景
語(yǔ)音增強(qiáng)作為預(yù)處理,或抑制背景噪聲,提高語(yǔ)音質(zhì)量,是一種用來解決噪聲污染有效的方法。因此,語(yǔ)音增強(qiáng)應(yīng)用技術(shù)的研究具有重要的實(shí)踐價(jià)值。目前,語(yǔ)音增強(qiáng)系統(tǒng)在語(yǔ)音通信,多媒體技術(shù),數(shù)字家電等領(lǐng)域已被廣泛應(yīng)用。
語(yǔ)音增強(qiáng)的主要目的是從帶噪語(yǔ)音信號(hào)中提取盡可能多的純凈原始語(yǔ)音。然而,由于干擾通常是隨機(jī)的,從嘈雜的語(yǔ)音中完全提取純凈的原始語(yǔ)音幾乎是不可能的。在這種情況下,語(yǔ)音增強(qiáng)的目的主要有兩個(gè):一是語(yǔ)音質(zhì)量的改善,消除背景噪聲,使人們?cè)敢饨邮埽藗兊穆犛X疲勞,這是主觀測(cè)量,另外一個(gè)就是提高語(yǔ)音的可懂性,這是一個(gè)客觀的測(cè)量。但這兩個(gè)目標(biāo)不可兼得,因此在實(shí)際應(yīng)用中往往是根據(jù)具體情況來確定的。
參考文獻(xiàn)
[1] 黃蘇雨,梁聲灼,黃蘇園.語(yǔ)音增強(qiáng)方法綜述[J]. 計(jì)算機(jī)與現(xiàn)代化,2007(03).
[2] 孫晉松.語(yǔ)音增強(qiáng)算法的研究及改進(jìn)[D]. 山東大學(xué),2009.