999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于MATLABSTM32的語音信號增強、系統建模與仿真優化

2018-09-21 11:07:22史曉兵尤鳳翔黃克亞
中國管理信息化 2018年13期

史曉兵 尤鳳翔 黃克亞

[摘 要] 傳統的算法雖然能夠抑制語音中的噪聲,但易造成語音的失真。本文建立了一種改進的閾值法語音信號增強算法。通過MATLAB仿真平臺的實驗仿真和傳統增強算法的比較,證明了本方法能有效去除信號中的噪聲、改進語音質量、提高語音可懂度,達到增強語音信號的效果;在此基礎上,利用STM32對系統在兩種不同環境下進行了測試,然后根據測試結果進一步對系統進行了優化。優化內容集中在語音命令模式、增添命令列表和修改錄音參數三個方面,最終對優化后的系統再次進行了相同的測試,取得了相較于之前更加滿足要求的結果。

[關鍵詞] 語音信號;語音凈化;MATLAB; STM32;仿真優化

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 13. 068

[中圖分類號] TN912.34 [文獻標識碼] A [文章編號] 1673 - 0194(2018)13- 0149- 05

0 引 言

語音信號處理是研究用數字信號處理技術對語音信號進行處理的一門學科。其目的是要通過處理得到一些能夠反映語音信號的特征語音參數來高效率地傳輸或存儲語音信號信息[1-3];同時進行一些運算來滿足某些應用的要求,如人工合成出語音,識別講話者、說話人性別鑒定等。特別是在高鐵快速發展的關鍵時期,語音通信系統是保障鐵路高效安全運行的關鍵技術之一[4];而物聯網技術的廣泛應用,智能社會的快速推廣,為使用者提供了更加方便的方式來控制各種設備[5-6]。例如通過手機應用、紅外遙控或者聲控等方式來快捷地控制設備;另外,連入智能社會系統的設備之間通過統一的主機完成相互通信,不需要使用者刻意調控,也可以自行實時觀察社會環境情況,調節各部分參數,以提供科學舒適節能的社會環境;而且,智能社會的實現可以為用戶提供個性化的設定,滿足不同人對社會環境不同的需求,而這些與語音信號處理和優化是分不開的。語音識別作為智能社會中一種重要的控制方式,可以毫不夸張地被形容為智能社會系統的“聽覺系統”,所以,對語音信號系統建模與仿真研究具有重要的意義。

1 語音特性

語音是一時變的、非平穩的隨機過程,但由于一段時間內(10-30ms )人的聲帶和聲道形狀的相對穩定性,可認為其特征是不變的,因而語音的短時譜具有相對穩定性。在語音分析中可利用短時譜的這種穩定性。

語音信號可以分為清音和濁音兩大部分。濁音在時域上呈現出明顯的周期性;在頻域上有共振峰結構,而且能量大部分集中在較低頻段內。而清音段沒有明顯的時域和頻域特征,類似于白噪聲(這就是很難將語音信號中的白噪聲去除的主要原因之一)。清音的能量主要集中在比濁音更高的頻率范圍上,一般在2 500Hz以上[7-8] 。

采用常規閾值方法對含噪語音信號進行去噪處理,可以獲得一定的增強效果,但仍存在一些問題需進一步解決。這主要是由于語音信號的特殊性,直接采用閾值處理效果不是很理想。這是因為語音中的清音包含了相對多的高頻成分,在實行閾值處理時會被當成噪聲去除掉。同時,考慮到隨機噪聲的小波變換在不同尺度上的不同特征表現,即:高頻系數幅值隨著尺度的增加而很快地衰減,而且,高頻系數的方差也很快地衰減,所以,必須對常規閾值增強方法進行改進。

2 基于MATLAB的語音增強仿真實驗

2.1 模型建立

(1)小波分解。選擇合適的小波,并確定小波分解層次k,對f(t)做小波變換,則可得到不同尺度下的小波變換系數W2dkf和S2dkf;并計算每個尺度上的平均能量,進行能量的歸一化。

(2)清濁音判別。在閾值處理之前先進行清濁音判別。鑒于語音信號的小波變換特性,對于低尺度參數,因包含許多高頻成分的清音段與隨機噪聲混雜在一起,在進行閾值處理時會被當作噪聲去掉,而嚴重影響重構語音的質量,因此,事先進行清濁音判別,可在抑制噪聲的同時保持清音中的重要信息;同時,對不同尺度選取不同的閾值。

根據清音、濁音信號在不同尺度上的小波變換系數分布不同[9-10],清濁音判斷方法可為:如果輸入的語音段滿足:① 最小尺度上的信號能量最高(即高頻段信號能量最強);② 最大尺度上的信號能量與最小尺度上的信號能量之比小于0.9,則判斷為清音,否則判斷為濁音。

2.2 仿真實驗

本文采用MATLAB仿真平臺進行仿真實驗。所用原始語音“高鐵”是在安靜的環境下,利用話筒錄得的一段語音信號。噪聲為含有白噪聲和有色噪聲的現場噪聲。實驗結果分別用信噪比、主觀聽覺和信號波形比較來評價。

本文通過對5個不同輸入信噪比的含噪語音樣本進行去噪增強的仿真實驗,語音實驗情況見圖1(含噪語音信號SNR=5dB)和表1。圖1 (a)為“高鐵”原始語音信號波形,圖1 (b)為“高鐵”加噪語音信號波形,圖1 (c)為改進閾值法“高鐵”增強后語音信號波形,圖1 (d)為軟閾值法增強后語音信號波形。

(a) 原始語音信號,(b) 含噪語音信號(SNR=5dB),(c) 本文改進閾值法增強后語音信號,(d)軟閾值法增強后語音信號。如圖1 (c)所示,通過本方法去噪增強后,連續語音的輪廓平滑,基本上去除了噪音,接近原始信號,有聲區由噪聲引起的毛刺明顯減弱,無聲區的噪聲消除效果更為明顯,非常接近原始信號。由于在進行閾值處理以前加上了清濁音的判斷,對語音的不同部分給予不同的閾值處理,所以對清音段和濁音段的噪聲,本方法都能較好地去除。從聽覺效果上來說,去噪后基本上聽不出背景噪聲,和原語音非常接近,語音增強效果顯著。用軟閾值法來做比較。圖1(d)是樣本“高鐵”用軟閾值法去噪增強后的實驗結果。雖然看到經過去噪后波形相對平滑,但從聽覺上來說,語音的可懂度和清晰度沒有用本方法的效果好,仍會有殘留噪音無法去除,語音增強效果有限。

對于5個不同輸入信噪比的含噪語音樣本,我們用本文算法和軟閾值法分別進行實驗,并把結果寫入表1。

從表1實驗結果中,我們可以看到,用本文算法和軟閾值算法增強語音,實驗后輸出信噪比都有所提高,而本文算法明顯優于軟閾值算法。

3 基于 STM32的語音信號性能測試及優化

3.1 優化前測試

為了讓所涉及語音識別系統識別率、穩定性、靈敏度能夠達到要求,本文分別在安靜的家庭環境和嘈雜的食堂環境對所設計系統進行了測試。測試內容為針對語音列表2中的4條語音命令,3名使用者保證在2m的接收距離情況下分別進行10次測試,總計每人在某一環境下40次,總240次。測試結果如下表2。

從表2中可以看出,在較為安靜的家庭環境中,對非特定人的識別率可以維持在70%以上,而在相對嘈雜的食堂環境下識別率在50%以上。由此可見,在識別準確性上,安靜環境好于嘈雜環境,而至于穩定性,安靜環境同樣高于嘈雜環境。不過,在該次試驗中,兩種環境下都還存在誤識別的情況。

為了進一步提高系統識別率,減少誤識別,增加識別距離,本文對該系統進行了相應的優化和改善。

3.2 系統優化

3.2.1 語音命令模式優化

參考市面上常見的語音識別設備,例如蘋果公司的人工智能Siri,除了通過home鍵喚醒外,還可以通過說出“hi,siri”口令來激活siri,還有亞馬遜公司的智能家居系統Echo只有在聽到“Alexa”這個單詞時才會被喚醒并等待其他有關操作的語音命令。這些例子中的語音識別系統都通過增加一個固定命令激活系統的方式來降低系統誤識別/誤觸發的可能性。

這種模式的原理就是在平常狀態下語音識別系統僅在聽到一個設定好的固定命令詞才會進入接收命令狀態,通過增加了一層命令確認流程來提高語音識別準確性。

雖然也可以在語音命令結束后再增加一個固定命令詞來進一步約束對命令的識別,以達到三級識別過程,來提高準確性,但考慮到這樣會相應增加使用難度,所以本文選擇只在具體命令前增加一級固定識別命令。本文給系統加入的固定識別詞是“鼠標鼠標”,也即使用者在說出“鼠標鼠標”后再說出相應命令即可。

3.2.2 增加命令列表

本文所使用的語音模塊可以錄入多達2 000條指令,雖然家用環境中并不會有2 000種功能相對應,但是可以通過錄入垃圾關鍵詞、同類詞、同音方言來提高系統準確性。

(1)錄入垃圾關鍵詞。在正常使用情境中,很可能出現用戶說錯命令,系統誤識別的情況。鑒于本系統采用的語音識別方式是將錄入的信號特征提取后與芯片內命令列表進行比對打分,將打分最高且滿足最低要求的選項作為識別結果,所以可以將日常生活中可能出現的錯誤命令增加到命令列表中,將該類詞的返回值設定為同一個值,同時設定控制器對該返回值不做回應,并提示用戶重新說出命令即可。

在本系統的實際使用情況中可能存在并已錄入的錯誤命令有:“開燈”“關燈”“客廳燈”“臥室燈”“嗯嗯”等。

(2)錄入同類詞。對于同一個命令,用戶可能有其他多種表達方式,比如“打開客廳燈”這一命令,就可能被說成“把客廳燈打開”“客廳燈打開”“開客廳燈”等。充分利用2 000條的可錄入命令空間,將同一含義的命令都統一錄入,并設置為相同返回值,這樣系統在識別到此類詞時就可以做出相應的操作,從而提高使用者操作該系統的便捷性,不必糾結于某一準確的命令。

(3)錄入方言。考慮到用戶說出的命令帶有一定的方言口音,而本文中的語音識別系統命令詞的錄入是依據英文單詞和漢字,所以與(2)類似,針對一定的方言命令可以考慮錄入諧音的命令作為同類詞來適當解決這一問題。例如,在晉南地區,“開燈”可能會發音為“凱等”,所以在有“開燈”這一命令詞的情況下,可以錄入“凱等”這一同類詞。

3.2.3 修改錄音參數

(1)降低錄音時間。在用戶激活系統后,系統會設定一段固定時間進行錄音并識別。可以根據實際情況降低這一時間來減少系統可能錄入的命令外的無用信息。本文所用系統的所有錄入命令正常情況下表達時間不會超過4秒,所以可以將初始默認的6秒等待時間改為4秒,進而避免在說完命令后系統還繼續錄入過多其他信息。

(2)修改麥克風相關寄存器。LD3320的麥克風增益寄存器地址是“0x35”,對于該寄存器,在例如家庭環境的室內或者是比較安靜的室外環境,一般可以設定在0x40-0x53的范圍內。設定過高的數值,會產生類似極近距離對麥克風說話的效果,即出現語音采樣錄入過激,嚴重影響識別率。為了適當提高識別距離,將初始設定的0x42改為0x50。但這一改變主要針對的是相對安靜的家庭環境,對于嘈雜的環境,調高增益會放大雜音,影響識別效果。

LD3320的麥克風靈敏度寄存器地址是“0xb3”,為了提高識別率,適當增加識別距離,將初始設定的“0x13”改為“0x0e”。

另外需要說明的是對于語音識別系統中麥克風的優劣對系統的識別效果有較大的影響。首先質量上,好的麥克風錄音頻響曲線相對平整,電噪聲小,能夠將較遠距離的語音信號更加清晰地錄入系統。而在種類上,目前有很多麥克風零件是針對手機設計和生產的,該類產品特點在于近距離錄音,從而抑制遠處環境噪音。但對于家居語音識別系統而言,此類麥克風識別距離過短,不宜使用。本文中使用麥克風為較遠距離識別類型,識別距離大概穩定在3m左右,質量中等,未做多種類麥克風錄音效果對比試驗。

3.2.4 優化后結果

在對系統進行了以上優化后,再一次針對系統語音識別做出了與之前相同的測試。測試結果如表3。

不難看出,相比優化之前的識別結果,因為適當地提高了麥克風增益和靈敏度,所以使得在嘈雜環境中的識別率有所降低,但是在家庭環境中的識別率則大大提升,考慮到本系統的目標使用環境就是家庭環境,所以這樣的改進對系統的功能是利大于弊的。

在考慮到所有這些情況下,本系統盡可能滿足在正常情況下于家庭環境中對語音識別系統的使用效果,至于測試結果所顯示的對于嘈雜環境的低識別率情況,因為該測試都是保持說話人與麥克風2m的距離進行的測試,在實際使用中,如果家庭環境下相對吵鬧時,可以適當靠近語音模塊麥克風進行語音控制,相對識別率會大大提高。

4 結 語

本文在傳統軟閾值法增強的基礎上,采用基于小波變換的改進閾值法進行語音去噪增強的實驗,并和軟閾值法做了比較。實驗證明,本文所用方法很好地抑制了語音中的噪聲,信噪比提高顯著,完整地保留了語音中清音的重要信息,是一種有效的語音信號增強方法。在此基礎上,利用STM32對系統在兩種不同環境下進行了測試,然后根據測試結果進一步對系統進行了優化。優化內容集中在語音命令模式、增添命令列表和修改錄音參數三個方面,最終對優化后的系統再次進行了相同的測試,取得了相較于之前更加滿足要求的結果。由于存在環境噪聲的影響,本系統盡可能滿足在正常情況下社會環境中對語音識別系統的使用效果,至于測試結果所顯示的對于嘈雜環境的低識別率情況,因為該測試都是保持說話人與麥克風2m的距離進行的測試,在實際使用中,如果社會環境下相對吵鬧時,可以適當靠近語音模塊麥克風進行語音控制,相對識別率會大大提高。

主要參考文獻

[1]Mallat S,HwangWL.Singularity Detection and Processing with Wavelets[J].IEEE Transaction on Information Theory,1992,38(2):617-643.

[2]Donoho D L, Johnstone I M. Ideal Spatial Adaption via Wavelet Shrinkage [J]. Biometrika,1994,81(3):425-455.

[3]Donoho D L. Denoising by Soft-thresholding [J]. IEEE Transaction on Information,1995,41(3):613 -627.

[4]尤一龍,張飛,尤鳳翔. 基于MATLAB仿真平臺語音信號增強的研究[C]//中國人類工效學學會第八次學術交流會,2012.

[5]寧煥生,徐群玉. 全球物聯網發展及中國物聯網建設若干思考[J].電子學報,2010,38(11):2590-2599.

[6]孫其博,劉杰,黎羴,等. 物聯網:概念、架構與關鍵技術研究綜述[J].北京郵電大學學報,2010,33(3):1-9.

[7] 馬曉紅,宋輝,殷福亮. 自適應小波閾值語音增強新方法[J].大連理工大學學報,2006,46(4):561-566.

[8]張昊. 語音數字信號增強處理及其Matlab實現[J].通信技術, 2009, 42 (1):280-281.

[9]李玉,于鳳芹,范樹凱. 基于改進噪聲方差估計的小波閾值語音增強[J].電聲技術,2008,32(3):56-58.

[10]蘇秦. 基于小波變換的多尺度多閾值語音信號去噪[J].蘇州大學學報:工科版,2003,23(6):18-22.

主站蜘蛛池模板: 国内精自线i品一区202| 国产精品部在线观看| 国产精品19p| 国产一线在线| 亚洲成a∧人片在线观看无码| 国产伦精品一区二区三区视频优播| 91啦中文字幕| 久久中文字幕av不卡一区二区| 伊人久久福利中文字幕| 欧美日韩国产精品综合| 精品国产91爱| A级毛片高清免费视频就| 国产人成网线在线播放va| 黑人巨大精品欧美一区二区区| 国产人成乱码视频免费观看| AV色爱天堂网| 四虎在线观看视频高清无码| 欧美精品H在线播放| 一级成人a做片免费| 成人字幕网视频在线观看| 伊伊人成亚洲综合人网7777| 国产真实自在自线免费精品| 中国一级特黄大片在线观看| 自拍偷拍欧美日韩| 中文字幕亚洲第一| www.亚洲一区| 国产精品粉嫩| 热久久综合这里只有精品电影| 国产粉嫩粉嫩的18在线播放91 | 国产精品自拍合集| 在线观看无码a∨| 久久久久亚洲精品成人网| 中字无码av在线电影| 国产在线观看第二页| 亚洲欧美精品在线| 美女扒开下面流白浆在线试听| 影音先锋丝袜制服| 97亚洲色综久久精品| 天天干天天色综合网| 国产成人毛片| 成人福利在线观看| 找国产毛片看| 欧美第九页| 国产剧情无码视频在线观看| 久久亚洲AⅤ无码精品午夜麻豆| 日韩A级毛片一区二区三区| 在线视频一区二区三区不卡| 国产女人水多毛片18| 亚洲视频影院| 熟妇无码人妻| 影音先锋亚洲无码| 中文字幕在线播放不卡| 日本免费a视频| 亚洲二区视频| 亚洲欧美不卡| 成人免费视频一区| 久久中文字幕av不卡一区二区| 免费人欧美成又黄又爽的视频| 国产网友愉拍精品| 中文无码日韩精品| 再看日本中文字幕在线观看| 无码电影在线观看| 国产成人乱无码视频| 亚洲欧美综合精品久久成人网| 午夜少妇精品视频小电影| 久久久久中文字幕精品视频| 亚洲综合色在线| 精品人妻一区无码视频| 日本三级黄在线观看| 国产一级片网址| 狠狠色噜噜狠狠狠狠色综合久 | 日韩一区二区在线电影| 亚洲天堂区| 中文字幕欧美日韩高清| 日韩国产黄色网站| 国产乱人视频免费观看| A级毛片无码久久精品免费| 欧美α片免费观看| 欧美日本在线播放| 女人一级毛片| 久久www视频| 免费观看无遮挡www的小视频|