999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Sparse K-SVD學習字典的語音增強方法

2014-07-26 01:21:04易才欽郭東輝
廈門大學學報(自然科學版) 2014年1期
關鍵詞:信號方法

黃 玲,李 琳,王 薇,易才欽,郭東輝

(廈門大學信息科學與技術學院,福建 廈門361005)

語音信號增強是指從帶噪信號中獲取有用的語音信號,抑制噪聲干擾,提升語音自然度和清晰度,常用的語音增強方法有譜減法[1]、小波閾值法[2]、卡爾曼濾波法[3]等.近年來,基于信號稀疏表示的語音增強算法[4]也受到廣泛關注.

基于冗余字典的信號稀疏表示方法最早由Mallat和Zhang提出,一個可壓縮信號在某一空間上可用極少的觀測樣本信號以高概率重構.基于信號的稀疏表示進行信號壓縮、圖像增強、語音增強、人臉識別等信號處理[4-6],已取得了較好的成果.稀疏表示方法主要分為兩個部分,冗余字典的構建和目標函數的優化.Zhang等[7]通過實驗證明,稀疏表示方法改善信號處理性能的關鍵在于冗余字典的構建.目前主要有2種字典構建方法:固定字典法和字典訓練法[8-10].但這兩種方法訓練出的字典前者對信號的自適應性不佳,后者結構松散,字典規模受限,且運算量大.

為了解決上述問題,Rubinstein等[11]提出了一種新的字典學習方法——Sparse K-SVD算法,對冗余字典D進一步進行稀疏分解,使用小波變換或離散余弦變換建立一個基字典B,并尋找一個稀疏表示系數矩陣A,使得D=BA.Sparse K-SVD算法通過對字典的稀疏表示,使得字典D具有良好的自適應性,同時降低了字典構建的計算復雜度,能夠得到一個結構緊密的字典,利于進行更高維度、更大規模信號的稀疏表示.

本文提出一種基于稀疏表示的語音增強算法,采用Sparse K-SVD算法訓練自適應的冗余字典,再應用正交匹配追蹤(OMP)算法進行稀疏編碼來重構純凈語音.在主觀質量和客觀指標上,基于稀疏表示的語音增強方法(分別使用Sparse K-SVD算法和K-SVD算法訓練字典)比傳統語音增強方法(小波法、譜減法、改進譜減法)獲得更優的性能.在字典訓練時間方面進行分析發現,相對于K-SVD字典訓練算法,Sparse KSVD算法大幅度提高了計算效率.

1 語音信號的稀疏表示原理

任意長度為N的一維離散語音信號Y∈RN,通過冗余字典D∈RN×K可稀疏表示為:

式中:α為信號的稀疏表示系數,為K×1的向量,dk為給定冗余字典D中的一個原子,αk為α向量中與dk相對應的值.語音信號的稀疏表示是從冗余字典中選擇具有最佳線性組合的若干原子來表示信號,實際上是一種逼近過程.從稀疏逼近角度出發,希望在逼近殘差達到最小的情況下得到α最稀疏的一個解.這等同于解決下述問題[12]:

式中:‖‖0是l0范數,即不為零的元素個數,表示Frobenius范數的平方.

考慮語音噪聲為加性噪聲,其帶噪語音模型如下:

其中,Y為帶噪語音,X為原始語音,n為噪聲.根據式(2)從冗余字典D中選取最佳線性組合的若干原子來表示帶噪信號Y,當逼近殘差足夠小時,利用式(2)求解的稀疏表示矩陣,通過重構的和原始信號X近似,從而把純凈信號從帶噪語音中分離出來,實現整個語音信號的增強.對于一個冗余字典D,式(2)的求解是個稀疏分解的過程.本文采用正交匹配追蹤(OMP)算法進行稀疏分解,從而減少迭代次數.

2 雙重稀疏的字典訓練算法——Sparse K-SVD

Sparse K-SVD算法是在K-SVD算法的基礎上,將字典D中原子由基字典稀疏表示:D=BA,其中B是基字典,A是字典稀疏表示的系數矩陣.用Y,Γ分別為訓練信號和訓練信號的稀疏表示.從線性組合角度看,Sparse K-SVD算法是在式(2)的基礎上,構建一個目標函數,針對目標函數進行最優化求解.其目標函數可表示為[11]:

其中,αi,?j分別是Γ和A的任意列向量,t,p分別是αi和?j中非零元素的個數.

字典的更新是逐列進行的.首先,假設系數矩陣Γ和字典D都是固定的,將要更新字典的第k列為dk,令系數矩陣Γ的第k行為αk,dk=B?k,?k為矩陣A的第k列,此時,式(4)中的懲罰項可表示為:

上式中,乘積BAΓ被分解成N個矩陣和.每次逐列更新字典時,式(5)中項是固定的,所剩的一項,也就是要處理的第k項B?k0αk0.矩陣Ek0代表去掉原子dk的成分所造成的誤差.直接更新?k0和αk0,得到的更新后的αk0是滿向量,使得更新后的αk0中非零元素的位置和數量和未更新前的位置和數量不同,會出現發散.為了解決此問題,僅保留αk0中的非零值.因此,目標函數變為:

其中,Ek和αk分別是Ek0和αk0去掉零輸入后收縮的結果.對于上式的第二個限制條件可在?kαk保持不變時,通過調整?k和αk的能量來滿足.因此,式(6)可簡化為;

接著優化αk:

從而式(7)可改寫為:

式(10)與式(2)結構相似,Ekαk相當于式(2)中的Y,B相當于式(2)中的D.因此,問題變得更簡單,方便計算.Sparse K-SVD算法完整的算法步驟如下所示:

輸入:信號Y,基字典B,初始字典A.目標原子的稀疏度t,目標信號的稀疏度p,迭代次數L.

輸出:字典的稀疏表示矩陣A,信號的稀疏表示矩陣Γ.

步驟:初始化:A=A0

Ekαk=(XI-BAΓI)αk(I為信號Y中用來表示αk的索引號)

3 基于稀疏表示的語音增強方法

本文利用語音信號的稀疏性,進行語音增強處理,采用Sparse K-SVD算法訓練冗余字典,式(2)可改寫為:

B是固定的基字典,很明顯上式中有兩個是未知的:字典的稀疏表示矩陣A和信號的稀疏表示矩陣Γ.

首先對帶噪語音初始化,用冗余余弦字典初始化基字典B,用單位矩陣初始化A,利用OMP算法可以尋找到一個最優的Γ.然后,再通過Sparse K-SVD算法訓練得到字典稀疏表示的系數矩陣A.不斷迭代優化A和Γ,具體步驟如下所示:

1)初始化

對帶噪語音進行分幀,幀長為N(如N=128),同時構建一個冗余的余弦基字典B,這個基字典的大小為N×4N,A矩陣的初始值為單位矩陣.

2)稀疏編碼

先假設BA是固定的,根據式(11)求解每幀信號稀疏系數矩陣.然后再利用OMP算法不斷優化Γ,直到的值小于ε為止.

3)訓練字典

每次更新A中的一個原子,在更新A的同時,也更新了信號稀疏表示的系數矩陣Γ.根據Sparse KSVD算法,用大量的幀長為M的語音訓練字典系數A.由于A是字典D的稀疏表示系數,需要更新的原子數量相較于K-SVD算法大幅度減少.

4)語音重構

利用更新后的字典D=BA和Γ,根據^Y=D^α一幀一幀地重構原始語音信號.然后,對每幀重疊的部分采用均值化處理,從而實現整個語音信號的增強.

4 實驗結果及分析

為了評價本文所提出的基于稀疏表示的語音信號增強方法的性能,本文對疊加高斯白噪聲后,信噪比分別為-5,0,5,10,15dB的帶噪語音進行主觀質量和客觀指標上的測試.本實驗所用的原始語音文件來自NOIZEUS語音庫[12],下面實驗除波形觀察外,其他結果都是對NOIZEUS語音庫里30個語音文件實驗后所得的平均結果.實驗的硬件平臺為戴爾Inspiron1440型號PC機(2.2GHz主頻),軟件平臺為MATLAB R2009b.本文所采用的基于Sparse K-SVD算法的語音增強方法和基于K-SVD算法的語音增強方法都是對帶噪語音逐幀進行增強.每幀幀長128個樣點,幀間重疊1個樣點.K-SVD算法的初始字典是一個冗余的DCT字典,而在Sparse K-SVD算法中,也采用冗余的DCT字典作為基字典B,并把初始A矩陣設為單位矩陣.稀疏優化停止的條件是平均誤差小于閾值ε.實驗表明,當ε=1.12σ時有更好的性能,這里的σ表示噪聲的標準差.

4.1 主觀質量的評價

隨機選取NOIZEUS語音庫中的一段語音“sp04.wav”,采樣頻率為8kHz,字長為16bit,其波形圖如圖1(a)所示.疊加信噪比為0dB的高斯白噪聲,得到信噪比為0dB的帶噪語音(圖1(b)).采用不同方法進行語音增強后的波形圖如圖1所示.

圖1 sp04.wav的波形圖Fig.1 Waveform of sp04.wav

由圖1可知:1)被嚴重污染的帶噪語音,經過基于稀疏表示的方法去噪后如圖1(f)和(g)所示,噪聲被大量消除,并且能很好地恢復原始語音的信息,而傳統的語音增強方法(如圖1(c)~(e)所示)去噪后還殘留著許多未被消除的噪聲;2)采用Sparse K-SVD算法的語音增強方法和采用K-SVD算法的一樣有良好的降噪性能.另外,聽音結果也顯示基于稀疏表示的去噪結果能很好地分辨出原始語音信號,可懂度和清晰度均良好,而傳統方法去噪結果的清晰度受到影響.

4.2 客觀指標的評價

信號近似的準確率可以用重構誤差ε來評價,它的定義如下式所示:

其中,s′(i)為增強語音的第i幀信號,s(i)為原始語音的第i幀信號.增強后的信號如果越接近原始信號,則ε的值越小.不同方法進行增強的重構誤差如圖2所示.從圖2可知,當帶噪語音的信噪比從-5dB變化到15 dB時,采用基于稀疏表示的增強方法(采用Sparse KSVD算法和采用KSVD算法)的重構誤差很接近,都比傳統增強方法的重構誤差低.當疊加的噪聲強度越大時,不同增強方法重構誤差的差異就越明顯.

圖2 重構誤差比較圖Fig.2 Comparison of reconstruction error

本文還從信噪比和語音質量兩個方面對不同增強方法的性能進行了對比,分別如表1和2所示.其中信噪比的定義如下:

表1 采用不同方法增強后信噪比的比較Tab.1 Output SNR for different enhancement methods dB

表2 采用不同方法增強后語音質量的比較Tab.2 PESQ scores for different enhancement methods

式中,s′(i)為增強語音的第i幀信號,s(i)為原始語音的第i幀信號.由表1可知,當帶噪語音的原始信噪比從-5dB變化到15dB時,這幾種增強方法在一定程度上都提高了信噪比和語音質量.不過,基于稀疏表示的增強算法(采用 K-SVD算法或Sparse K-SVD算法)的性能提高得更顯著.

對采用不同字典訓練算法(K-SVD和Sparse KSVD)的信號增強效果進行比較,基于Sparse K-SVD的稀疏表示法和基于K-SVD的稀疏表示法的增強性能不相上下.

4.3 語音增強方法計算時間的比較

對幾種語音增強方法的計算時間進行了統計,如表3所示,可知,小波閾值法的計算時間最短,譜減法和改進譜減法的次之,而基于稀疏表示的語音增強方法(分別使用Sparse K-SVD算法和K-SVD算法訓練字典)則消耗較長的時間.這是由于基于稀疏表示的語音增強方法訓練大規模的字典(如字典原子數為512)耗時較長.由本文4.1節和4.2節的實驗結果可知,在主觀質量和客觀指標上,采用Sparse K-SVD算法和K-SVD算法的語音增強性能都優于傳統的語音增強方法.可見,語音增強處理中增強質量和計算時間是個權衡關系,需根據實際需求選擇合適的語音增強方法.

表3 語音增強方法計算時間的比較Tab.3 Time consumption for different enhancement methods

表3顯示在相同噪聲等級下,Sparse K-SVD算法訓練字典的計算效率遠高于K-SVD算法.尤其在15 dB噪聲環境下,Sparse K-SVD算法的計算速度提高了二十幾倍.可知,與K-SVD學習字典方法相比,基于Sparse K-SVD學習字典的語音增強算法能夠在保證語音增強性能的前提下大幅度節省計算時間.

5 結 論

本文基于語音信號的稀疏表示理論,提出了一種采用Sparse K-SVD算法訓練冗余字典的語音增強方法,不僅進一步優化了語音增強性能而且提高了計算效率.采用Sparse K-SVD算法訓練出的字典結構緊湊,可用于處理大規模的語音數據.基于Sparse K-SVD的稀疏表示方法不僅可實現語音增強,還適合于其他的信號處理應用,如說話人識別、人臉識別、盲源分離等.

[1]Boll S.Suppression of acoustic noise in speech using spectral subtraction[J].IEEE Transactions on Acoust,Speech,Signal Process,1979,27(2):113-120.

[2]Vetterli M.Wavelets,approximation,and compression[J].IEEE Signal Processing Magazine,2001,18:59-73.

[3]Paliwal K,Basu A.A speech enhancement method based on Kalman filtering[J]∥IEEE International Conference on A-coustics,Speech,and Signal Processing,1987,12:177-180.

[4]Zhao N,Xu X,Yang Y.Sparse representations for speech enhancement[J].Chinese Journal of Electronics,2011,19(2):268-272.

[5]Wright J,Yang A Y,Ganesh A,et al.Robust face recognition via sparse representation[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2009,31:210-227.

[6]Elad M,Aharon M.Image denoising via sparse and redundant representations over learned dictionaries[J].IEEE Transactions on Image Processing,2006,15:3736-3745.

[7]Zhang L,Yang M,Feng X C.Sparse representation or collaborative representation:which helps face recognition?[C]∥2011IEEE International Conference on Computer.Barcelona:IEEE,2011:471-478.

[8]Vidal R,Ma Y,Sastry S.Generalized principal component analysis(GPCA)[J].IEEE Transactions on Image Process,2005,14(4):423-438.

[9]Engan K,Aase S O,Hakon Husoy J.Method of optimal directions for frame design[C]∥IEEE International Conference on Acoustics,Speech,and Signal Processing.Phoenix,AZ:IEEE,1999,5:2443-2446.

[10]Aharon M,Elad M,Bruckstein A.K-SVD:design of dictionaries for sparse representation[C]∥Proc of the Workshop on Signal Processing with Adaptive Sparse Structured Representations(SPARS′05).[S.l.]:SiteSeerX,2005:9-12.

[11]Rubinstein R,Zibulevsky M,Elad M.Double sparsity:learning sparse dictionaries for sparse signal approximation[J].IEEE Transactions on Signal Processing,2010,58:1553-1564.

[12]Hu Y,Loizou P.Subjective comparison of speech enhancement algorithms[C]∥2006IEEE International Conference on Acoustics,Speech,and Signal Processing.Toulouse:IEEE,2006:153-156.

猜你喜歡
信號方法
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
學習方法
孩子停止長個的信號
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
基于LabVIEW的力加載信號采集與PID控制
一種基于極大似然估計的信號盲抽取算法
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 欧美日韩第二页| a级毛片免费看| 亚洲无码在线午夜电影| 老色鬼久久亚洲AV综合| 美女一区二区在线观看| 国产尤物jk自慰制服喷水| 国产91丝袜在线播放动漫 | 国产成人a毛片在线| 国产第一福利影院| 亚洲人成网址| 99精品久久精品| 亚洲最新在线| 国产激爽大片在线播放| 亚洲成aⅴ人片在线影院八| 国产精品爆乳99久久| 999在线免费视频| 狠狠综合久久| 午夜视频日本| 亚洲第一成年人网站| 亚洲男人天堂2020| 亚洲欧洲自拍拍偷午夜色无码| 福利在线不卡一区| 2018日日摸夜夜添狠狠躁| 热re99久久精品国99热| 国产嫖妓91东北老熟女久久一| 国产精品一老牛影视频| 国产视频一二三区| 伊人成人在线| 一级毛片免费的| 亚洲日韩Av中文字幕无码 | 大香伊人久久| 欧美日本在线播放| 国产AV无码专区亚洲A∨毛片| 欧美在线视频a| 国产主播喷水| 露脸一二三区国语对白| 精品自拍视频在线观看| 老色鬼欧美精品| 亚洲国产成熟视频在线多多| 青青青视频蜜桃一区二区| 一区二区日韩国产精久久| 午夜色综合| 亚洲欧洲日韩国产综合在线二区| 国产成人精品高清不卡在线| 久久精品电影| 成人国产精品2021| 99国产精品一区二区| 国产成人高清亚洲一区久久| 在线观看国产小视频| 欧美精品影院| 99视频在线观看免费| 日本爱爱精品一区二区| 中文一级毛片| 91视频99| 91免费观看视频| 日本人真淫视频一区二区三区| 99热这里都是国产精品| 中文字幕在线视频免费| 91精品国产丝袜| 91精品aⅴ无码中文字字幕蜜桃| 一级毛片免费观看不卡视频| 精品视频一区二区观看| 久久久噜噜噜| 69免费在线视频| 亚洲第一区精品日韩在线播放| 亚洲国产欧洲精品路线久久| 99视频在线免费观看| 青青草原国产免费av观看| A级全黄试看30分钟小视频| 无码又爽又刺激的高潮视频| 国产一区二区三区夜色| 色综合激情网| 免费亚洲成人| 动漫精品啪啪一区二区三区| 国产日韩欧美一区二区三区在线| 亚洲精品另类| 久热这里只有精品6| 亚洲中文字幕23页在线| 少妇人妻无码首页| 欧美日本在线一区二区三区| 不卡午夜视频| 久久婷婷国产综合尤物精品|