999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于浮值掩蔽的完全卷積神經網絡語音增強系統

2020-10-30 01:57:50代佳鑫帥英俊
科學導報·學術 2020年40期

代佳鑫 帥英俊

摘?要:為了解決卷積神經(CNN)在語音增強中語音清晰度較差的問題,在卷積神經(CNN)語音增強的基礎上,提出了基于浮值掩蔽的完全卷積神經網絡語音增強系統。該系統首先采從帶噪語聲特征輸入完全卷積神經網絡中,以理想浮值掩蔽作為訓練標簽,估計出帶噪語音理想掩蔽值,其次,將理想掩蔽值與帶噪語音相乘作為幅度譜。最后將帶噪語音相位譜與幅度譜進行反短時傅里葉變換(ISTFT),得到增強語音。實驗結果表明,在PESQ標準下,在SNR分別為-12,-6,0,6,-12dB情況下,該系統性能分別提升了11.5%,12.5%,17.2%,11.8%,11.5%提升效果明顯。

關鍵詞:語音增強;完全卷積神經網絡;浮值掩蔽;單聲道

1 引言

隨著NLP方向人工智能技術的發展,語音識別技術達到了一個新的階段,各式各樣較成熟的語音助手使得人機交互的變得越來越容易。但實際應用時,由于采集設備和傳輸過程中的干擾,往往無法得到較清晰的語音信息,對語音識別結果造成較大干擾。本研究構建了基于完全神經網絡的理想浮值掩蔽系統。利用去除全連接層的卷積神經網絡來估計掩蔽值。其次,將理想掩蔽值與帶噪語音相乘作為幅度譜。最后將帶噪語音相位譜與幅度譜進行反短時傅里葉變換(ISTFT),得到增強語音。

2 算法介紹

假設,其中、、分別代表帶噪語音、干凈語音、噪聲的時域信號。對上式進行短時傅里葉變換,再將短時傅里葉變換的頻譜分為不同的時-頻單元,假設、、分別為x(n)、s(n)、n(n)在(t,f)時-頻單元的表示。

理想浮值掩模的定義式如下:

其中、分別表示在(t,f)時-頻單元中的信號能量和噪聲能量,β為可調的系數通常設置為0.5。為信號能量與噪聲能量的線性比值。的取值范圍為[0,1]。M(t,f)表示目標語音能量在混合的語音和噪聲的比重,M(t,f)為CNN的訓練目標。

此系統利用浮值掩蔽得到訓練目標,以及特征提取,然后通過CNN網絡進行集成。網絡采用有監督的方式進行學習。網絡會對每個帶噪語音信號估計出一個浮值掩模,將估計出來的掩模和帶噪語音信號的幅度譜相乘得到增強語音的幅度譜,將增強語音的幅度譜和帶噪語音的相位譜相乘作為增強語音的頻譜。最后將增強語音的頻譜做逆短時傅里葉變換得到增強語音的時域信號。該系統首先從訓練集中提取特征值,然后計算IRM值,把此值輸入到網絡中進行訓練。而對于測試階段,從測試集中提取特征值,輸入到網絡中,得到增強的語音,然后再進行語音信號重建得到最終的輸出信號。

3 實驗與結果分析

在實驗中,訓練集和測試集來自TMIT語料庫。對于訓練集,隨機選擇1000個話語,對于測試集,我們隨機選擇了另500個話語。為了使實驗條件更加真實,訓練和測試集的噪聲類型和SNR水平都不匹配。我們采用噪聲為:高斯白噪聲(WGN),發動機噪音和嬰兒啼聲,使用五種SNR等級(-12 dB,-6 dB,0 dB,6 dB和12 dB)。在實驗中,從波形中提取512個采樣點以形成512個采樣點,在該研究中,從波形中提取512個采樣點以形成用于所提出的SE模型的幀。此外,還從基線系統的幀中獲得257維LPS矢量。該實驗中的CNN具有四個帶有填充的積層(每個都有該層由15個濾波器組成,每個濾波器的濾波器大小為11)和兩個完全連接的層(每個都有1024個節點)。FCN具有與CNN相同的結構,除了完全連接的層各自用另一個卷積層替換。DNN只有四個隱藏層(每層由1024個節點組成)。

對于特征變換,音頻信號被下采樣到8kHz的,并且靜音幀從信號中移除。使用512點短時傅里葉變換(為32ms海明窗)計算光譜矢量,窗口移位為64點(8毫秒)通過去除對稱的一半,512點STFT幅度矢量減少到257點.此257點用于輸入特征,并且被標準化為具有零均值和單位方差。

PESQ、STOI分別是用來評價語音質量和語音清晰度的客觀指標。PESQ的取值范圍是-0.5至4.5,STOI的取值范圍是0值1。測試結果如表1 所示。對于CNN,相較于DNN,在SNR分別為12,6,0,-6,-12dB情況下,PESQ指標分別提升了5.42%,4.22%,2.79%,6.69%,4.75%。驗證了CNN相較于DNN語音增強效果更好。但是我們注意到在STOI標準下,CNN相較于DNN,提升不明顯。而對于FCN,在SNR分別為12,6,0,-6,-12dB情況下在PESQ標準下,分別提升了11.5%,12.5%,17.2%,11.8%,11.5%,在STOI情況下,也分別提升了10.27%,2.68%,5.03%,5.13%,6.93%,證明該系統是有效的。

結束語

本文基于在卷積神經網絡的基礎上,在卷積神經網絡語音增強的基礎上,提出了基于浮值掩蔽的完全卷積神經網絡語音增強系統。該系統改進了卷積神經網絡,使神經網絡變得更小,適用于嵌入式設備。同時,該系統考慮到無聲段理想浮值掩模不存在的問題,設計了合理損失函數。

參考文獻

[1]周志華.機器學習[M].北京:清華大學出版社,2016.

[2]趙曉群,黃小珊,宮云梅.基于無語音概率改進的對數譜幅度估計增強算法[J].信號處理,2008,24(06):912-916.

主站蜘蛛池模板: 免费看美女自慰的网站| 国产女人在线| 亚洲成年人网| 亚洲性日韩精品一区二区| 高清欧美性猛交XXXX黑人猛交| 久久频这里精品99香蕉久网址| 欧美一级色视频| 91精品国产自产91精品资源| 午夜综合网| 在线国产你懂的| 国产大片黄在线观看| 狼友视频国产精品首页| 国产正在播放| 91一级片| 欧美性色综合网| 亚洲有无码中文网| 国内精品伊人久久久久7777人| 狠狠五月天中文字幕| 91在线国内在线播放老师| 香蕉在线视频网站| a级毛片视频免费观看| 91精品aⅴ无码中文字字幕蜜桃| 91伊人国产| 国产欧美日韩视频一区二区三区| 69国产精品视频免费| 久996视频精品免费观看| 97视频精品全国在线观看| 女人一级毛片| 国产午夜人做人免费视频中文 | 免费视频在线2021入口| 国产精品区网红主播在线观看| 中文字幕在线欧美| 久久久久久久久久国产精品| 欧美人与牲动交a欧美精品| 国产色婷婷| 国产精品亚洲天堂| 男女性午夜福利网站| 高潮毛片无遮挡高清视频播放| 免费看的一级毛片| 成人无码一区二区三区视频在线观看| 亚洲天堂在线免费| 亚洲综合极品香蕉久久网| 久久久久无码精品| 日本欧美成人免费| 九九热视频在线免费观看| 精品免费在线视频| 中国黄色一级视频| 亚洲男人的天堂网| 永久免费av网站可以直接看的| 精品成人免费自拍视频| 成人福利在线免费观看| 一本一道波多野结衣一区二区| 欧美日韩国产在线观看一区二区三区| 成年女人a毛片免费视频| 欧美高清三区| 国产成年无码AⅤ片在线| 色偷偷一区二区三区| 国产精品久久久久婷婷五月| 国产亚洲欧美日韩在线一区| 亚洲国产一区在线观看| 日韩成人午夜| 久久狠狠色噜噜狠狠狠狠97视色| 欧美精品亚洲精品日韩专区| 国产成人无码Av在线播放无广告| 久久福利片| 婷婷六月色| 国产高清在线精品一区二区三区 | 亚洲香蕉在线| 免费观看无遮挡www的小视频| 色综合成人| 日韩小视频在线观看| 亚洲成肉网| 欧美激情视频二区三区| 亚洲精品无码不卡在线播放| 99精品影院| 中文字幕永久视频| 色综合综合网| 免费看黄片一区二区三区| 国产成人高清亚洲一区久久| 国产极品美女在线观看| 老色鬼久久亚洲AV综合| 热思思久久免费视频|