999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于計(jì)算聽覺場景分析的單通道語音分離方法*

2022-04-07 03:43:02徐慶達(dá)張二華
關(guān)鍵詞:信號

徐慶達(dá) 張二華

(南京理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 南京 210094)

1 引言

語音作為人機(jī)交互的主要方式之一,在語音識別系統(tǒng)、說話人識別系統(tǒng)等中得到廣泛應(yīng)用。但實(shí)際環(huán)境和理想環(huán)境存在很大差異,語音信號中往往存在“未知”的干擾,如音樂、汽車鳴笛、動(dòng)物叫聲等。這些干擾很大程度上影響了語音信號分析系統(tǒng)的性能,如何消除噪聲并獲得純凈的語音信號成為語音技術(shù)發(fā)展的關(guān)鍵技術(shù)之一。

經(jīng)研究表明,人耳有較強(qiáng)的語音分析能力,在復(fù)雜場景下即使只用一只耳朵,也能排除噪聲干擾,有選擇的聽取所需內(nèi)容[1]。1953年英國科學(xué)家Cherry將該現(xiàn)象稱為“雞尾酒會”問題[2]。之后人們對于人耳聽覺系統(tǒng)的研究經(jīng)歷了較長時(shí)間,Bregman 經(jīng)過多年的研究,在20 世紀(jì)90 年代發(fā)表《聽覺場景分析》(Auditory Scene Analysis,ASA),聽覺場景分析是從人的聽覺生理以及心理特征出發(fā),研究人耳在聽覺感知過程中的機(jī)理[3~4]。

2004 年,Guoning Hu 和Deliang Wang 提出了著名的Hu-Wang 模型,該模型采用基音特性和幅度調(diào)制特性分別處理低頻和高頻區(qū)域,分離結(jié)果的高頻區(qū)域得到了改善,分離效果得到了提高[5~6]。2010 年,Guoning Hu 和Deliang Wang 提出了用于基音估計(jì)和濁音分離的算法,即tandem 算法,該算法迭代的進(jìn)行基音估計(jì)和二值模估計(jì),可以準(zhǔn)確地獲得基音和目標(biāo)語音的二值模[7~8]。2013年,基于tan-dem 算法,Guoning Hu 和Deliang Wang 提出了一種無監(jiān)督的語音分離系統(tǒng),該算法在完成濁音分離后,通過多尺度Onset/Offset 分析產(chǎn)生待分離清音段,并利用已分離的濁音的二值模來組織清音段,實(shí)現(xiàn)清音分離[9]。

本文首先分析了語音信號的頻域特征,語音信號在濁音部分其頻譜分布具有明顯的諧波特性,在倒譜域上有明顯的峰值,由倒譜峰值的位置可以推算出基音周期。本文以語音信號的短時(shí)平穩(wěn)性和基音周期的連續(xù)性等作為語音分離的線索,在求取基音頻率后采用梳狀濾波提取各次諧波的頻譜,再進(jìn)行傅里葉逆變換得到分離后的語音,實(shí)驗(yàn)證明了該方法的有效性。

2 CASA概述

人耳聽覺系統(tǒng)對聲音的感知主要分為兩個(gè)階段,即分解和組合。人耳會將聽到的聲音分解成不同的感知單元,這些感知單元來自不同的發(fā)聲源,然后,聽覺系統(tǒng)會將來自同一發(fā)聲源的感知單元重新組合到一起,形成能夠表達(dá)一定內(nèi)容的語音片段[10]。其中組合分為“時(shí)序組合”和“同時(shí)組合”,如圖1 所示,B 和C 屬于同一時(shí)間不同頻段的感知單元,兩者的組合屬于“同時(shí)組合”,A 和B 屬于同一頻段不同時(shí)間的感知單元,兩者按時(shí)間的先后順序的組合屬于“時(shí)序組合”。計(jì)算聽覺場景分析正是用計(jì)算機(jī)來模擬人耳的聽覺系統(tǒng),并建立相應(yīng)的語音信號分離模型。

圖1 同時(shí)組合與時(shí)序組合

3 語音信號的特征分析

本文主要使用短時(shí)傅里葉分析方法對語音信號的短時(shí)譜和語譜圖進(jìn)行研究。通常取10ms~30ms為一幀,第n幀語音信號xn(m)的短時(shí)傅里葉變換的定義如式(1),w(n-m)為窗函數(shù)。

為了將時(shí)域信息與頻域信息相互結(jié)合,便于系統(tǒng)的分解和組合,可將連續(xù)幀的頻譜曲線按時(shí)間先后“豎”向繪制,再把頻率分量在某時(shí)間點(diǎn)上的幅值轉(zhuǎn)換為像素灰度值,以此為依據(jù)來繪制語譜圖。語譜圖的繪制過程如下。

1)對輸入的語音信號進(jìn)行短時(shí)傅里葉變換,對得到的實(shí)部和虛部的平方和開根號,得到振幅譜v={s1,s2,…,sn} ,其中v為二維數(shù)組,n為幀號,sn代表第n幀的振幅譜數(shù)據(jù)。

2)將所有振幅譜數(shù)據(jù)按照數(shù)值大小升序排序,以20 百分位處的數(shù)值為低截止閾值smin,80 百分位處的數(shù)值為高截止閾值smax,高于smax的像素值為0,即黑色,低于smin的像素值為255,即白色,其余的振幅映射到0~255之間。

圖2 給出了純凈語音某男聲漢語“那年”的波形圖及其語譜圖,其中幀長為512 個(gè)采樣點(diǎn),采樣頻率為16kHz,即每16000 個(gè)采樣點(diǎn)代表1s。觀察發(fā)現(xiàn)濁音段濁音區(qū)域一條條橫向的條紋,也就是諧波系結(jié)構(gòu),這些諧波包含了語音信號中的主要信息,各次諧波的位置將作為語音分離的主要線索。

圖2 某男聲語音“那年”波形圖與語譜圖

4 基音周期的提取

語音產(chǎn)生的過程可以通過激勵(lì)源和濾波器模型模擬,激勵(lì)源代表聲帶振動(dòng),濾波器代表聲道,兩者在時(shí)域通過卷積計(jì)算得到語言信號。對語音信號利用倒譜解卷原理,可以得出激勵(lì)序列的倒譜,倒譜峰反映了基音信息,所以據(jù)此可以計(jì)算出基音周期[11~12]。

4.1 基于倒譜法的基音周期提取

首先按第3 節(jié)中的式(1)對第n幀語音信號xn(m)進(jìn)行短時(shí)傅里葉變換得到短時(shí)譜Xn(ejω),短時(shí)譜Xn(ejω)包含實(shí)部和虛部,設(shè)

對其取對數(shù)得

再對實(shí)部ln|Xn(ejω)|做傅里葉逆變換可得到倒譜c(n),如式(4):

圖3(a)為語音信號對數(shù)振幅譜ln|Xn(ejω)|示意圖,虛線對應(yīng)于頻譜包絡(luò)的慢變化分量,實(shí)線對應(yīng)于諧波的快變化分量,諧波的變化頻率就是基音頻率。將對數(shù)振幅譜做傅里葉逆變換,即可將慢變化分量與快變化分量分離開[13]。圖3(b)為倒譜c(n)的示意圖,橫軸表示倒譜頻率,量綱是時(shí)間,其中靠近原點(diǎn)的低倒頻部分是頻譜包絡(luò)的變換,位于t0處的有明顯的峰值,t0對應(yīng)的時(shí)間就是基音周期。

圖3 倒譜示意圖

設(shè)信號采樣頻率為f,則時(shí)間采樣間隔為Δt=1f,若幀長為M,某一幀的倒譜數(shù)據(jù)為c(M),若其在第l個(gè)樣點(diǎn)序號處產(chǎn)生明顯的峰值,則基音周期Tp為

基音頻率fp定義如式(6):

4.2 基音周期軌跡的繪制

語音信號具有短時(shí)平穩(wěn)性,且是漸變的,屬于同一聲源的基音周期具有一定的連續(xù)性。本文以每幀的倒譜數(shù)據(jù)為依據(jù),將相鄰幀的倒譜數(shù)據(jù)按一定的映射規(guī)則轉(zhuǎn)換為像素灰度值,然后在垂直方向上繪制出各幀倒譜的灰度值。其繪制過程與語譜圖類似,圖4(a)為某男聲“那年正月新春”純凈語音波形圖,圖4(b)為其基音周期軌跡圖。基音周期軌跡圖中的縱坐標(biāo)為時(shí)間,因采樣率為16kHz,即單位Δt=1 16000s。

圖4 語音波形圖和基音周期軌跡圖

5 語音分離

5.1 諧波提取

在第4 節(jié)中已經(jīng)給出了基音頻率確定的方法,而各次諧波的頻率fh為基音頻率fp的整數(shù)倍,即fh=k×fp,按基音頻率的整數(shù)倍提取各次諧波可得到需要的頻譜數(shù)據(jù)。由于基音頻率的計(jì)算會產(chǎn)生很小的誤差,在高頻部分當(dāng)k較大時(shí)誤差會被放大,本文使用迭代更新第k-1 次諧波位置的方法來確定第k次諧波位置,以此提取各次諧波,縮小了高頻部分的誤差,提高了諧波提取的準(zhǔn)確性。

設(shè)信號采樣頻率為f,某段語音的振幅譜數(shù)據(jù)為v={s1,s2,…,sn} ,幀長為N,某一幀的振幅譜數(shù)據(jù)sn的長度為N,對應(yīng)于N個(gè)點(diǎn)序號,則頻率采樣間隔Δf=f/N,由4.1 節(jié)中式(6)得基音頻率fp=f/l,則某一幀的一次諧波位置點(diǎn)序號i1=int(fp/Δf)=int(N/l)。

諧波提取過程如下:

1)將語譜圖中灰度值85 對應(yīng)的振幅作為各次諧波的振幅閾值A(chǔ)H。

2)根據(jù)基音頻率fp設(shè)置諧波搜索范圍(R表示要搜索的樣點(diǎn)的范圍),避免相鄰兩個(gè)諧波位置的交叉。

3)根據(jù)基音頻率fp確定一次諧波的理論位置i1=int(N/l) ,對i1四 舍 五 入 取 整,并 搜 索[i1-R,i1+R] 范圍內(nèi)的極大值,若找到局部極大值A(chǔ)(ix),且A(ix)≥AH,則本次諧波頻率點(diǎn)位置就為ix,更新i1=ix;否則舍去該次諧波頻率點(diǎn),i1=int(N/l)不做更新。

4)經(jīng)過步驟3)在一次諧波確定的情況下,從第二次諧波開始,以ik=ik-1+i1依次求取剩余各次諧波,ik的更新與確定與步驟3)一致。

圖5(a)為純凈語音某男聲“那年正月新春”語譜圖,圖5(b)為其按上述方法提取的諧波結(jié)構(gòu)圖。

圖5 某男聲“那年正月新春”語譜圖與諧波提取圖

5.2 語音重構(gòu)

對于提取完諧波的單幀頻譜進(jìn)行傅里葉逆變換可得到分離后的單幀語音信號[14]。短時(shí)傅里葉變換是將時(shí)域信號轉(zhuǎn)換到頻域,而短時(shí)傅里葉逆變換 則 是 將 頻 域 信 號Xn(ejω)恢 復(fù) 為 時(shí) 域 信 號x(m)。第3節(jié)中式(1)對應(yīng)的傅里葉逆變換公式為

令m=n,且w( 0 )≠0 時(shí),有

對于分離后的單幀語音信號,由于相鄰幀之間在時(shí)域上有重合,因此,在同一段基音軌跡對應(yīng)的時(shí)間范圍內(nèi),將各語音幀按照間隔幀移大小的距離進(jìn)行對齊。如圖6,對于重合部分采用疊加求均值的方式來重構(gòu)語音信號,可得到分離后的語音。

圖6給出了語音重構(gòu)的過程示意圖。

圖6 語音重構(gòu)過程示意圖

6 實(shí)驗(yàn)結(jié)果

本實(shí)驗(yàn)將原始語音某男聲“那年正月新春”與不同噪聲混合后做分離試驗(yàn),選取的噪聲分別為電話按鍵聲、白噪聲、流水聲、水中氣泡聲、鳥叫聲,圖7為五種噪聲的波形圖。

圖7 五種噪音的波形

本實(shí)驗(yàn)將原始語音與噪音按一定的信噪比(SNR)進(jìn)行混合,對混合語音進(jìn)行分離試驗(yàn),其中信噪比設(shè)為5。信噪比(SNR)計(jì)算公式如式(9),其中,x(m)為原始語音信號,v(m)為噪音信號。

圖8~圖12為原始語音與五種噪音混合后的波形以及分離后的語音波形圖。

圖8 電話按鍵聲與原始語音的混合與分離

圖9 白噪聲與原始語音的混合與分離

圖10 水流聲與原始語音的混合與分離

圖12 鳥叫聲與原始語音的混合與分離

本文主要采用主觀評價(jià)的評價(jià)意見分(Mean Opinion Score,MOS)和信噪比SNR 來對實(shí)驗(yàn)結(jié)果進(jìn)行評估[15],MOS評估標(biāo)準(zhǔn)如表1所示。本文對參與本實(shí)驗(yàn)評估的60 個(gè)人的MOS 分值取均值,得出最后的分?jǐn)?shù)。分離語音的信噪比SNR 的計(jì)算公式如式(10),其中x?(m)為分離后的語音信號,x(m)為原始信號。

表1 MOS值評分標(biāo)準(zhǔn)

上述實(shí)驗(yàn)中將五種噪聲與原始語音按一定信噪比混合然后進(jìn)行分離實(shí)驗(yàn),表2 給出了分離前后的MOS評分和信噪比SNR的對比。

表2 分離前后評估表

從分離后的語音波形圖和表2 中的數(shù)據(jù)可以看出,經(jīng)過分離處理后的語音質(zhì)量得到了明顯的改善,噪音得到大幅度的消減,且聽覺效果得到較好的改善。但當(dāng)噪音干擾過強(qiáng),人耳已經(jīng)難以分辨時(shí),分離的效果并不是很好,關(guān)于強(qiáng)噪音下的語音分離還有待改善和研究。

7 結(jié)語

本文介紹了計(jì)算聽覺場景分析的原理和基于該原理的語音分離方法。該方法中較為重要的步驟是基音周期的提取,本文采用倒譜法來確定基音周期,后根據(jù)基音周期確定濁音段語音信號頻譜上的諧波位置,對提取的頻譜做反變換重構(gòu)原信號。實(shí)驗(yàn)表明,該方法可有效提高語音信號的信噪比和可讀性。

猜你喜歡
信號
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
7個(gè)信號,警惕寶寶要感冒
媽媽寶寶(2019年10期)2019-10-26 02:45:34
孩子停止長個(gè)的信號
《鐵道通信信號》訂閱單
基于FPGA的多功能信號發(fā)生器的設(shè)計(jì)
電子制作(2018年11期)2018-08-04 03:25:42
基于Arduino的聯(lián)鎖信號控制接口研究
《鐵道通信信號》訂閱單
基于LabVIEW的力加載信號采集與PID控制
Kisspeptin/GPR54信號通路促使性早熟形成的作用觀察
主站蜘蛛池模板: 国产男女XX00免费观看| 国产精品毛片一区视频播| 国产精品福利导航| 国产亚洲成AⅤ人片在线观看| 在线观看精品自拍视频| 99视频在线看| www.亚洲一区| 亚洲毛片一级带毛片基地| 久久五月天综合| 国产在线精品网址你懂的| 国产黄色片在线看| 91麻豆国产视频| 国产性生大片免费观看性欧美| 日韩免费毛片| 性色在线视频精品| 日韩精品一区二区三区中文无码 | 2022国产无码在线| 亚洲精品无码人妻无码| 97亚洲色综久久精品| AV天堂资源福利在线观看| 亚洲AⅤ波多系列中文字幕| 久久人妻xunleige无码| 欧美黄色网站在线看| 麻豆AV网站免费进入| 亚洲中文字幕无码爆乳| av天堂最新版在线| 人妻丝袜无码视频| 国产啪在线91| 99re66精品视频在线观看| 欧美成人日韩| 欧美性色综合网| 国产微拍精品| 国产午夜一级毛片| 国产在线97| 欧美亚洲香蕉| 国产精品嫩草影院av| 高清精品美女在线播放| 伊人婷婷色香五月综合缴缴情| 免费无码AV片在线观看中文| 色婷婷在线影院| 人妻中文久热无码丝袜| 久久精品只有这里有| 九九香蕉视频| 黄色国产在线| 666精品国产精品亚洲| 2020最新国产精品视频| 99久久性生片| 国产尤物视频在线| 亚洲国产成人综合精品2020 | 国产青榴视频在线观看网站| 亚洲美女视频一区| 99无码中文字幕视频| 亚洲 日韩 激情 无码 中出| 婷婷伊人五月| 欧美怡红院视频一区二区三区| 精品综合久久久久久97超人| 91精品国产综合久久不国产大片| 波多野结衣久久高清免费| 国产黄色片在线看| 国产剧情伊人| 亚洲天堂网在线播放| 一级毛片免费观看久| 亚洲第一香蕉视频| 免费无码网站| 亚洲第一视频网站| 国产精品久久久久久久久久久久| www.日韩三级| 欧美日韩北条麻妃一区二区| 国产色婷婷| 欧美一区中文字幕| 国产成人精品日本亚洲| 日韩精品成人在线| 国产自产视频一区二区三区| 国产激情无码一区二区免费| 最新亚洲人成网站在线观看| 午夜精品久久久久久久99热下载 | 精品无码人妻一区二区| 亚洲乱码在线视频| 天堂网国产| 亚洲国产一成久久精品国产成人综合| 亚洲精品久综合蜜| 亚洲成人在线免费观看|