999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

強混響及噪聲相關背景下說話人跟蹤方法

2021-09-07 06:38:58楊海紅王琳娟
無線電工程 2021年9期
關鍵詞:實驗分析方法

楊海紅,王琳娟

(1.山西旅游職業學院 計算機科學系,山西 太原 030031;2.山西農業大學 基礎部,山西 晉中 030801)

0 引言

說話人位置的準確定位和跟蹤是人工智能領域研究熱點問題,近年來,受到了國內外研究人員的廣泛關注[1-4]。為克服虛擬聲源的影響,研究人員將粒子濾波方法引入到說話人跟蹤系統中,取得了很大的改進,一定程度上克服了虛擬聲源的影響[3-10]。其主要特點是說話人的位置信息是根據最新的觀測信息隨著時間進行遞推估計的,通過采用一個Markov說話人運動模型將說話人的位置狀態信息進行實時的遞歸處理[11-13]。可以看出,基于濾波方法的說話人跟蹤方法充分利用了說話人的運動信息和時間的相關性,可以有效地克服傳統方法中存在的虛擬聲源干擾問題,提升了噪聲背景下說話人的位置定位和跟蹤精度[14-16]。但是這些研究存在著一個缺陷,即說話人發音的連續性。假設說話人一直處于發聲狀態,且跟蹤的時間只有一個人在活動。很明顯,這種假設是不符合實際應用場景的,特別是在有多人參與的會議場景,經常會出現語音的靜默,以及多個人的交叉說話。且多人交互說話情況往往導致背景噪聲的惡化和相關性,導致現有非線性濾波方法的跟蹤精度降低。基于此,本文針對強混響及噪聲相關背景下說話人跟蹤問題,提出了一種解相關粒子濾波跟蹤方法。該方法的主要創新有2點:一是利用狀態方程恒等變換和矩陣相似變換理論實現了過程噪聲和量測噪聲的解相關;二是隨機有限集(Random Finite Set,RFS)理論對說話人的個數和狀態進行聯合建模。最后,基于計算機仿真和實際的語料庫對算法的性能進行了詳細分析。

1 模型介紹

1.1 觀測參數模型

在沒有混響情況下的單個說話人場景中,麥克風對接收到的信號可以表示為[13]:

(1)

式中,s(t)為聲源信號;vi(t),i=1,2為背景噪聲;m為2個麥克風對之間的到達時間差(Time Difference of Arrival,TDOA)。采用二維坐標矢量α∈R2表示說話人的二維坐標(x,y)。則TDOA可以通過下面的計算獲得:

(2)

式中,ui,i=1,2為麥克風的位置坐標;‖·‖表示距離;c表示聲音的傳播速度(實際上將這種方法可以直接擴展到三維坐標系中)。TDOA可以通過GCC估計其進行量測。其計算公式為[14]:

(3)

(4)

圖1 實驗中采用的斷續語音信號Fig.1 Intermittent speech signal used in the experiment

(a) 麥克風對1

在實際的說話人環境中,說話人的位置α是時變的。因此,需要采用一個適當短的時間幀來估計τ,目的是為了確保α在這個計算的時間幀上可以近似為靜止不動的。本小節采用式(5)、式(6)的短時估計來代替式(4)中的Sy1,y2(w),其計算表達式為:

(5)

(6)

式中,T為短時的時間幀長度;k為短時的時間參數。

1.2 說話人運動狀態的解相關分析

通過前面的研究可以看出,基于非線性濾波方法的說話人跟蹤系統需要預先建立滿足說話人運動特性的運動模型,多數研究采用朗之萬模型,該模型的最大特點是滿足說話人的隨機運動特性。但是標準朗之萬模型是在連續時間運動的基礎上計算得到,但是實際應用中需要采用的是離散狀態,其相應的離散化模型為:

x(k+1)=f(x(k))+w(k),

(7)

式中,x(k)∈Rn×1為說話人狀態;f(·)為非線性狀態函數傳遞過程;過程噪聲w(k)為N(0,Q(k));其相應的觀測模型為:

z(k)=g(x(k))+v(k),

(8)

式中,z(k)∈Rm×1為觀測量;g(·)為相應的觀測非線性函數;v(k)為滿足N(0,R(k))的高斯噪聲。假設上述系統滿足噪聲相關的條件,其相應的相關關系可以表示為:

(9)

假設跟蹤目標的初始狀態可以表示為x(0),其滿足N(x0,P0)的高斯特性,且獨立于w(k)和v(k)。在給定觀測矩陣的情況下,相應的觀測信息可以表示為:

(10)

過程噪聲的離散值可以表示為:

(11)

相應的測量噪聲矩陣可以表示為:

(12)

相應的方差可以計算為:

R(k)=E[v(k)vT(k)]=

(13)

式中,w(k)與v(k)的相關性為:

B(k)=E[w(k)vT(k)]=[B1(k),B2(k),…,BN(k)]。

(14)

因為R(k)為一個正定的實對稱矩陣,故而存在酉矩陣U(k)滿足:

Λ(k)=UT(k)R(k)U(k),

(15)

式中,Λ(k)=diag{λ1(k),λ2(k),…,λN(k)}為正定的對角陣;λj(k)(j=1,2,…,N)為R(k)的特征值,將U(k)左乘式(15),則有:

(16)

其中,

(17)

(18)

(19)

修正以后的測量噪聲的統計特性可以表示為:

(20)

式中,Λ(k)=diag{Λ1(k),Λ2(k),…,ΛN(k)},這樣就完成了測量噪聲方差舉證的解耦,而新的測量噪聲與過程噪聲之間的相關性可以表示為:

[C1(k),C2(k),…,CN(k)],

(21)

相應的狀態方程可以改寫為:

(22)

其中,

(23)

Q(k)-C(k)Λ-1(k)CT(k)。

(24)

上面分析的解耦以后的朗之萬模型的狀態空間方程可以重新表示為:

αk=αk-1+Tφk-1,

(25)

(26)

(27)

為了滿足Cxk=αk,要求C=[I,0]。另外,真實計算的TDOA值為:

(28)

通過貝葉斯方法進行相應的遞推估計說話人位置信息的后驗概率密度函數可以表示為:

(29)

(30)

由于τq(·)的非線性,精確計算非常困難。目前研究中均采用蒙特卡羅近似處理的方法,也就是常說的粒子濾波方法。在進行相關解耦以后,需要將RFS方法引入到解耦以后的粒子濾波框架中進行未知數目的說話人跟蹤處理。

2 基于解相關RFS的說話人跟蹤

2.1 RFS框架內的濾波思想分析

f(χk/χk-1),

(31)

似然函數可以表示為:

(32)

(33)

(34)

式中,F(Rn)為Rn所有有限子集的類;μ為F(Rn)的一個量測。

2.2 基于RFS-DPF的跟蹤實現步驟

(35)

(36)

對于說話人的狀態估計,結合貝葉斯遞歸公式可以表示為:

(37)

結合前面的分析,可以將基于解相關粒子濾波與隨機有限集結合的說話人跟蹤方法(RF-DSPF)的具體步驟總結如下:

對于k=1,2,…,N,給定粒子集合的總長度L,其具體的實現步驟:

① 噪聲特性解相關

根據解相關步驟分析,針對系統噪聲特性進行解相關分析,并獲取解相關以后的系統狀態方程:

和相應的量測方程:

獲得解相關以后的說話人運動模型。

② 標準采樣

③ 重采樣

(38)

(Pmiss+(1-Pmiss)×

(39)

(40)

3 混響環境下仿真實驗分析

該部分主要針對方法進行2類仿真實驗:首先,針對提出的解耦相關粒子濾波方法和RFS相結合,進行了多說話人(2個不連續說話人)的計算機仿真實驗;然后,針對AMI提供的智能會議環境中的語料庫資料,采用本文方法,分別針對多人分開交互單人不連續發音、多人同時交互不連續發音的情況進行了仿真分析,并給出具體的實驗分析結果。

3.1 混響環境下多人交互實驗仿真分析

仿真分析中,參量設置如下:狀態采用解相關分析中的朗之萬運動模型,TDOA的標準偏離度誤差為σv=124 μs(同樣也是語音信號的采樣周期)。其他的參量設置為:Nmax=1,Pbirth=0.05,Pdeath=0.01,Pmiss=0.25,λc=3,L=500。仿真實驗分析主要針對實際量測的TDOA結果以及實際的說話人數目進行實時的測量和估計,驗證本文方法針對多交互說話人的跟蹤效果。圖3展示了本例中房間的具體設置,房間大小為3 m×3 m×2.5 m。

圖3 仿真用的實驗室布局及相應的說話人軌跡Fig.3 Laboratory layout and speaker trajectory for simulation

實驗中采用4個麥克風進行語音信號采集,每對麥克風之間的距離為0.5 m(相互的時間延遲為1.5 ms),圖中也給出了說話人的運動軌跡,以及說話人加入和消失的時刻。說話人的聲音為一男一女,其中說話人1的語音信號如圖1所示,說話人2的語音信號如圖4所示。

圖4 實驗中采用的語音信號Fig.4 Speech signal used in the experiment

房間脈沖響應的混響時間為T60=0.15 s,為選擇合適SNR進行跟蹤分析,針對不同SNR情況下跟蹤精度進行了分析,跟蹤誤差值如圖5所示。從中可以看出,隨著SNR的增加跟蹤精度也在改善,但是改善的效果明顯降低,結合實際環境中SNR的狀態,本文信噪比取值為SNR=20 dB,量測的TDOA的時間幀長度為128 ms,時間上的交互是不重疊的。

圖5 不同SNR情況下跟蹤誤差值Fig.5 Tracking error under different SNR conditions

4個麥克風對在整個時間段內的TDOA量測信息如圖6所示。

(a) 麥克風對1獲取的TDOA估計

由圖6可以看出,量測值出現了很多虛假的峰值信息,GCC的最大值并不是一直表示著真實的TDOA值。而且,在20~30 s之間,由于2個人同時說話,相互之間語音信號干擾,導致TDOA量測出現了較大的惡化。本文方法對說話人數目的實時估計效果如圖7所示,可以看出,估計是有效的。

圖7 說話人個數估計效果Fig.7 Results of speaker number estimation

3.2 混響環境下多人交互語料庫仿真分析

該部分主要是針對AMI提供的智能會議環境下的標準語料庫信息進行實際環境的實驗仿真分析,其中,語料庫信息采集的智能會議布局如圖8所示。針對該語料庫信息,該部分主要做了2組仿真分析實驗。第1組,主要是針對多人交互發言,但每一次只有一個人發言情況下的說話人進行跟蹤;第2組,主要針對2個人交互,但有時同時發言、有時同時靜默的情況進行定位跟蹤具體的實驗結果如圖9~圖12所示。

圖8 AMI智能環境布局Fig.8 Layout of AMI intelligent environment

圖9給出了第一組單人不重疊交互的跟蹤結果圖。

由圖9可以看出,該段語料庫是一種有4個人參與會議的討論,但是真正參與討論的人有2個,這2個人輪流發言,彼此說話在時間域不存在重疊現象。跟蹤結果顯示,本文方法保持了較好的跟蹤精度。在單人交互不重疊發言的情況下,2種方法均保持了滿足要求的跟蹤定位結果。

圖9 單人交互發言的跟蹤結果Fig.9 Tracking results of single person interactive speaking

目標位置跟蹤的坐標均方誤差值如圖10所示,RFS-PF為隨機有限集-標準粒子濾波方法跟蹤結果(在圖中以黃色橢圓標記跟蹤結果),RFS-DPF為隨機有限集-解耦粒子濾波跟蹤結果(在圖中以紅色橢圓標記跟蹤結果。)

(a) x軸位置均方誤差曲線

由圖10可以看出,在這種簡單交互場景下位置跟蹤均方誤差為0.03和0.2,精度較高,主要原因是在這種簡單的交互環境下,不存在交互重疊現象,噪聲之間的相關性影響較小,所以2種方法的跟蹤效果基本保持一致。

由圖11可以看出,當說話人在時間上具有重疊性的時候,彼此之間的模型噪聲關聯性增強,如果不加入解相關處理的話,會導致跟蹤誤差累積效應明顯增加。

圖11 多人重疊交互發言的跟蹤效果Fig.11 Tracking results of multi-person overlapping interactive speaking

(a) x軸位置均方誤差曲線

由圖12的跟蹤均方誤差曲線可以看出,加入解相關處理以后,跟蹤誤差保持穩定,沒有出現較大的波動,特別是在說話人語音重疊的時候,仍然保持了很好的跟蹤效果。

4 結束語

針對說話人存在場景下,說話人不連續發音以及說話人之間的交互說話問題進行了分析研究,提出了采用隨機有限集思想,將多個目標的多種狀態建立為隨機的有限集合,分別作為系統模型的單一狀態;為處理說話人語音重疊情況的跟蹤效果,將模型噪聲進行解相關處理,保證在語音重疊情況下系統模型的相互獨立性,增強了系統的跟蹤穩定性和跟蹤精度。最后,將解相關噪聲粒子濾波方法引入到了RFS理論框架,給出了相應的應用框架結構,并基于計算機仿真和實際的AMI語料庫對不同場景下的多說話人定位跟蹤效果進行了仿真分析,實驗結果證明了本文所提方法的可行性和優越性。

猜你喜歡
實驗分析方法
記一次有趣的實驗
隱蔽失效適航要求符合性驗證分析
做個怪怪長實驗
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
電力系統及其自動化發展趨勢分析
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
捕魚
主站蜘蛛池模板: 欧美亚洲一二三区| 在线视频一区二区三区不卡| 亚洲精品黄| 国产视频欧美| 青青青草国产| 精品国产www| 免费jizz在线播放| 无码中文字幕精品推荐| 欧美全免费aaaaaa特黄在线| 国产精品专区第1页| 国产午夜福利在线小视频| 国产欧美日韩视频怡春院| 2019年国产精品自拍不卡| 人妻一本久道久久综合久久鬼色| 亚洲无码电影| 欧美午夜理伦三级在线观看| 亚洲乱码视频| 男女男免费视频网站国产| 四虎AV麻豆| 无码AV动漫| 亚洲成人高清在线观看| 色国产视频| 网友自拍视频精品区| 日韩a级毛片| 欧美激情成人网| 精品国产女同疯狂摩擦2| 激情视频综合网| 爆乳熟妇一区二区三区| 香蕉视频在线观看www| 婷五月综合| 真人免费一级毛片一区二区| 亚洲中文字幕精品| 欧洲av毛片| 无码福利视频| 亚洲欧美日韩另类| 欧美成人看片一区二区三区| 性色生活片在线观看| 久青草免费在线视频| 国产美女无遮挡免费视频| Aⅴ无码专区在线观看| 国产浮力第一页永久地址 | 国产黄色免费看| 国产麻豆精品手机在线观看| 五月婷婷激情四射| 狂欢视频在线观看不卡| 国产自在线拍| 国产成人超碰无码| 久久久久久久久18禁秘| 国产香蕉国产精品偷在线观看| 中文字幕乱妇无码AV在线| 欧美日韩导航| 国内熟女少妇一线天| 91成人免费观看在线观看| 日韩视频福利| 亚洲另类国产欧美一区二区| 国产精品白浆在线播放| 免费毛片全部不收费的| 免费在线国产一区二区三区精品 | 好吊妞欧美视频免费| a国产精品| 欧美在线精品一区二区三区| 国产幂在线无码精品| 91免费国产高清观看| 在线观看欧美国产| 久久青青草原亚洲av无码| 宅男噜噜噜66国产在线观看| 麻豆AV网站免费进入| 亚洲综合第一区| 久久青草热| 人妻丰满熟妇αv无码| 亚洲人视频在线观看| 亚洲乱强伦| 国产在线观看一区精品| 激情爆乳一区二区| 亚洲天堂网2014| 欧美激情网址| 亚洲福利一区二区三区| 永久免费无码成人网站| 欧美性色综合网| 国产综合在线观看视频| 综合成人国产| 成人精品区|