999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

噪聲環境下法庭語音證據量化評價方法

2019-07-15 11:18:28王華朋晁亞東
計算機應用與軟件 2019年7期
關鍵詞:數據庫特征模型

王華朋 姜 囡 晁亞東 劉 恩

(中國刑事警察學院聲像資料檢驗技術系 遼寧 沈陽 110854)

0 引 言

鑒定結論是指鑒定人對訴訟中涉及的專門性問題運用科學技術或專門知識進行鑒定和判斷的基礎上給出的綜合結果。十屆全國人大常委會第十四次會議通過的《關于司法鑒定管理問題的決定》中提出把“鑒定結論”改為“鑒定意見”,更改的初衷是因為鑒定結果只是鑒定人基于個人認知能力的判斷,對于整個案件而言,這些意見只是諸多證據中的一種證據,所以用“鑒定意見”來描述更為恰當,有利于正確說明這類證據在訴訟中的作用。這雖然是對證據效力思考后的一次巨大進步,但是,這并不意味著更改一下描述方式,證據就具有了科學性,越來越多的學者開始關注證據的科學性[1-4]。科學證據的基本要求包括:檢驗方法和檢驗過程都是科學的,結果是客觀的、可重復的、證據強度是可量化的[5]。法庭說話人識別最主要的任務就是比對罪犯和嫌疑人的語音樣本,提取有效穩定語音特征,利用這些特征加以識別或確認。隨著語音證據出現率越來越高,國內外對語音證據評估方法有了新的發展,即采用基于似然比的證據評估方法[1,6-7]。DNA檢驗率先使用該方法,目前正被推廣到其他的法庭證據領域。該方法可以量化評估證據對鑒定結論支持程度的大小,是邏輯上和法律上都正確的法庭證據評估方法,在國內外獲得了廣泛的認同。

人類聽覺系統是高度復雜并且高度精密的生理系統,具有很強的聲音識別能力和抗噪聲能力[8],能在復雜環境中捕捉目標語音。它的聲音分析能力大幅度超過了自動說話人識別系統。在含有噪聲的環境下,人類聽覺系統識別的準確率比任何自動識別系統更具有可靠性[9]。基底膜是耳蝸中能夠辨別分析聲音最重要的部位[10],頻率不同的聲音導致基底膜以不同的形式振動,越接近基底膜頂部,共振頻率越低,越接近基底膜底部,共振頻率越高。因此基底膜能夠將不同頻率的聲音對應到基底膜對應的位置,以基底膜振幅的幅度表示頻率的強度[11],Gammatone濾波器能夠模擬耳蝸基底膜的分析不同聲音的特性[12-13]。本文選擇GFCC作為自動識別系統的輸入參數,在似然比證據強度評估體系下,對語音中說話人身份的自動識別方法進行了研究,為了提高計算效率和降低噪聲的干擾,使用主成分分析技術對GFCC特征進行了降維。

1 GFCC特征及PCA

1.1 GFCC特征及提取方法

GFCC特征主要通過Gammatone濾波器來實現,該濾波器能夠模擬類似耳蝸的聽覺模型其時域形式為:

gi(f,t)=ktn-1e-2πbitcos(2πfi+φ)t≥0

(1)

式中:φ為相位,相位對人耳聽覺影響較小,常取φ=0,f為各子濾波器的中心頻率,n表示濾波器階數,根據對耳蝸聲學特性的測試結果,4階Gammatone濾波器與人耳聽覺特性十分相似[14-15],本文中n取值為4,i表示子濾波器編號,bi、fi為第i個子濾波器的帶寬和中心頻率,k為增益。

4階的Gammatone濾波器各頻帶寬度表示為:

(2)

Gammatone濾波器有N個(一般取N=64)單獨濾波器組成,整個濾波器的帶寬一般從50 Hz到采樣頻率的二分之一。

提取GFCC特征的步驟如下:

(1) 語音信號通過64通道Gammatone濾波器組。

(2) 對各通道的濾波響應取絕對值。

(3) 對上述濾波響應的絕對值取對數。

(4) 對上述對數結果進行離散余弦變換,以減少各維特征之間的相關性。

1.2 PCA

主成分分析是數學上對數據分析主要成分的方法,可降低特征的維度,也能降低計算量、減弱特征間互相影響等問題,還具有一定的降噪功能[16]。它的基本思想是找到一個投影方向將高維的特征向量投影到低維空間中,即從原始數據中分析出低維的主分量來代表原始數據。本文中根據累計貢獻率大于95%的原則,設置背景數據庫50人中累計貢獻率大于95%的需要的最低維度為主成分分析降維后的維度,通過實驗驗證,降維后的特征維度為14。

2 法庭自動說話人識別系統

2.1 基于似然比的法庭自動說話人識別系統

似然比可以表示成在同源假設條件下出現嫌疑人語音特征的概率和在完全相反的非同源假設條件下出現相同語音特征概率的比值。因此,似然比就是當前語音證據支持同源假設和支持非同源假設的相對強度,似然比數值反映證據強度的大小。如果用P表示條件概率,E表示證據,H0表示同源假設,H1表示非同源假設,那么似然比表示為:

(3)

法庭自動說話人識別系統的流程圖如圖1所示,其核心為基于LR的證據評估體系,系統的輸出結果是一個具有物理意義的概率比,即犯罪證據在嫌疑人語音中出現的概率與該語音證據在除嫌疑人之外的其他人群中出現的概率比。該自動說話人識別系統的特征提取與模型訓練部分和普通說話人識別相同,只是在門限判決部分采用似然比,而不是根據經驗或先驗知識得到的門限設置。似然比天然的識別閾限為1,如果似然比結果大于1,則說明證據支持同源假設;如果似然比結果小于1,則說明證據支持非同源假設,即罪犯和嫌疑人不是同一人;如果等于1,對兩個假設的支持力度相同,說明是一個無效的證據。

圖1 法庭自動說話人識別系統流程圖

在圖1虛線之上為法庭自動說話人識別系統的訓練部分,虛線之下為測試部分。由訓練背景數據庫訓練出背景人群的高斯混合模型(Universal Background Model,UBM),然后通過自適應高斯混合模型算法[17]計算出每個說話人的高斯混合模型(Gaussian Mixture Model,GMM),如圖2所示。通過參考數據庫中測試語音與GMM的對比,獲得輸出得分,然后根據相同說話人語音得分訓練相同說話人正態分布模型,根據不同說話人語音得分訓練不同說話人正態分布模型,并根據參考數據庫中的數據使用邏輯回歸算法對似然比結果進行校正,獲得校正加權值。測試時,測試語音的得分在上述兩個正態分布模型上分別計算出現概率,其比值即為似然比,通過測試部分獲得的校正權值校正后,即為最后的似然比得分,是對證據強度的量化結果。

圖2 說話人模型自適應流程圖

2.2 法庭說話人識別系統性能可靠性評估

法庭自動說話人識別系統的識別性能由美國國家標準及技術署說話人識別技術評測中心使用的系統性能評估函數來度量,它是與先驗概率無關的對數似然比代價函數:

(4)

式中:Nss和Nds分別是相同說話人語音對和不同說話人語音對的個數,LRss和LRds分別是相同說話人比較對和不同說話人比較對產生的似然比數值。識別系統的結果越可靠,Cllr的值就會越低。

3 結果與討論

3.1 數據庫設置

本文使用了3個男性說話人數據庫,分別為背景數據庫(50人)、參考數據庫(20人)和測試數據庫(60人)。上述數據庫中說話人年齡在19~24歲之間,每個人錄音2次,采用中國刑事警察學院的內部固話系統錄制,保存為“Windows PCM,*.wav”格式,采樣率為8 000 Hz,采樣精度為16位。數據庫中說話人被要求以普通話朗讀固定的文本內容,錄制環境為普通的辦公室環境。使用Audition CS6軟件去除各條語音中的非語音段,以排除講話停頓時間的干擾。

為模擬真實案件的情況,本文提取了真實案件中辦公室錄制音頻中的噪聲,其頻譜特性如圖3所示,分別按不同程度信噪比加入到上述三個純凈數據庫中,形成了信噪比分別為20、10、0、-10和-20 dB的五個等級的數據庫,以測試GFCC特征抗噪聲干擾能力。

圖3 真實案件錄音中噪聲聲譜圖

使用背景數據庫中50人的兩次錄音(各30秒)訓練背景人群數據庫,即UBM。它反映GFCC特征在人群中出現的情況,由64維的高斯混合模型來表示。使用參考數據庫中20名說話人組成的20人相同說話人比較對及190人不同說話人比較對,提取每人兩次錄音的前10秒進行組合,使用自適應高斯混合模型算法,從UBM中生成表征每個人語音特性的GMM,然后使用每人第一次錄音的另外10秒語音進行測試。由20次相同說話人比較對的得分訓練成正態分布模型H0,表征說話人自身的變化性;由1 770次不同說話人比較對的得分訓練成另外一個正態分布模型H1,表征不同說話人之間的變化性。使用參考數據中每人第一次錄音中沒有用過的另外10秒數據進行測試,測試輸出得分在模型H0和H1上計算似然比數值。然后使用邏輯回歸算法對結果進行校正,在校正過程中產生校正權重,用于對測試數據庫的似然比輸出結果進行校正。

在每次測試中,由測試數據庫中的60人組成60個相同說話人比較語音對,同時組成1 770個不同說話人比較語音對,提取每人兩次錄音的前10秒進行組合,使用自適應高斯混合模型算法,從UBM中生成表征每個人語音特性的GMM,然后使用每人第一次錄音的其他10秒語音進行測試,測試語音的長度為10秒。輸出得分在H0和H1分別計算出現概率,其比值即為測試數據庫的似然比數值。

3.2 純凈數據庫測試結果

在未加噪的純凈數據中,本文采用了64維GFCC特征的前26維,沒有使用PCA 降維。圖4是參考數據庫中未使用過的10秒語音在本文FASR上獲得的測試結果。結果使用Tippett圖表示,圖中豎直的虛線為識別閾值,似然比的識別閾值為1,取對數后為0;左上較細的實線表示不同說話人似然比取對數10后大于等于x軸刻度的樣本所占的比率,小于閾值即為正確識別,距離閾值越遠,證據強度越大;右上較粗的實線表示同一說話人似然比取對數10后小于等于x軸刻度的樣本所占的比率,大于閾值即為正確識別,距離閾值越遠,證據強度越大。圖5為使用邏輯回歸校正算法校正后的似然比結果。對比圖4和圖5可以得到,校正后,代表閾值門限的豎直虛線右移,更位于相同說話人和不同說話人的對數似然比得分的中間,錯誤識別率進一步降低。圖5中所有的不同說話人比較對和相同說話人比較對都得到了正確識別,圖4中校正前結果中存在一小部分不同說話人識別結果被錯誤認定,說明校正算法是有效的。圖6為測試數據庫的似然比結果,錯誤否定率(False negative rate,FNR)為0,錯誤認定率(False positive rate,FPR)為0.17%,值為0.006 4。

圖4 參考數據庫校正前Tippett圖

圖5 參考數據庫校正后Tippett圖

圖6 測試數據庫Tippett圖

3.3 噪數據庫測試結果

在加噪聲數據庫中,本文使用前文所述的PCA算法進行了降維,把64維GFCC特征降為14維特征。在-20 dB的條件下,對于相同說話人語音對,其FNR為5%,對于不同說話人語音對,其錯誤認定率FPR為3.39%。為節省篇幅,本文使用表1列出了不同信噪比條件下識別系統的值與錯誤識別率。從數據層面上來看,本文方法優于文獻[13]中的方法,但是由于數據庫選擇、錄制環境、加入噪聲類型、測試語音長短不同等因素的影響,很難進行客觀的橫向比較。

表1 不同信噪比條件下識別系統的Cllr值與錯誤識別率

從表1中測試結果可知,參考庫校正前后的值都有不同程度的下降,說明本文使用的邏輯回歸算法的有效性。FPR和FNR在信噪比逐漸降低的條件下,保持相對緩慢的增長,但是,即使在高噪聲條件下,識別系統依然保持了良好的穩定性。即使識別錯誤,其錯誤的程度并不大,不會對鑒定結果產生較大的錯誤影響。

4 結 語

本文使用能模擬耳蝸聽覺特性的GFCC特征與主成分分析相結合的方法,在不同信噪比程度下,對基于似然比證據評估體系的法庭自動說話人識別系統抗噪特性進行了研究。實驗結果表明:該方法在信噪比不斷降低的情況下,法庭自動說話人識別系統依然能保持良好的穩定性和較高的識別率,甚至在-20 dB的條件下,具有5%的錯誤否定率、3.39%的錯誤認定率。測試采用來自真實案件的辦公室錄音噪聲,對法庭自動說話人識別系統的實際法庭應用具有重要意義,下一步將對更多類型的案件噪聲進行測試,以拓寬應用范圍。

猜你喜歡
數據庫特征模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
數據庫
財經(2017年2期)2017-03-10 14:35:35
3D打印中的模型分割與打包
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
主站蜘蛛池模板: 一区二区三区在线不卡免费| 亚洲第一中文字幕| 国产91小视频在线观看| 国产香蕉一区二区在线网站| 日本91视频| 国产精品深爱在线| 国产色婷婷| 九九热在线视频| 国产三级a| a毛片免费观看| 一级片一区| 91成人免费观看| 99国产精品免费观看视频| 女同久久精品国产99国| 成人免费网站久久久| 亚洲另类色| 日韩东京热无码人妻| 爆操波多野结衣| 国产a v无码专区亚洲av| 丁香六月综合网| 538国产在线| 亚洲人精品亚洲人成在线| 久久久久人妻一区精品| 日韩午夜福利在线观看| 国产人前露出系列视频| 日韩精品资源| 欧美在线精品怡红院| 91精品国产丝袜| 国产视频久久久久| 精品中文字幕一区在线| 亚洲成人一区在线| 亚洲中文字幕久久无码精品A| 中文字幕在线看视频一区二区三区| 欧美中文一区| 国产一区二区精品福利| 麻豆精品视频在线原创| 亚洲色图欧美激情| 四虎国产永久在线观看| 国产欧美日韩综合在线第一| 99久久这里只精品麻豆| аⅴ资源中文在线天堂| 亚洲天堂久久| 伊人AV天堂| 亚洲国产系列| 亚洲一区二区成人| 456亚洲人成高清在线| 欧美在线导航| 亚洲色图另类| 九色综合视频网| 午夜不卡福利| 在线观看国产小视频| 麻豆国产精品一二三在线观看| 国产精品丝袜在线| 狠狠色丁香婷婷| 孕妇高潮太爽了在线观看免费| 亚洲伦理一区二区| 精品少妇三级亚洲| 天天综合色天天综合网| 亚洲伊人久久精品影院| 日韩精品毛片人妻AV不卡| 91精品啪在线观看国产91九色| 色噜噜狠狠色综合网图区| 在线人成精品免费视频| 黄片在线永久| 毛片免费高清免费| 国产成人精品综合| 日本免费a视频| 美女一级毛片无遮挡内谢| 亚洲一级毛片| 亚洲一区色| 亚洲国产成人精品青青草原| 精品国产免费观看一区| 亚洲精品亚洲人成在线| 在线观看免费黄色网址| 日韩精品一区二区深田咏美| 亚洲第一天堂无码专区| 亚洲精品视频网| 黄片一区二区三区| 国产三级精品三级在线观看| 久久黄色免费电影| 婷婷激情亚洲| 色妞www精品视频一级下载|