999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種改進的GOP算法在區分性訓練的應用*

2014-09-17 12:31:58熱米拉艾山江
通信技術 2014年5期

熱米拉·艾山江,黃 浩

(新疆大學信息科學與工程學院,新疆烏魯木齊830046)

0 引言

隨著語音識別技術的不斷發展和完善,基于計算機輔助的語言學習成為語音信息處理技術研究領域的一個活躍的研究方向。計算機輔助語言學習的核心部分是自動發音檢錯系統,它的主要作用是通過計算機檢測說話人語音中的錯誤發音并對此進行改進,從而為學習者提供更有效的學習。自動發音錯誤檢測系統作為計算機輔助語言學習的核心部分,它的檢錯性能非常重要,而系統的檢錯性能依賴于經過正確訓練參數的聲學模型[1],因此國內外很多研究人員在聲學模型的建模和訓練方面開展了很多研究。目前主流的聲學建模是基于HMM的聲學建模,而傳統的發音質量評估方法是基于后驗概率的GOP算法。

在發音檢錯系統的聲學模型參數[2]訓練上基于區分性原理的參數優化方法從最近的的研究結果看表現出高效率性。區分性原理在語音識別研究領域中的應用已經取得了很大成功,常用的區分性訓練準則主要包括最小分類錯誤(MCE,Minimum Classification Error)[3]、最大互信息(MMI,Maximum Mutual Information)[4]以及近年來流行的最小音子錯誤(MPE,Minimum Phone Error)準則[5]。在這些區分性準則的指導下通過定義一個與識別率相一致的目標函數,優化目標函數來直接提高識別率,成功的解決了傳統最大似然參數訓練方法的局限性[6]。因此研究人員將語音識別里提出的成功的區分性訓練方法擴展到發音檢錯系統的性能優化方面。與語音識別不同的是在發音檢錯中,其性能包括正確率和檢出率,導致定義目標函數比較困難,因此從錯誤檢測度量的評估來處理這個問題[7]。根據上述思想,文中提出最大化F1值準則的算法。基于最大化F1值(MFC)的區分性訓練方法,將正確度標注的非母語語音數據庫上的發音錯誤檢測的F1值的最大化作為模型參數的訓練準則。通過Sigmoid函數平滑后的F1值函數作為目標函數,用弱意義輔助函數方法優化目標函數,通過采用擴展的Baum-Welch算法來進行參數更新,獲得明顯的改進。

文中在最大化F1值的區分性訓練方法[8]的質量評估上提出一種先歸一化再求后驗概率的改進的GOP算,根據改進GOP算法給出了使用改進GOP算法最大F1準則的參數更新公式,發音檢錯實驗結果表明基于改進的GOP算法的最大F1值準則訓練較使用傳統的GOP算法能夠進一步提高檢錯F1值。

1 改進的GOP計算公式

傳統的GOP(Goodness of Pronunciation)算法屬于后驗概率的算法,它是針對漢語的聲母、韻母定義的音素,其主要方法是通過給出的某一語音段,計算其正確程度的定量得分的[9]。GOP得分計算公式[10]為:

式中,Or,n=1,…,r,…,R 表示為每條訓練語句的特

式中,κ是在區分性訓練中常用的用來減少模型概率動態范圍的比例因子,其取值范圍是0<κ<1。按照上述假設定義如下判別函數:

用改進的GOP算法定義語音段(r,n)的檢錯測度可以寫成:

式中,d(r,n)<0 表示該語音段 Or,n被判定為錯誤發音,d(r,n)<0表示被判定為正確的。τ是門限值,它可以由經驗值調整,也可以由訓練集統計訓練得到。

2 最大F1值準則目標函數

2.1 目標函數

根據最大化F1值區分性訓練方法。F1值是精確度和召回率的調和平均,其計算公式為:

式中,Precision為精確度,Recall為召回率,由于F1值函數對模型參數的不連續性,因此利用Sigmoid對F1值函數進行平滑,則得如下平滑后的F1值目標函數:

式中,NW是人工標注為錯誤的因素數目,Err(r,n)表示語音段(r,n)的人工標注結果。NSWW(λ)為平滑后的被人工和機器同時判定為錯誤發音的個數,是平滑后的機器判定為錯誤發音的個數。

2.2 目標函數的優化

在MFC參數優化采用構造弱意義輔助函數[11]的方法,根據弱意義輔助函數優化原理,通過計算零階,一階,二階累積量從而對輔助函數的HMM高斯參數的均值與方差利用EBW迭代公式進行優化。累積量的計算公式如下[12]:

式中,I(r,n)和 L(r,n)分別是語音段(r,n)的起始幀和結束幀;γMFCq是t時刻觀察矢量O(t)在狀態s中混合高斯m的后驗概率,通過強制對齊的起止時刻以及該語音段的觀察序列O(r,n)進行前后向計算得到,γMFCq是MFC參數訓練中的累積量。式(7)~式(9)中的的計算式把的計算公式的換成就可計算。

有上述模型參數可以看出,模型參數更新主要取決于MFC參數的計算。的計算公式為:

將式(6)中目標函數表達式代入上式,根據鏈式求導法則,分別計算上式中的的偏導數:

式中,根據傳統的GOP算法算出來的語音段(r,n)上音素q的后驗概率為γq(r,n):

根據文中提出來的改進的GOP算法計算γq(r,n)得:

使用改進的GOP算法優化系統參數步驟如下:

1)初始化。

2)在訓練語段中的每個語音段(r,n)計算GOP值。

3)求使FMFC最大化的發音相關門限值τ的最優值。

6)更新模型參數。

7)若未達到最優值,返回步驟2),繼續進行參數更新。

3 實驗與結果

3.1 數據庫和實驗配置

在文中通過漢語普通話發音錯誤檢測實驗來驗證所提方法的有效性。該實驗基于面向新疆大學在校進行預科語言學習的維吾爾族大學生的漢語發音錯誤檢測任務,普通話發音檢錯任務應當包括音素錯誤檢測和聲調錯誤檢測兩個部分?;€聲學模型訓練來自863漢語普通話語音數據庫(L1語音庫)中160個說話人(男女各80個人)的86 271條訓練語句。

區分性訓練在非母語說話人語音庫(L2)上進行。L2語音數據選自100名維吾爾族大學生的朗讀數據集。每名說話人朗讀2~3套文本材料,每套文本材料包括50個單音節字、25個雙音節詞以及20個短句。這些數據經過人工標注出發音錯誤。實驗過程中將這些數據分為L2訓練集(18 643句)、L2測試集(7 030句)。概率平衡因子根據經驗選取為κ=0.1,Sigmoid參數選取為q=10.0。

3.2 實驗結果

表1給出了在傳統的GOP算法和改進的GOP算法上所得的發音檢錯訓練集和測試集的目標函數FMFC和F1的值。

表1 目標函數FMFC和F1值Table 1 Objective function value FMFC and F1

表1中,在基線模型上使用傳統GOP算法和改進的GOP算法,在訓練集和測試集上的FMFC和F1值分別為0.369,0.395,0.365 和0.392。在 MFC 準則下的模型上使用傳統的GOP算法時,在訓練集和測試集上的 FMFC值,分別從0.369 上升到0.673,從0.365上升到0.452,而訓練集和測試集上的F1值分別從0.395 升高到0.719,從0.392 上升到0.479,可以看出在MFC上使用GOP算法時,訓練集和測試集上的FMFC和F1值大大的增大。我們再在MFC準則下的模型上使用改進的GOP算法時,在訓練集上FMFC和 F1值分別為0.665 和0.616,在測試集上FMFC和F1值分別為0.454和0.489。在使用傳統的GOP算法時在訓練集上的FMFC值為0.673時,在測試集上的F1值為0.479,而使用改進的GOP算法時,在訓練集上FMFC值為0.665時,在測試集上F1值為0.489,較傳統的方法提高了1%。由此可以看出利用改進的GOP算法時,訓練集上的目標函數值不用增很多就能得到較好的測試集上的F1值。

4 結語

文中首先介紹了傳統的發音質量評估方法GOP,然后在此基礎上得到了一種改進的GOP算法公式。改進的GOP算法把傳統的GOP算法的先求后驗概率再歸一化的模式改成先歸一化再求后驗概率。然后利用改進的GOP算法計算最大化F1值區分性訓練中的語音段(r,n)的新的檢錯測度和后驗概率,實驗結果表明,用改進的GOP算法得到的檢錯測度和后驗概率在MFC訓練上更有效率性,在訓練集上較低的目標函數值時在測試集上也能得到較好的的F1值,具有了較好的過訓練抑制性,從而達到了提高發音檢錯系統性能的提高。

[1] 米日古力·阿布都熱素,艾克白爾·帕塔爾,艾斯卡爾·艾木都拉.基于電話語料的維吾爾連續音素識[J].通信技術,2012,45(07):54-59.Mirigul Abdurusul,Akbar pattar,Askar Hamdulla.Telephone Speech Corpus-based Uyghur Continuous Phone Recognition.Communications Technology,2012,45(7):54-59.

[2] 古力努爾·艾爾肯,艾斯卡爾·艾木都拉,地里木拉提·吐爾遜.維吾爾語四音節元音和諧詞的共振峰模式研究[J].通信技術,2013,46(11):47-50.Gulnur Arkin,Askar Hamdulla,Dilmurat Tursun.Formant Features Analysis of Vowel Harmonious in Four-Syllabic UyghurWords. Communication Technology,2013,46(11):54-59.

[3] POVEY D.Discriminative Training for Large Vocabulary Speech Recognition[D].England:Cambridge University,2004.

[4] NORMANDIN Y.Maximum Mutual Information Estimation of Hidden Markov Models[C]//Pro.Of Automatic Speech and Speaker Recognition.Holland:Kluwer Academic Publishers ,1996:57-81.

[5] POVEY D ,WOODLAND P C.Minimum Phone Error and I-smoothing for Improved Discriminative Training[C]//Proc.of ICASSP.Orlando,USA:IEEE press,2002:105-108.

[6] 張峰.基于統計模式識別的發音錯誤自動檢測的研究[D].合肥:中國科學技術大學,2009:13-35.ZHANG Feng.A Study on Automatic Mispronunciation Detection based on Statistical Pattern Recognition[D].He Fei:University of Science and Technology of China,2009,13-35.

[7] 劉金鑫.區分性訓練在計算機輔助發音訓練系統中的應用[D].天津:南開大學,2011:38-44.LIU Jin-xin.Application of Discriminative Training in Computer Assisted Pronunciation Training System[D].Tian Jin:Nankai University,2011,38-44.

[8] HUANG Hao,WANG Jian-ming,Abdureyimu Halidan.Maximum F1-Score Discriminative Training for Automatic Mispronunciation Dtection in Computer-Assisted Language Learning[R].USA:ISCA,2012:815-818.

[9] 竺博.區分性訓練和區分性自適應在自動語音識別聲學模型優化中的應用[D].合肥:中國科學技術大學,2009:16-28.ZHU Bo.Application of DT and DT Adaption Acoustic Model of ASR[D].He Fei:University of Science and Technology of China,2009,16-28.

[10] WITT S M,YOUNG S J.Phone-level Pronunciation Scoring and Assessment for Interactive Language Learning[J].Speech Communication,2000,30(2-3):95-108.

[11] POVEY D.DiscriminativeTraining for Large Vocabulary Speech Recognition[D].England:University 0f Cambridge,2004:25-34.

[12] 黃浩,王建明,哈力旦·阿不都熱依木,吾守爾·斯拉木.自動發音錯誤檢測中基于F1值最大化的聲學模型訓練方法[J].聲學學報,2013,38(06):751-758.HUANG Hao,WANG Jian-ming,Abdureyimu Halidan,Silamu Wushour.Maximum F1-Score Discriminative Training for Automatic Mispronunciation Detection[J].ACTA ACUSTICA,2013,38(6):751-758.

主站蜘蛛池模板: 亚洲成网站| 亚洲成人精品| 国内毛片视频| 97超级碰碰碰碰精品| 小蝌蚪亚洲精品国产| 在线观看国产精品第一区免费 | 国产日本一区二区三区| 亚洲天堂视频网站| 国产jizz| 在线观看无码a∨| 91久久精品日日躁夜夜躁欧美| 欧美日本在线| 69免费在线视频| 日日拍夜夜嗷嗷叫国产| 一本大道视频精品人妻| 99久久精品无码专区免费| 亚洲成肉网| 亚洲人妖在线| 日韩精品亚洲精品第一页| 一级做a爰片久久免费| 99国产精品国产| 熟妇人妻无乱码中文字幕真矢织江| 亚洲精品你懂的| 亚洲日本精品一区二区| 国产精品xxx| 中文字幕欧美日韩| 丁香婷婷激情网| 99精品福利视频| 久久永久精品免费视频| 国产在线观看人成激情视频| 亚洲成人动漫在线观看| h视频在线观看网站| 99r在线精品视频在线播放| 国产农村1级毛片| 亚洲嫩模喷白浆| 日本精品视频一区二区| 色综合天天娱乐综合网| 日韩色图在线观看| 亚洲精品久综合蜜| 免费一极毛片| 亚洲VA中文字幕| 国产精品原创不卡在线| 亚洲三级电影在线播放| 白丝美女办公室高潮喷水视频| 亚洲经典在线中文字幕| 亚洲天堂伊人| 91无码视频在线观看| 国产视频大全| 精品无码国产自产野外拍在线| 国产91丝袜在线播放动漫| 日本精品αv中文字幕| 五月激激激综合网色播免费| 国产一区二区色淫影院| 99久久精品视香蕉蕉| 二级特黄绝大片免费视频大片| 亚洲丝袜第一页| 亚洲成人77777| 日本成人在线不卡视频| 日韩毛片基地| 99一级毛片| 亚卅精品无码久久毛片乌克兰| 国产毛片基地| 欧美一区福利| 亚洲天堂色色人体| 99在线观看视频免费| 97在线免费| 国产成人综合久久| 亚洲首页国产精品丝袜| 欧美黑人欧美精品刺激| 国产高清无码第一十页在线观看| 亚洲精品777| www.youjizz.com久久| 久久国产亚洲偷自| 玖玖免费视频在线观看| 国产极品美女在线播放| 精品無碼一區在線觀看 | 免费全部高H视频无码无遮掩| 精品無碼一區在線觀看 | 伊人无码视屏| 国产第八页| 色国产视频| 国产精品第一区|