999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

DHMM在家用安全門藏文語音識別中的應用

2016-12-12 09:09:26裴春寶
重慶理工大學學報(自然科學) 2016年11期
關鍵詞:模型

裴春寶

( 西藏大學 藏文信息技術研究中心,拉薩 850000)

?

DHMM在家用安全門藏文語音識別中的應用

裴春寶

( 西藏大學 藏文信息技術研究中心,拉薩 850000)

對于家用安全門的防護措施,除了傳統(tǒng)的安全鎖,目前也使用一些指紋識別技術。給出了一種安全性更高的基于DHMM的家用安全門藏文語音識別系統(tǒng)。通過語音的監(jiān)控方式,引入矢量量化(VQ)算法,同時建立安全門語音的離散隱馬爾科夫模型(DHMM)。通過MFCC的特征參數(shù)抽取,將LBG算法應用在藏文碼書設計中,導出多觀察序列的參數(shù)重估形式。在實驗中選擇30個人的語音信號作為實現(xiàn)對象,結果表明,識別準確率達到99%以上,驗證了此方法的可適用性。

隱馬爾科夫模型;藏文語音識別;矢量量化

隨著時代的發(fā)展,人們對于生活的要求越來越高,應運而生的無線傳感技術、無線通信技術以及無線網(wǎng)絡技術都有了長足的發(fā)展。傳統(tǒng)的家用安全門是針對安全鎖進行升級,使得用戶通過盡可能繁瑣地調(diào)整鎖來保證人身和財產(chǎn)的安全,但會導致一旦鑰匙丟失,或者密碼鎖的密碼遺忘,都會給用戶帶來不必要的麻煩,對自身的物力和財力都會造成消耗。

本設計提出的離散隱馬爾科夫模型是一種統(tǒng)計模型,在語音識別領域得到了很好的應用。其理論基礎源于1970年左右Baum等[3-4],隨后,CMU的Baker和IBM公司的Jelinek等將它引入到語音識別中[1]。真正的HMM模型被全世界的語音研究人員所認識是通過Bell實驗室的Rabiner等人的努力。隨著HMM模型的進一步演化,它的應用領域也在不斷擴大,目前已在金融市場的波動分析、手寫字識別[9]、手勢識別[11]、旋轉機械啟動故障診斷[2,16]、電源監(jiān)控[10]、經(jīng)濟預算、語音識別、神經(jīng)生理學與生物遺傳等方面有了很好的應用。家用安全門設計的音頻信號是非平穩(wěn)的,DHMM模型是一種模擬非平穩(wěn)動態(tài)模型的多元統(tǒng)計工具[12]。在很多領域圖形識別和語音識別被廣泛地應用,需要通過對局部結構特征的分析得到關于目標和背景的先驗分布信息,再進一步對比度特征和空間位置關系特征進行抽取[13-14]。

1 DHMM模型算法的應用

DHMM模型是一種隨機過程的統(tǒng)計模型。在某一時刻的一個事件必然是處于一個狀態(tài),t時刻的狀態(tài)會受到前一個時刻狀態(tài)的影響,同時會產(chǎn)生一個觀測值,觀測值都會對應一個概率分布。

用參數(shù)集α=(π,C,D)描述DHMM模型。假設st,是通過有限狀態(tài)空間Θ={1,2,…,M}的齊次馬爾科夫鏈,Lt,t≥1是觀測序列,取值范圍為集合R={r1,r2,…,rn}。定義模型的參數(shù):

初始分布η:

(η=(η1,η2,…,ηm)

ηi=P(s1=i),i∈Θ)

狀態(tài)轉移概率矩陣C=(cij):

cij=P(st+1=j|st=i),i,j∈Θ

觀察值概率矩陣D=(di(rj)):

di(rj)=P(Lt=rj|st=i),i∈Θ,rj∈R

1.1 DHMM觀察序列的參數(shù)重估

給定觀察序列L是DHMM模型的重要內(nèi)容。通過調(diào)整模型參數(shù)α,得到概率P(L|α)的最大值,實現(xiàn)參數(shù)的重估。標定需要很多樣本的參與才能解決前后向變量的溢出問題。

多觀察序列的Baum-Welch的重估公式為[5-7]:

(1)

(2)

(3)

同理,可得多觀察序列觀察值重估公式的標定形式為:

(4)

1.2 對隱狀態(tài)的估計

κt(i)為沿某條路徑s1,s2,…,st,t時刻的狀態(tài)st=i同時生成觀察序列l(wèi)1,l2,…,lt的最大概率:

由歸納法可算出st(i),推理公式為

(5)

然而在計算機上實現(xiàn)時,κt(i)會超出雙精度而出現(xiàn)溢出狀態(tài),所以實際計算κt(i)的對數(shù)值的步驟如下:

初始化:

lg[κ1(i)]=lg(ηi)+lg[di(l1)],1≤i≤M;

ψ1(i)=0,1≤i≤M;

對公式(5)取對數(shù)得到遞推公式為:

則最佳狀態(tài)的概率對數(shù)值為:

2 DHMM模型在家用安全門語音識別的應用

DHMM模型在家用安全門語音識別的結構系統(tǒng)主要分為訓練過程和識別過程。這里提取的是語音的倒譜域參數(shù),主要分為MFCC和LPCC參數(shù)[15],它們都是多維矢量,分別得出48維的MFCC和LPCC參數(shù)。HMM模型可把矢量序列轉換為標量序列,矢量量化能很好地完成這樣的任務。通過LBG算法[8]可完成碼書的設計。

在模型的訓練和語音識別中,以得到訓練和識別語音的特征參數(shù)矢量和碼書各個碼字的歐式距離。通過最小序號的碼字為觀察值的幀,可以完成輸入語音到觀察序列的轉換,能很好地應用于DHMM模型的訓練和識別。

2.1 MFCC參數(shù)和LPCC參數(shù)的特征抽取

MFCC參數(shù)和LPCC參數(shù)是不同的兩種特性區(qū)別,其中,MFCC參數(shù)通過人耳聽覺來判斷,而LPCC參數(shù)通過語音識別模型獲得。MFCC參數(shù)抽取的過程如圖1所示。

圖1 MFCC特征參數(shù)的抽取

語音首先通過預加重和分幀以及加窗過程后,通過對每幀進行快速的傅里葉(FFT)轉換,得到短時頻譜;然后頻譜通過48個Mel頻率三角濾波器過濾。通過濾波器輸出的每一個能量去對數(shù),得到對數(shù)的能量,由對數(shù)能量得出DCT的倒譜。

2.2 DHMM模型的訓練過程

對語音分段的階段,需要選同一樣的語音,一般每段語音的長度為20幀到600幀。訓練過程是一個迭代的過程。觀察值概率矩陣很重要,因此需要首先得出D的初始值。對于影響小的C和α可以根據(jù)訓練模型的要求手動設置。計算D的初值,需要根據(jù)α、C、D的初值應用Viterbi算法得出語音的隱狀態(tài),同時得出各個觀測值的概率,然后得到D的初值。

通過初始值可以實現(xiàn)參數(shù)重估的一直循環(huán)。應用Baum-Welch算法對模型進行重估,然后通過Viterbi算法計算重估模式下觀測值序列出現(xiàn)的概率,穩(wěn)定概率后,才可以停止參數(shù)重估的循環(huán)。為了確保訓練模型準確率更高,選擇迭代次數(shù)為 1 000 次。由多次的循環(huán)結束得到的結果,可以看到矩陣D的元素大多值為0,這樣會使Viterbi算法算出的結果無效,需要在每次參數(shù)重估以后進行矩陣D的矯正,將0都改為最小的正數(shù)10-5,同時還要滿足每一行的元素之和為1。

語音的開始都是從第一個字或者音素,開始和結束的狀態(tài)固定。為了計算的方便,把發(fā)音的開始狀態(tài)強制定義為1,則它的初始概率可以表示為

α=(1,0,…,0)

對于安全門的語音識別信號,需要對信號進行分割。通過隨機的分割,來判斷聲音與原訓練的語音模型是否相符。本文的模型狀態(tài)是10個,所以它的初始狀態(tài)為等概率狀態(tài)為:

α=(0.1,0.1,…,0.1)

DHMM模型的參數(shù)C決定了模型的形式。DHMM模型的語音識別方式是開始狀態(tài)和結束狀態(tài)都是固定的,最后一個只能傳到自身。

2.3 語音識別過程

3 實驗結果分析

選擇30個人的聲音作為語音識別對象進行實驗。每種音頻10個樣本用于訓練DHMM模型,另外10個樣本用于識別,HMM模型的訓練次數(shù)是 1 000 次。語音音頻的采樣頻率為6MHz,經(jīng)過截止頻率為3MHz的低通濾波器后分幀,每幀為256個采樣點,幀移為60個采樣點。訓練出的狀態(tài)轉移概率矩陣為Y:

從表1可以看出:語音男的概率對數(shù)值大部分相同,語音女的概率對數(shù)值大部分也相似,說明他們的音頻相似,與實際情況相同。

語音識別的關鍵在于實時性,因此能無延時地識別語音而自動執(zhí)行相關命令,具有很高的實用性。采用Viterbi算法實現(xiàn)識別功能,在Matlab仿真中,50幀長度的語音識別需要0.23s左右。

通過選擇合適的幀,使得識別準確率更加的合理。從圖2可以看出幀數(shù)與識別率的關系,幀數(shù)在30幀到80幀的時候識別準確率是比較高的;在幀數(shù)低于10時,識別準確率下降很快,高于80以后識別準確率也稍有下降。

表1 30語音個人在DHMM模型下的概率對數(shù)值

圖2 語音的識別準確率與幀數(shù)的關系

去噪環(huán)境下,對MFCC參數(shù)的識別率在93%左右,LPCC的識別率在93.4%左右。在有噪聲干擾的情況下,識別準確性會有所下降。當HMM個數(shù)減少時,準確識別率反而增高;碼書的距離越大,識別率也越高,但會由于計算量的增加而延時,這樣更便于用戶對家用安全門的使用。

4 結束語

針對家用安全門的語音識別,采用MFCC作為DHMM模型的特征參數(shù),同時應用矢量量化來進行構造模型和訓練,完成對語音的分析和識別功能,使得語音識別的準確率達到96.5%以上,可應用在家用安全門以及一些其他方面。當有噪聲干擾時,識別率會下降,需要進一步的研究。如果語音的音頻不正確,則拒絕服務,這樣能為人們生活的安全和方便帶來深遠的影響。

[1]JELINEKF.ContinuousSpeechRecognitionbyStatisticalMethods[J].ProceedingsofTricomm,1976,64(4):532-536.

[2] 邵強,馮長建,管麗娜,等.混合密度連續(xù)HMM在旋轉機械啟動過程故障診斷中的應用[J].機械科學與技術, 2009,28(11):1439-1443.

[3]LEONARDE,BAUMJ,EAGONA.AninequalitywithapplicationstostatisticalestimationforprobabilisticfunctionsofMarkovprocessesandtoamodelforecology[J].BulletinoftheAmericanMathematicalSociety,1967,73:360-363.

[4]BAUMLE.AninequalityandassociatedmaximizationtechniqueinstatisticalestimationforprobabilisticfunctionsofaMarkovprocess[J].Inequalities,1972(3):1-8.

[5]RABINERLR,LEVINSONSE,SONDHIMM.OntheapplicationofvectorquantizationandhiddenMarkovmodelstospeakerin-dependent,isolatedwordrecognition[J].TheBellSystemTechnicalJournal,1993:321-371.

[6]RABINERLR.AtutorialonhiddenMarkovmodelsandselectedapplicationsinspeechrecognition[J].ProcessingoftheIEEE,1989,77(2):257-285.

[7] 張金良,裴春寶,擁措.隱馬爾科夫模型在列車無線傳輸中的應用[J].西安工程大學學報,2015(4):457-461.

[8] 韓紀慶,徐希利.一種基于矢量量化的音頻場景分析方法[J].電聲技術,2002(3):8-10.

[9] 肖明,賈振紅.基于輪廓特征的HMM手寫數(shù)字識別[J].計算機工程與應用,2010(33):172-174.

[10]程延偉,謝永成,李光升.基于加權HMM的車輛電源系統(tǒng)狀態(tài)預測[J].計算機應用,2011(6):1696-1698.

[11]嚴焰,劉蓉,黃璐,等.基于HMM的手勢識別研究[J].華中師范大學學報(自然科學版),2012(5):555-559.

[12]闕大順,趙永安,文先林,等.基于DHMM和VQ的關鍵詞識別系統(tǒng)研究[J].武漢理工大學學報,2011(2):140-143,152.

[13]張建勛,汪波,侯之旭,等.圖像多特征融合的障礙物檢測[J].重慶理工大學學報(自然科學),2015(3):65-70.

[14]曾祥鑫,李飚,劉坤.基于對比度和局部結構特征的顯著性檢測[J].重慶理工大學學報(自然科學),2015(9):93-97.

[15]竺樂慶,王鴻斌,張真.基于Mel倒譜系數(shù)和矢量量化的昆蟲聲音自動鑒別[J].昆蟲學報,2010(8):901-907.

[16]丁啟全,馮長建,李志農(nóng),等.旋轉機械啟動全過程DHMM故障診斷方法研究[J].振動工程學報.2003(1):41-45.

(責任編輯 楊黎麗)

The Application of DHMM in Home-Security Door with Tibetan Speech Recognition

PEI Chun-bao

(Tibetan Information Technology Research Center, Tibet University, Lhasa 850000, China)

Besides the traditional security lock, the protective measures of home-security door includes fingerprint identification.This study provides a more secure Tibetan speech recognition system based DHMM. By voice monitoring methods and the introduction of the vector quantization (VQ) algorithm, it established a security door voice discrete hidden Markov model (DHMM). By MFCC feature parameters extraction, it applied LBG algorithm in Tibetan code-book design, and exported observe parameters revaluation form sequence.30 persons’voice signals was chosen as the experiment object. The result showed a recognition accuracy rate of more than 99%, which verifies the applicability of this method.

hidden Markov model; Tibetan speech recognition; vector quantification

2016-04-18 基金項目:2016年度教育部人文社會科學青年基金資助項目(16XZJCZH001);西藏自治區(qū)自然科學基金資助項目(2015ZR-14-1);2014年度西藏大學青年科研培育基金資助項目(ZDPJZK201403);國家哲學社會科學重大項目(14ZDB101);西藏自治區(qū)高校青年教師創(chuàng)新支持計劃資助項目(QC2015-19);西藏大學珠峰學者人才發(fā)展計劃“杰出青年學者”階段性成果

裴春寶(1980—),女,碩士研究生,主要從事語音識別研究,E-mail:375394610@qq.com。

裴春寶.DHMM在家用安全門藏文語音識別中的應用[J].重慶理工大學學報(自然科學),2016(11):150-154.

format:PEI Chun-bao.The Application of DHMM in Home-Security Door with Tibetan Speech Recognition[J].Journal of Chongqing University of Technology(Natural Science),2016(11):150-154.

10.3969/j.issn.1674-8425(z).2016.11.024

TP39

A

1674-8425(2016)11-0150-05

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數(shù)模型及應用
p150Glued在帕金森病模型中的表達及分布
函數(shù)模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 国产永久在线观看| 色综合久久无码网| 久久国产亚洲偷自| 中文字幕伦视频| 波多野结衣第一页| 天堂亚洲网| 一级毛片在线免费看| 亚洲日韩在线满18点击进入| 999精品在线视频| 少妇被粗大的猛烈进出免费视频| 美女高潮全身流白浆福利区| 成人噜噜噜视频在线观看| 国产又色又爽又黄| 在线精品亚洲国产| 欧美精品高清| 丝袜美女被出水视频一区| 免费无遮挡AV| 色婷婷电影网| 婷婷成人综合| 六月婷婷激情综合| 亚洲人网站| 国产在线第二页| 国产精品片在线观看手机版 | 日韩无码黄色网站| 91成人在线免费观看| 久久精品中文字幕少妇| 欧美综合中文字幕久久| 中文字幕在线视频免费| 国产黑人在线| 91精品最新国内在线播放| 亚洲第一区精品日韩在线播放| 亚洲日本中文字幕天堂网| 国产香蕉97碰碰视频VA碰碰看| 伊人91视频| 99精品视频九九精品| 啪啪免费视频一区二区| 国产一级小视频| 日韩成人免费网站| 四虎精品黑人视频| 亚洲一区二区黄色| 曰韩人妻一区二区三区| 91在线精品免费免费播放| 国产在线观看人成激情视频| 免费国产小视频在线观看| 在线观看精品自拍视频| 久久综合一个色综合网| 国产一级片网址| 男人的天堂久久精品激情| 国产精品久久久久久影院| 日韩不卡免费视频| 天堂在线亚洲| 亚洲精品第一页不卡| 免费一级无码在线网站| 亚洲国产高清精品线久久| 亚洲va视频| 欧美在线伊人| аⅴ资源中文在线天堂| 97超碰精品成人国产| 在线不卡免费视频| 亚洲综合二区| 精品国产香蕉伊思人在线| 欧美日韩北条麻妃一区二区| 中文字幕无码电影| 性视频一区| 色香蕉影院| 一级毛片基地| 九色综合视频网| 4虎影视国产在线观看精品| 国产99免费视频| 国产视频你懂得| 无码专区在线观看| 国产精品不卡永久免费| 亚洲最猛黑人xxxx黑人猛交| 99er这里只有精品| AV在线天堂进入| 亚洲免费成人网| 毛片一级在线| 国产精品美女免费视频大全| 国产拍在线| 97国内精品久久久久不卡| 97国产精品视频人人做人人爱| 91久久国产热精品免费|