999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

語音識別與HMM原理

2017-05-16 00:44:13周正堅
成長·讀寫月刊 2017年4期
關鍵詞:語言模型

周正堅

【摘 要】本文利用“隱含馬爾可夫模型”(Hidden Markov Model)根據接收到的數字信號來推測說話者想表達的意思來研究語音識別問題。

【關鍵詞】語言識別;隱含馬爾可夫模型

一、語言的實質

人們平時在說話時,腦子是一個信息源;人們的喉嚨(聲帶),空氣,就是如電線和光纜般的信道;聽眾耳朵的就是接收端(信宿),而聽到的聲音就是傳送過來的信號;語言在這一過程中充當信息載體的角色,即消息。這就是人類通過語言交流的實質。

二、語音識別

語音識別是指從語音到文本的轉換,即讓計算機能夠把人發出的有意義的話音變成書面子語言。通俗地說就是讓機器能夠聽懂人說的話。所謂聽懂,有兩層意思,一是指把用戶所說的話逐詞逐句轉換成文本;二是指正確理解語音中所包含的要求,作出正確的應答。

三、HMM原理

隱馬爾可夫模型(HMM)可以用五個元素來描述,包括2個狀態集合和3個概率矩陣:

1.隱含狀態S

是馬爾可夫模型中實際所隱含的狀態,這些狀態之間滿足馬爾可夫性質。這些狀態通常無法通過直接觀測而得到。

2.可觀測狀態O

在模型中與隱含狀態相關聯,可通過直接觀測而得到,可觀測狀態的數目不一定要和隱含狀態的數目一致。

3.初始狀態概率矩陣π

表示隱含狀態在初始時刻t=1的概率矩陣,(例如t=1時,P(S1)=p1、P(S2)=P2、P(S3)=p3,則初始狀態概率矩陣 π=[p1 p2 p3].

4.隱含狀態轉移概率矩陣A。

描述了HMM模型中各個狀態之間的轉移概率。其中Aij = P( Sj | Si ),1≤i,,j≤N.

表示在 t 時刻、狀態為 Si 的條件下,在 t+1 時刻狀態是 Sj 的概率。

5.觀測狀態轉移概率矩陣 B

令N代表隱含狀態數目,M代表可觀測狀態數目,則:

Bij=P(Oi | Sj), 1≤i≤M,1≤j≤N.

表示在 t 時刻、隱含狀態是 Sj 條件下,觀察狀態為Oi的概率。

總結:一般的,可以用λ=(A,B,π)三元組來簡潔的表示一個隱馬爾可夫模型。隱馬爾可夫模型實際上是標準馬爾可夫模型的擴展,添加了可觀測狀態集合和這些狀態與隱含狀態之間的概率關系。

當人們觀測到語音信號o1,o2,o3時,要根據這組信號推測出發送的句子s1,s2,s3。顯然,人們應該在所有可能的句子中找最有可能性的一個。用數學語言來描述,就是在已知o1,o2,o3,...的情況下,求使得條件概率:

P(s1,s2,s3,...|o1,o2,o3....)達到最大值的那個句子s1,s2,s3,...。例如,當人們聽見(ni shi shui a),按經驗、語言環境就能判斷出對方所說的是“你是誰啊”的概率最大,而不是其他的句子。

四、HMM基本步驟

對HMM來說,有如下三個重要假設,盡管這些假設是不現實的。

假設1:馬爾可夫假設(狀態構成一階馬爾可夫鏈)

P(Xi | Xi-1…X1)=P(Xi | Xi-1)

假設2:不動性假設(狀態與具體時間無關)

P(Xi+1 | Xi)=P(Xj+1 | Xj),?坌i,j

假設3:輸出獨立性假設(輸出僅與當前狀態有關)

P(O1,…,OT | X1,…,XT)=?裝P(Ot | Xt)

隱藏的狀態和可觀察到的狀態之間有一種概率上的關系,也就是說某種隱藏狀態H被認為是某個可以觀察的狀態O1是有概率的,假設為 P(O1 | H)。如果可以觀察的狀態有3種,那么很顯然 P(O1 | H)+P(O2 | H)+ P(O3 | H)=1。

這樣,我們也可以得到一個另一個矩陣,稱為混淆矩陣 (confusion matrix)。這個矩陣的內容是某個隱藏的狀態被分別觀察成幾種不同的可以觀察的狀態的概率。

下圖明確的表示出模型的演化,其中綠色的圓圈表示隱藏狀態,紫色圓圈表示可觀察到狀態,箭頭表示狀態之間的依存概率,一個HMM可用一個5元組{N,M,π,A,B}表示,其中N表示隱藏狀態的數量,我們要么知道確切的值,要么猜測該值,M表示可觀測狀態的數量,可以通過訓練集獲得,π={πi}為初始狀態概率,A={aij}為隱藏狀態的轉移矩陣Pr(xt(i) | xt-1(j)),B={bik}表示某個時刻因隱藏狀態而可觀察的狀態的概率,即混淆矩陣,Pr(ot(i) | xt(j))。在狀態轉移矩陣和混淆矩陣中的每個概率都是時間無關的,即當系統演化時,這些矩陣并不隨時間改變。對于一個N和M固定的HMM來說,用λ={π,A,B}表示HMM參數。

在正常的馬爾可夫模型中,狀態對于觀察者來說是直接可見的。這樣狀態的轉換概率便是全部的參數。而在隱馬爾可夫模型中,狀態并不是直接可見的,但受狀態影響的某些變量則是可見的。每一個狀態在可能輸出的符號上都有一概率分布。因此輸出符號的序列能夠透露出狀態序列的一些信息。

五、向前向后算法

下面介紹前向后向算法的參數學習過程,在學習的過程中,不斷更新HMM的參數,從而使得P(O | λ)最大。我們假設初始的 HMM 參數為λ={π,A,B},首先計算前向變量?琢和后向變量 ?茁,再根據剛剛介紹的公式計算期望?孜和ζ,最后,根據下面的3個重估計公式更新HMM參數。

參考文獻:

[1]張建華.基于深度學習的語音識別應用研究[D].北京郵電大學,2015.

[2]周茉.基于HMM和ANN的漢語數字語音識別算法研究[D].華中師范大學,2006.

猜你喜歡
語言模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
語言是刀
文苑(2020年4期)2020-05-30 12:35:30
讓語言描寫搖曳多姿
多向度交往對語言磨蝕的補正之道
累積動態分析下的同聲傳譯語言壓縮
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
我有我語言
主站蜘蛛池模板: 日本午夜视频在线观看| 又爽又黄又无遮挡网站| 久久一本精品久久久ー99| 国产精品 欧美激情 在线播放| 日韩在线影院| 第一页亚洲| 欧美国产另类| 国内精品免费| 国产区福利小视频在线观看尤物| 香蕉国产精品视频| 黄色网站不卡无码| 久久国产黑丝袜视频| 久久永久精品免费视频| 国产美女久久久久不卡| 免费xxxxx在线观看网站| 999福利激情视频| 日韩高清中文字幕| a毛片在线播放| 久久国产成人精品国产成人亚洲 | 亚洲第一精品福利| www.狠狠| 91久久精品日日躁夜夜躁欧美| 激情六月丁香婷婷| 欧美色亚洲| 成人日韩视频| 国内精品一区二区在线观看| 四虎成人精品| 毛片免费在线视频| 欧美成人手机在线视频| 中文字幕日韩欧美| 91视频区| 亚洲熟女偷拍| 国产人妖视频一区在线观看| 熟妇人妻无乱码中文字幕真矢织江 | 国产美女无遮挡免费视频| 亚洲水蜜桃久久综合网站 | 中文字幕在线播放不卡| 国产真实乱了在线播放| 嫩草国产在线| 免费 国产 无码久久久| 亚洲一级毛片| 国产本道久久一区二区三区| 国产精品999在线| 亚洲国产成人精品青青草原| 亚洲狼网站狼狼鲁亚洲下载| 亚洲人成网站色7799在线播放| 97在线国产视频| 久久网欧美| 欧美日韩中文国产va另类| 欧美日韩福利| 欧美日韩北条麻妃一区二区| 无码精品国产VA在线观看DVD| 国产精品开放后亚洲| 全午夜免费一级毛片| 国产美女无遮挡免费视频| 久久96热在精品国产高清| 国产在线麻豆波多野结衣| 欧美精品二区| 国产无码精品在线| 日韩精品一区二区三区免费| 日本国产一区在线观看| 51国产偷自视频区视频手机观看 | 亚洲欧洲日产国产无码AV| 亚洲欧美精品一中文字幕| 日韩精品无码免费专网站| 99久视频| 国产视频入口| 97se亚洲综合在线韩国专区福利| 日日噜噜夜夜狠狠视频| 天天色天天综合网| 在线欧美日韩国产| 91福利在线观看视频| 国产成人综合在线观看| 97成人在线视频| 欧美精品xx| 久久99热这里只有精品免费看 | 欧美综合激情| 狠狠综合久久久久综| 在线观看免费人成视频色快速| 亚洲美女操| 色综合天天视频在线观看| 熟妇丰满人妻|