999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于聲韻母分割的漢語語音識別方法

2014-11-10 15:52:38鐘明輝
科技創新導報 2014年18期

鐘明輝

摘 要:漢語語音識別研究中,識別單元的選取是很重要的。該文提出一種基于聲韻母分割的,以韻母為基本識別單元的大詞匯量孤立詞的語音識別方法,并與以漢語詞為基本識別單元的語音識別方法進行比較識別實驗。結果表明,基于韻母為基本識別單元的語音識別性能優于以漢語詞為基本識別單元的語音識別方法。

關鍵詞:識別單元 聲韻母分割 大詞匯量 漢語詞

中圖分類號:TN912.34 文獻標識碼:A 文章編號:1674-098X(2014)06(c)-0249-01

語音識別是近年來十分活躍的一個研究領域。在不遠的將來,語音識別技術有可能作為一種重要的人機交互手段,輔助甚至取代傳統的鍵盤、鼠標等輸入設備,在個人計算機上進行文字錄入和操作控制。按可識別詞匯的多少分,語音識別可分為小詞匯量語音識別和大詞匯量語音識別。兩種語音識別系統所采用的處理方法也不完全一樣。小詞匯量語音識別基本都是以漢語詞為基本識別單元,而大詞匯量語音識別則多以音素為基本識別單元。該文中,我們主要的研究對象是大詞匯量漢語語音識別問題。所以,這里的音素是指漢語的音素,它與英語的音素有比較大的區別。因此,在漢語音素分割處理方面也有不同于通常對英語音素的處理方法。該文介紹了一種基于漢語聲韻母分割的,以韻母為識別單元的語音識別方法。

1 漢語語音的聲韻母分割

漢語普通話是以字為單位的。從聲學角度看,漢語中一個字就對應一個音節。因此,音節是漢語語音識別中最自然的識別單位。目前,漢語語音識別逐漸向大詞匯量連續語音識別的方向發展,音節作為識別單元已經慢慢被取代。這是因為當詞匯量增大時,不可能要求在進行語音數據訓練中每個音節重復出現很多次,以得到可靠的結果,那么如何合理地選取語音識別單元,并建立相應的聲學模型,是漢語語音識別的關鍵。因此,必須選取比音節更小的單元(音素)作為訓練和識別的基本語音識別單元。

1.1 漢語音節的結構

按照我國傳統音素分類方法,漢語的一個字節可以看成是由聲母和韻母拼合而成,即聲—韻母結構是漢語音節結構的顯著特點。該結構構成使得漢語音節的聲學單元組合具有一定的規律性,在這種結構中漢語音節的過渡音體現了音節的一種過渡性質。即在過渡階段的起始段保留了較多的聲母特性而韻母特性較少;在過渡音末段則保留的聲母特性較少而包含較多的韻母特性。其中,核心目標值是絕大多數音節的核心部分,具有典型的頻譜模式。也即本文提出的基于聲韻母分割的以韻母為識別單元的識別方法的理論依據。因此,將音節劃分成聲韻母音素作為識別單元是符合漢語特點的。

1.2 漢語的波形特征

漢語的每一個字都是一個單音節字。每個單音節又都是由聲母和韻母拼音而成。每個韻母又由若干個音節組成有多種聲調。因此共組成1200多個有調音節。從漢語的波形特征上看,聲母部分的變化很快,周期特性不明顯;到了過渡音段,逐漸呈現出周期性,而到了韻母部分,周期特性非常明顯,波形顯得穩定而有規律;最后能量逐漸減少,但依然保持周期性的特征。因此,任何一個漢語音節(零聲母除外),其波形運動周期性呈現無序-基本有規律-有規律。所以只要檢測到語音信號波形的變化,才能夠很好地進行聲韻母的分割了。

2 實驗

本實驗主要是驗證基于聲韻母分割的,以韻母為識別單元的方法對于漢語語音識別的識別率和識別速度的有效性,作者進行了特定人及非特定人的語音識別實驗,并與以漢語詞為基本識別單位的語音識別模型進行比較識別實驗。

2.1 實驗用語音庫

實驗采用了兩組數字語音庫。(1)特定人的漢語數字(0~9)語音識別時,每個數字100次發音(共1000個樣本),其中30次發音(共300個樣本)用作訓練集,另外70次發音(共700個樣本)用作測試集;(2)非特定人的漢語數字(0~9)語音識別時,共10人,5男5女,每人每個數字10次發音(共1000個樣本),其中每人每個數字3次發音(共300個樣本)用作訓練集,另外7次發音(共700個樣本)用作測試集。

2.2 實驗條件

該實驗在實驗室環境下完成,采用Cool Edit軟件錄音,數據采樣率為16000 Hz,量化精度為16 bits,幀長取32 ms(512點),幀移16 ms,本文將在此環境下得到的語音視為純凈語音。本實驗是在基于連續HMM的孤立詞語音識別系統上完成。經實驗比較,確定HMM的最佳狀態數為4,最佳混合度為3(12階MFCC+12階△MFCC,△表示一階差分)訓練模型。

2.3 實驗結果

見表1。

3 結語

該文提出了基于聲韻母切割的漢語語音識別方法,對該識別單元在特定人和非特定人在漢語語音識別中的應用進行了實驗分析,并與傳統的漢字詞為識別單元的語音識別方法進行了比較。結果表明,本文提出的基于聲韻母切割的以韻母為識別單元的識別方法,盡管與傳統的基于漢字詞為識別單元的識別率差不多,但是,這種基于音素的識別方法能使識別基元大大減少,從而使運算量和貯存量減少,而訓練數據量卻能相對增多,使得識別速度得到了大大的提高。因此,這種方法應用于大詞匯量的漢語語音識別時,優于以漢語詞為識別單元的語音識別方法。

參考文獻

[1] 何強,何英.MATLAB擴展編程[M].北京:清華大學出版社,2002.

[2] 張靜亞.基于CHMM的高性能連續數字語音識別算法[J].常熟理工學院學報,2005(3).

[3] 何新,王曉蘭.漢語語音識別中的一種音節分割方法[J].火力與指揮控制,2004(12).

[4] 王寧,萬旺根.漢語語音音素分割的一種新方法[J].上海大學學報(自然科學版),2002(4).endprint

主站蜘蛛池模板: 8090成人午夜精品| 国产免费久久精品99re不卡| 国产在线观看91精品| 国产免费久久精品44| 国产另类乱子伦精品免费女| 免费人成视频在线观看网站| 无码视频国产精品一区二区 | av一区二区三区高清久久| 91青青草视频| 潮喷在线无码白浆| 手机精品福利在线观看| 日韩av资源在线| 国内精品视频在线| 九色在线视频导航91| 日韩经典精品无码一区二区| 日日拍夜夜操| 97久久超碰极品视觉盛宴| 亚洲欧美成aⅴ人在线观看| 夜夜拍夜夜爽| 亚洲欧美天堂网| 亚洲人成网18禁| 四虎成人免费毛片| 波多野结衣视频网站| 成人年鲁鲁在线观看视频| 色香蕉网站| 国产女人18毛片水真多1| 欧美全免费aaaaaa特黄在线| 久热精品免费| 欧美日韩中文字幕在线| 欧美三级视频网站| 无码一区18禁| 99精品热视频这里只有精品7 | 国产在线观看91精品亚瑟| 午夜不卡视频| 亚洲国产高清精品线久久| 国产精品偷伦视频免费观看国产 | 九九热视频精品在线| 国产h视频免费观看| 欧美精品v| P尤物久久99国产综合精品| 国产91丝袜在线播放动漫| 精品1区2区3区| 亚洲国产精品无码AV| 国产又爽又黄无遮挡免费观看| 真实国产乱子伦视频| 日韩av无码DVD| 999精品免费视频| 欧美一级爱操视频| 中文无码伦av中文字幕| 9啪在线视频| 成人小视频在线观看免费| 国产精品微拍| 久久国产毛片| 日韩高清欧美| 国产欧美另类| AV不卡无码免费一区二区三区| 国产又黄又硬又粗| 国产永久在线观看| 国产精品第| 69综合网| AV无码国产在线看岛国岛| 国产呦精品一区二区三区下载| 青青青草国产| 中文字幕首页系列人妻| 欧美一区二区丝袜高跟鞋| 无码日韩视频| 欧美成人国产| 国产欧美视频在线| 亚洲男人天堂2020| 国产精品99一区不卡| 国产精品大白天新婚身材| 在线观看视频99| 黄色网站在线观看无码| 亚洲色图欧美在线| 国产91在线|日本| 国产成人精品高清在线| 秋霞午夜国产精品成人片| 亚洲一区二区约美女探花| 自偷自拍三级全三级视频| 天天综合色网| 国产成人1024精品| 国产精品第一区|