999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于DFT的嵌入式普通話語(yǔ)音快速識(shí)別

2017-07-05 13:27:15梁向東
實(shí)驗(yàn)室研究與探索 2017年6期
關(guān)鍵詞:信號(hào)

鄧 力, 梁向東

(桂林理工大學(xué) 南寧分校,南寧 530001)

基于DFT的嵌入式普通話語(yǔ)音快速識(shí)別

鄧 力, 梁向東

(桂林理工大學(xué) 南寧分校,南寧 530001)

基于選定的頻率普通話發(fā)音識(shí)別技術(shù),由定義的輸入普通話語(yǔ)音拾取的普通話語(yǔ)音識(shí)別腔共振曲線,通過(guò)對(duì)中文分詞、韻母聲母頻譜識(shí)別,對(duì)中文語(yǔ)音的聲母、韻母、聲調(diào)集成、輸出的中文拼音詞序列組合,形成句子的中文拼音序列。通過(guò)韻母分析方法進(jìn)行單音節(jié),頻域幅頻特性分析技術(shù),不需要學(xué)習(xí)或培訓(xùn)事先要用于一個(gè)特定的人的聲音,能夠識(shí)別非特定的單詞和句子的普通話語(yǔ)音,采用速率自適應(yīng)梳狀(Discrete Fourier Transform,DFT)譜分析算法,只需極少量的計(jì)算,就能夠確定地包含4個(gè)聲調(diào)的普通話,具有響應(yīng)速度快,所需存儲(chǔ)空間小,能方便的移植到嵌入式設(shè)備的應(yīng)用程序中。

語(yǔ)音識(shí)別; 頻譜分析; DFT算法

0 引 言

當(dāng)前語(yǔ)音識(shí)別的主要有基于語(yǔ)音知識(shí)和聲道模型、基于模板匹配和人工神經(jīng)網(wǎng)絡(luò)3種方法[1]。

(1) 基于語(yǔ)音知識(shí)和聲道模型方法。語(yǔ)言是有限數(shù)量的不同語(yǔ)言基元,并可以通過(guò)它們的聲音信號(hào)在頻率域和時(shí)間域的特征來(lái)區(qū)分工作。此方法分為兩個(gè)階段: ① 取時(shí)間為縱軸,對(duì)語(yǔ)音進(jìn)行離散處理,得到不同的語(yǔ)音段,每個(gè)語(yǔ)音段信號(hào)其聲學(xué)特性對(duì)應(yīng)于一個(gè)或多個(gè)語(yǔ)音,每個(gè)語(yǔ)音的信號(hào)的聲學(xué)特性都會(huì)有其對(duì)應(yīng)的信號(hào)標(biāo)簽[2]。② 將前面通過(guò)語(yǔ)音離散得到的每個(gè)時(shí)間段的信號(hào)標(biāo)簽轉(zhuǎn)換成對(duì)應(yīng)的語(yǔ)音信號(hào)基礎(chǔ)網(wǎng)格[3]。

(2) 基于人工神經(jīng)網(wǎng)絡(luò)方法。人工神經(jīng)網(wǎng)絡(luò)是自適應(yīng)非線性動(dòng)態(tài)系統(tǒng),人工神經(jīng)網(wǎng)絡(luò)通過(guò)模擬人的神經(jīng)活動(dòng)[4],可實(shí)現(xiàn)語(yǔ)音識(shí)別,但系統(tǒng)訓(xùn)練所需時(shí)間較長(zhǎng),而且也不能很好地描述語(yǔ)音信號(hào)的時(shí)間動(dòng)態(tài)[5],當(dāng)前該技術(shù)還未進(jìn)入應(yīng)用階段。

(3) 模板匹配方法成熟,現(xiàn)已達(dá)到實(shí)用階段[6]。模板匹配有以下步驟:特征提取、 模板培訓(xùn)、 模板分類、 判斷[7]。常用的有動(dòng)態(tài)時(shí)間規(guī)整 (DTW)、 隱馬爾可夫 (HMM) 理論、 矢量量化(VQ)技術(shù)[8]。

在實(shí)際的應(yīng)用過(guò)程中,目前幾乎所有成功的語(yǔ)音識(shí)別方法都是基于統(tǒng)計(jì)的、概率的或信息理論的方法。但是這些識(shí)別方法需要的計(jì)算復(fù)雜,數(shù)據(jù)庫(kù)龐大,對(duì)系統(tǒng)硬件的要求高,難以在便攜式設(shè)備上使用。

針對(duì)現(xiàn)有技術(shù)的不足,本文的普通話語(yǔ)音識(shí)別方法根據(jù)音頻特點(diǎn)并結(jié)合時(shí)域頻譜特征[9-10],可以判斷普通話發(fā)音的聲母、韻母、聲調(diào),聲母、韻母經(jīng)算法組合后輸出對(duì)應(yīng)的中文拼音,從而實(shí)現(xiàn)語(yǔ)音識(shí)別。

本文提出的普通話語(yǔ)音識(shí)別技術(shù),能提供一種不需要在使用前對(duì)特定人聲進(jìn)行學(xué)習(xí),能識(shí)別出非特定人的普通話語(yǔ)音單字和句子的普通話語(yǔ)音識(shí)別方法。該方法運(yùn)算量小,識(shí)別速度快,對(duì)硬件要求較低,適用于嵌入式系統(tǒng)。

1 語(yǔ)音識(shí)別的方法

1.1 輸入的語(yǔ)音信號(hào)預(yù)處理

過(guò)AD轉(zhuǎn)換使輸入的語(yǔ)音成為對(duì)應(yīng)的數(shù)字語(yǔ)音信號(hào),然后對(duì)轉(zhuǎn)換得到的數(shù)字語(yǔ)音信號(hào)序列音節(jié)界定[11]。

(1) 普通話語(yǔ)音輸入后通過(guò)AD轉(zhuǎn)換生成數(shù)字語(yǔ)音信號(hào)序列,對(duì)語(yǔ)音信號(hào)預(yù)加重,提升高頻部份,其系統(tǒng)傳輸公式為:

設(shè)s(n)為輸入的語(yǔ)音信號(hào),對(duì)信號(hào)預(yù)加重后所得的信號(hào)為:

(2) 對(duì)預(yù)加重后得到的信號(hào)加漢明窗。利用語(yǔ)音信號(hào)具有短時(shí)平穩(wěn)特性的特征[12],將截取的一段語(yǔ)音信號(hào)進(jìn)行分幀[13],通過(guò)將窗函數(shù)加入語(yǔ)音信號(hào)來(lái)實(shí)現(xiàn),

w(n)=

(3) 對(duì)語(yǔ)音信號(hào)進(jìn)行離散傅里葉變換[14]。DFT(Discrete Fourier Transform)獲得語(yǔ)音信號(hào)的離散傅立葉變換為:

其中:X(n)為輸入的語(yǔ)音信號(hào);N表示DFT的點(diǎn)數(shù)。

(4) 將信號(hào)能量譜通過(guò)一組三角形濾波器組[15]。定義一個(gè)有M個(gè)濾波器的濾波器組,采用的濾波器為三角濾波器,中心頻率為f(m),m=1,2,…M。

三角濾波器的頻率響應(yīng)定義為:

Hm(k)=

(5) 對(duì)每個(gè)濾波器組輸出的能量累加后取對(duì)數(shù):

(6) 經(jīng)離散余弦變換(DCT)得到MFCC系數(shù):

MFCC系數(shù)階數(shù)取12。

1.2 音節(jié)界定

音節(jié)是聽覺的基本單元,普通話每個(gè)音節(jié)的共性是可分為聲母、 韻母、 聲調(diào)3個(gè)部分。將普通話交談信號(hào)每個(gè)音節(jié)的停頓或突變作為提供音節(jié)定義的條件,同時(shí)還需將當(dāng)前背景噪聲或無(wú)聲音信號(hào)分離,通過(guò)信號(hào)強(qiáng)度和時(shí)間的周期趨勢(shì)來(lái)確定音節(jié)信息。

音節(jié)定義方法。將第1次提取到的語(yǔ)音數(shù)字信號(hào)中無(wú)周期性的信號(hào)和背景噪聲分離,序列中使用固有的音節(jié)停頓或突變、明確開始和結(jié)束每1個(gè)音節(jié)來(lái)獲取語(yǔ)序的數(shù)字語(yǔ)音信號(hào)。

算法所用參數(shù)的定義。對(duì)數(shù)字語(yǔ)音信號(hào)序列的標(biāo)定出這個(gè)詞的數(shù)字語(yǔ)音信號(hào)序列頻率穩(wěn)定階段的開始和結(jié)束。對(duì)基波穩(wěn)定階段的波型周期定義,以相鄰波峰為1個(gè)周期,計(jì)算出基本頻率、 周期和標(biāo)定出這個(gè)詞的數(shù)字語(yǔ)音信號(hào)序列的前端信息段。前端信息段,指數(shù)字語(yǔ)音信號(hào)序列的開頭部分至穩(wěn)定部份之間的信號(hào)波形。

(1) 聲調(diào)識(shí)別。根據(jù)詞的序列變化標(biāo)識(shí)基本頻率的音調(diào)、音節(jié),聲調(diào)識(shí)別方法設(shè)計(jì)的描述的步驟:

如果語(yǔ)音信號(hào)序列周期的基本頻率的信號(hào)在周期中保持穩(wěn)定,基調(diào)的第一聲;如果連續(xù)上升,第二聲;下降后再上升,第三聲;下降,第四聲。

(2) 聲母識(shí)別 (見圖1)。對(duì)發(fā)音的數(shù)字語(yǔ)音信號(hào)序列的時(shí)域動(dòng)態(tài)分析,根據(jù)分析瞬態(tài)響應(yīng)上升時(shí)間和超調(diào)量的大小參數(shù),識(shí)別聲母,按以下方法進(jìn)行聲母的識(shí)別:① 校準(zhǔn)發(fā)音聲腔數(shù)據(jù)段。在詞語(yǔ)數(shù)字語(yǔ)音信號(hào)序列的信息前段,通過(guò)校準(zhǔn)頻率穩(wěn)定階段的起始點(diǎn); 計(jì)算第1 B序列之間的0~7位數(shù)據(jù)位。② 將發(fā)音聲腔數(shù)據(jù)段的持續(xù)時(shí)間與系統(tǒng)設(shè)定的門閾值對(duì)比,將其分類為有氣聲或無(wú)氣聲,判斷為無(wú)氣,跳轉(zhuǎn)至③,當(dāng)判斷為有氣聲,跳轉(zhuǎn)至④;③ 根據(jù)前面部分的數(shù)字語(yǔ)音信號(hào)序列的字包絡(luò)線的瞬態(tài)響應(yīng)上升時(shí)間,識(shí)別聲母w、 m、 n、 r 或l,然后根據(jù)上升響應(yīng)時(shí)間,依數(shù)值大小,排列為m、 w、 n、 r、 l;④ 對(duì)該單字的語(yǔ)音數(shù)字信號(hào)序列的前端信息進(jìn)行檢波處理,計(jì)算上升時(shí)間和超級(jí)可調(diào)節(jié)量;將超級(jí)可調(diào)節(jié)音量大小和系統(tǒng)設(shè)定的門閾值對(duì)比,劃分為有爆鳴聲(超級(jí)可調(diào)節(jié)量大) 或無(wú)爆鳴聲(超級(jí)可調(diào)節(jié)量小):有爆鳴聲,跳轉(zhuǎn)至⑤;無(wú)爆鳴聲,跳轉(zhuǎn)至⑥;⑤ 由超級(jí)可調(diào)節(jié)量大小作為識(shí)為 p、 t、 g或 k的根據(jù); 超級(jí)可調(diào)節(jié)量大小排列序列為 p、 t、 k 和 g;⑥ 氣聲腔長(zhǎng)度。將聲音的氣聲腔長(zhǎng)度的區(qū)分短氣和長(zhǎng)氣聲腔兩種:當(dāng)我們判斷短氣聲腔,對(duì)包絡(luò)線的瞬態(tài)響應(yīng)上升時(shí)間和系統(tǒng)設(shè)定的門閾值對(duì)比,區(qū)分聲母為 b或 d;如上升時(shí)間數(shù)值為關(guān)鍵閾值標(biāo)準(zhǔn)參考值范圍內(nèi),加入超級(jí)可調(diào)節(jié)量輔助參與判斷。短上升時(shí)間/超級(jí)可調(diào)節(jié)量數(shù)值大于關(guān)鍵閾值標(biāo)準(zhǔn)考參值 的判斷是d;由氣聲腔長(zhǎng)度來(lái)識(shí)別聲母 f、 h、 z、 c、 s、 j、 q、x、zh、ch,氣聲腔長(zhǎng)度最大的是 f。同樣,由氣聲腔長(zhǎng)度臨界閾值時(shí)的上升時(shí)間用于判斷其他聲母。

圖1 聲母識(shí)別的方法及過(guò)程

(3) 韻母識(shí)別(見圖2)。用數(shù)字語(yǔ)音信號(hào)序列中的單詞前端信息段外其余信息段作為識(shí)別處理的信息源,由基頻數(shù)據(jù)分析出信息的頻率特性,在頻率特性變化周期的選定頻率的帶寬和矩形系數(shù)曲線對(duì)應(yīng)于為發(fā)音諧振腔的體積大小和張緊程度,然后收集統(tǒng)計(jì)信息的發(fā)音共振腔體積大小和張緊程度的統(tǒng)計(jì)數(shù)值進(jìn)行比對(duì),可以識(shí)別出韻母。

在測(cè)試中通過(guò)對(duì)數(shù)字語(yǔ)音信號(hào)序列分析發(fā)現(xiàn),韻母發(fā)音諧振腔的體積大小和張緊程度和相應(yīng)的頻率特性的數(shù)字語(yǔ)音信號(hào)序列的選定頻率的帶寬和矩形系數(shù)曲線存在相對(duì)簡(jiǎn)單的對(duì)應(yīng)關(guān)系:共振腔(口腔和咽部)體積大時(shí)對(duì)應(yīng)的數(shù)字語(yǔ)音信號(hào)序列的頻率特性帶寬大,諧振腔的肌肉更緊張,對(duì)應(yīng)的數(shù)字語(yǔ)音信號(hào)序列的頻率特征矩形系數(shù)較大。韻母的發(fā)音,如 a、o、e、共鳴腔的形狀和張力有顯著不同,所以根據(jù)系統(tǒng)中存儲(chǔ)共振頻率曲線,做出對(duì)應(yīng)的判斷。例如,窄帶寬(例如440 Hz),表明 u,或 ü,和收集統(tǒng)計(jì)的實(shí)際值比較,選擇最接近的就判斷是該韻母。

圖2 韻母識(shí)別的方法及過(guò)程

1.3 設(shè)計(jì)自適應(yīng) DFT 算法應(yīng)用于韻母識(shí)別方法

韻母識(shí)別采用離離散傅里葉變換來(lái)實(shí)現(xiàn):

(1) 對(duì)數(shù)字語(yǔ)音信號(hào)中的每個(gè)單詞序列中前端部分的聲音信息排除,對(duì)其余部分的數(shù)字序列中按周期T分為多段數(shù)據(jù),對(duì)每1周期T內(nèi)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)后自適應(yīng)動(dòng)態(tài)生成sin(2kπ/N)及cos(2kπ/N)k=0,1,2,…,N,N為自然數(shù);

(2) 對(duì)在前面分析所得的基本頻率進(jìn)行DFT計(jì)算,得出該聲音1~10次諧波幅值,對(duì)大于等于最大振幅的諧波-30 dB的所有諧波的頻率最高值來(lái)界定帶寬,其實(shí)現(xiàn)過(guò)程如下:

采樣率為44 KB/s,采樣1幀時(shí)長(zhǎng)T=20 ms,采樣所得數(shù)據(jù)為Dcn,n=0,1,…,879。提取轉(zhuǎn)換數(shù)據(jù)Dt(n)=D(44nT),n=0,1,…,63,進(jìn)行梳狀轉(zhuǎn)換。

奇點(diǎn)提取算法:

余弦提取算法:

對(duì)s(n)分奇偶點(diǎn):

奇點(diǎn)a(n)=s(2n+1) (n=0,1,…,7)

偶點(diǎn)a(n)=s(2n) (n=0,1,…,7)

余弦轉(zhuǎn)換:

正弦轉(zhuǎn)換:

交叉算法(余弦):

交叉算法(正弦):

確定帶寬:

(1) 大于或等于1 040 Hz的帶寬,初列為a;當(dāng)帶寬是小于或等于440 Hz,初列為i、 u,或 ü,同時(shí)跳轉(zhuǎn)至 (3);當(dāng)帶寬為440~1 040 Hz,初列為e或o同時(shí)跳轉(zhuǎn)至(2);

(2) 對(duì)高頻諧波進(jìn)行DFT分析,界定出1 000T、1 500T諧波幅度聲音,如果有1 000~1 500T諧波,該韻母被定義為e,T為語(yǔ)音數(shù)字序列周期;

(3) 對(duì)高頻諧波進(jìn)行DFT分析,如有3~3.5 kHz語(yǔ)音諧波,該韻母被定義為i。

(4) 對(duì)高頻諧波進(jìn)行DFT分析,如有1.7~2.5 kHz波段語(yǔ)音諧波計(jì)算,語(yǔ)音諧波,該韻母被定義為u,如果無(wú)此頻率的諧波,韻母被定義為 u。

(5) 以上確定的中文語(yǔ)音的聲母、韻母、音調(diào),輸出對(duì)應(yīng)字的中文拼音;

(6) 對(duì)從語(yǔ)音信號(hào)中識(shí)別的每個(gè)字的音頻序列進(jìn)行組合,得出其對(duì)應(yīng)的普通話拼音。

2 語(yǔ)音識(shí)別的實(shí)例

2.1 語(yǔ)音信號(hào)的AD轉(zhuǎn)換步驟和音節(jié)界定步驟

圖3是語(yǔ)音“跳”原始序列數(shù)字語(yǔ)音信號(hào)波形圖,該圖是由拾音器輸入,采用固定采樣速率(20、44 KB/s等)將聲音進(jìn)行AD轉(zhuǎn)換后生成的數(shù)字語(yǔ)音信號(hào)序列的“跳”波形圖。數(shù)字語(yǔ)音信號(hào)序列中的所有數(shù)據(jù)都表示每個(gè)采樣點(diǎn)大小的聲音級(jí)別,該信號(hào)為無(wú)周期性的信號(hào)和背景噪聲。

圖3 未經(jīng)任何處理的數(shù)字語(yǔ)音信號(hào)序列的“跳”波形圖

查看圖中“跳”其波形的聲平變化隨著時(shí)間的變化,看到波形可以分為清晰、周期趨勢(shì)信號(hào)中間及無(wú)明顯的周期性信號(hào)共三段。去除無(wú)周期性的信號(hào)和部分去除背景噪聲,就得到了字“跳”數(shù)字語(yǔ)音信號(hào)。

2.2 聲調(diào)、聲母、韻母識(shí)別

(1) 聲調(diào)識(shí)別。根據(jù)詞的數(shù)字語(yǔ)音信號(hào)序列周期變化的信號(hào)周期的基本頻率的變化特征識(shí)別出音節(jié)的聲調(diào):如果基本頻率保持穩(wěn)定,是第一聲;如果是連續(xù)的升高,是第二聲;如果頻率先低后高,是三聲;如果頻率降低,是第四聲。觀察頻率數(shù)據(jù)如圖3所示,該語(yǔ)序的數(shù)字語(yǔ)音信號(hào)基本頻率穩(wěn)定在173與119 Hz中,并保持繼續(xù)下降趨勢(shì)的變化,因此,可以確定為第四聲的聲調(diào)。

(2) 聲母識(shí)別。對(duì)數(shù)字語(yǔ)音信號(hào)序列的時(shí)域動(dòng)態(tài)分析,包括瞬態(tài)響應(yīng)上升時(shí)間和超調(diào)量的大小參數(shù),識(shí)別聲母。① 確定氣聲腔數(shù)據(jù)段。數(shù)字語(yǔ)音信號(hào)序列的前沿信息中0B,校準(zhǔn)的波形平穩(wěn)后的起始點(diǎn)(見圖4);② 測(cè)量聲音的聲音時(shí)間為60 ms,判斷為有氣聲,可以初步確定該聲母不是w、m、n、r或l。③ 對(duì)這個(gè)詞的數(shù)字語(yǔ)音信號(hào)序列的前端信息段0B進(jìn)行包絡(luò)檢波,測(cè)量出其上升時(shí)間23 ms,超級(jí)可調(diào)節(jié)量是17%,判斷有爆鳴聲,判斷該聲母不是b,d, f,h,z,c,s,j,q,x,和zh和ch或sh;④ 對(duì)前面的詞檢波處理,得出該詞信息的數(shù)字語(yǔ)音信號(hào)序列,測(cè)量上升時(shí)間和超調(diào)量,將超調(diào)量的大小由閾值分為爆鳴聲和無(wú)爆鳴聲:當(dāng)我們判斷爆鳴聲,跳轉(zhuǎn)至E);無(wú)爆鳴聲,跳轉(zhuǎn)至F);⑤ 由超調(diào)量大小來(lái)識(shí)別出聲母可能性依次為t、p、g或k;⑥ 氣聲腔長(zhǎng)度。將氣聲腔長(zhǎng)度區(qū)分為短氣聲腔和長(zhǎng)聲腔。

當(dāng)判斷為短氣聲腔,包絡(luò)線的瞬態(tài)響應(yīng)上升時(shí)間和經(jīng)驗(yàn)閾值相比,區(qū)分聲母b或d;結(jié)合數(shù)據(jù)的長(zhǎng)度確定聲母f、h、z、c、s、j、q,和x和zh,ch,和sh。再根據(jù)外部包絡(luò)解調(diào)處理的信息,聲音數(shù)據(jù)段的長(zhǎng)度顯示上升時(shí)間和超調(diào)數(shù)據(jù)量,其首字母應(yīng)該是t。

(3) 韻母識(shí)別方法。用單詞的數(shù)字語(yǔ)音信號(hào)序列中除了說(shuō)前端信息段外其余信息段作為識(shí)別處理的信息源。

圖4中分析了普通話單字“跳”的聲音信息周期發(fā)生期T頻率特性的變化(如帶寬和峰值點(diǎn)),在頻率特性的選定頻率的帶寬和矩形系數(shù)曲線對(duì)應(yīng)于聲母發(fā)音諧振腔的體積大小和和張力水平的數(shù)據(jù)庫(kù)值(韻母特征),然后找出韻母。① 從數(shù)字語(yǔ)音信號(hào)序列 0B 外截取后面順序編號(hào)的數(shù)據(jù)段的長(zhǎng)度 T中的其余部分的統(tǒng)計(jì)數(shù)據(jù)包含,在每個(gè)數(shù)字的n、自適應(yīng)動(dòng)態(tài)生成sin(2kπ/N)及cos(2kπ/N)k=0,1,2,…,N,N為自然數(shù);T為每個(gè)基波周期;k=0,1,2,…,N,N是一個(gè)自然數(shù)。② 使用自適應(yīng)梳狀DFT等效采樣率分析算法,計(jì)算聲音1~10的次諧波幅值,以最大諧波振幅的-30 dB為所有諧波的最高頻率定義帶寬:其帶寬大于或等于1 040 Hz的帶寬,初列為a;分析該段作為韻母識(shí)別處理的信息源的各周期變化時(shí)段的幅頻特性,在前述韻母a對(duì)應(yīng)時(shí)段的前后,另可觀察到還各包括一段帶寬符合條件區(qū)間,其帶寬分別為312和725 Hz。根據(jù)本文的技術(shù)方案,可初步界定帶寬為312 Hz時(shí)韻母為i、u、或ü,帶寬為725 Hz時(shí)韻母為e或o;進(jìn)而進(jìn)行高次諧波的DFT分析,分別對(duì)前者計(jì)算出3~3.5 kHz及1.7~2.5 kHz所對(duì)應(yīng)的語(yǔ)音諧波幅度、對(duì)后者計(jì)算出1.0~1.5 kHz的語(yǔ)音諧波幅度,根據(jù)計(jì)算結(jié)果可知:由于后者不存在1.0~1.5 kHz的諧波,因而確認(rèn)對(duì)應(yīng)韻母為o;由于前者存在3~3.5 kHz的諧波,因而確認(rèn)對(duì)應(yīng)韻母為i。

圖4 普通話單字“跳”的聲音電平隨時(shí)間變化的波形圖(已進(jìn)行周期界定)

2.3 拼音識(shí)別集成步驟

把聲母t,3個(gè)韻母i,a,o和聲調(diào)(第四聲)組合,輸出該字的中文拼音tiao(第四聲)。

3 結(jié) 語(yǔ)

此方法的普通話語(yǔ)音識(shí)別方法基于頻率域特性和時(shí)域特點(diǎn)相結(jié)合,可進(jìn)行單音節(jié)識(shí)別,算法簡(jiǎn)潔,計(jì)算量小,所需存儲(chǔ)單元少,可以在嵌入式設(shè)備應(yīng)用程序上使用。

[1] 劉宇紅, 劉 橋, 任 強(qiáng). 基于模糊聚類神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法[J]. 計(jì)算機(jī)學(xué)報(bào), 2006, 29(10): 1894-1900.

[2] 張 輝, 杜利民. 漢語(yǔ)連續(xù)語(yǔ)音識(shí)別中不同基元聲學(xué)模型的復(fù)合[J]. 電子與信息學(xué)報(bào), 2006, 28(11): 2045-2049.

[3] 唐 赟, 劉文舉, 徐 波. 基于后驗(yàn)概率解碼段模型的漢語(yǔ)語(yǔ)音數(shù)字串識(shí)別[J]. 計(jì)算機(jī)學(xué)報(bào), 2006, 29(4): 635-641.

[4] 朱恒軍,于泓博,王發(fā)智.小波分析和支持向量機(jī)相融合的語(yǔ)音端點(diǎn)檢測(cè)算法[J].計(jì)算機(jī)科學(xué),2012,39(6):244-246.

[5] 李如瑋,鮑長(zhǎng)春.一種基于分帶譜熵和譜能量的語(yǔ)音端點(diǎn)檢測(cè)算法[J].北京工業(yè)大學(xué)學(xué)報(bào),2007,33(9):920-924.

[6] 劉志偉,盧文科.孤立詞的語(yǔ)音識(shí)別[J].微計(jì)算機(jī)信息,2011,27(6):181-182.

[7] 劉長(zhǎng)明,任一峰,語(yǔ)音識(shí)別中DTW 特征匹配的改進(jìn)算法研究[J].中北大學(xué)學(xué)報(bào):自然科學(xué)版,2007,27(1):37-40.

[8] 趙 峰.遺傳神經(jīng)網(wǎng)絡(luò)在語(yǔ)音識(shí)別中的研究 [J]. 電腦知識(shí)與技術(shù),2008,3(4):774-776.

[9] 劉俊華,顏運(yùn)——荊琦.遺傳算法與神經(jīng)網(wǎng)絡(luò)在語(yǔ)音識(shí)別中的應(yīng)用 [J].機(jī)電工程,2007,24(12):20-24.

[10] 韓志艷,王 健, 倫淑嫻. 基于遺傳小波神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別分類器設(shè)計(jì) [J].計(jì)算機(jī)學(xué),2010,37(11):243-246.

[11] 嚴(yán)斌峰, 朱小燕, 張智江, 等. 基于鄰接空間的魯棒語(yǔ)音識(shí)別方法[J]. 軟件學(xué)報(bào), 2007, 18(11): 878-883.

[12] 劉宇紅, 劉 橋, 任 強(qiáng). 基于模糊聚類神經(jīng)網(wǎng)絡(luò)的語(yǔ)音識(shí)別方法[J]. 計(jì)算機(jī)學(xué)報(bào), 2006, 29(10): 1894-1900.

[13] 唐 赟, 劉文舉, 徐 波. 基于后驗(yàn)概率解碼段模型的漢語(yǔ)語(yǔ)音數(shù)字串識(shí)別[J]. 計(jì)算機(jī)學(xué)報(bào), 2006, 29(4): 635-641.

[14] 張 輝, 杜利民. 漢語(yǔ)連續(xù)語(yǔ)音識(shí)別中不同基元聲學(xué)模型的復(fù)合[J]. 電子與信息學(xué)報(bào), 2006, 28(11): 2045-2049.

[15] 劉耦耕, 賀素良, 龍永紅. 語(yǔ)音信號(hào)變速算法及其TMS320C5402 實(shí)時(shí)實(shí)現(xiàn)[J]. 中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2004, 35(1): 117-121.

Fast Recognition of Embedded Mandarin Speech Based on DFT

DENGLi,LIANGXiangdong

(Guilin University of Technology at Nanning, Nanning 530001, China)

Based on the Mandarin pronunciation recognition technology, by the frequency selected from Mandarin speech input cavity resonance curve defined by the pickup, the Chinese word, vowel and consonant Pinyin word sequence can be identified. Combination of Chinese speech consonants, vowels and tones forms Chinese Pinyin sentence sequence. By the syllable by syllable analysis method, the frequency domain analysis technique of amplitude frequency does not need to learn or train for a particular person's voice, words and sentences. The adaptive DFT (Discrete Fourier Transform) spectral analysis algorithm only occupies a very small amount of calculation. The method can determine the four tones of Mandarin, have fast response speed, small storage space, and can easilybe embedded to other devices.

speech recognition; spectrum analysis; DFT algorithm

2016-10-20

廣西科學(xué)研究與技術(shù)開發(fā)計(jì)劃項(xiàng)目(桂科攻12118017-10);2016年度廣西職業(yè)教育教學(xué)改革研究立項(xiàng)項(xiàng)目(重點(diǎn))(桂教職成〔2016〕26 號(hào));廣西高等學(xué)校優(yōu)秀中青年骨干培養(yǎng)工程第一期(桂教人[2013]16號(hào)

鄧 力(1971-),男,瑤族,廣西梧州人,碩士,教授,研究方向?yàn)榍度胧较到y(tǒng)、EDA技術(shù)。

Tel.:13367815798;E-mail:dldl021@163.com

TP 311

A

1006-7167(2017)06-0128-05

猜你喜歡
信號(hào)
信號(hào)
鴨綠江(2021年35期)2021-04-19 12:24:18
完形填空二則
7個(gè)信號(hào),警惕寶寶要感冒
媽媽寶寶(2019年10期)2019-10-26 02:45:34
孩子停止長(zhǎng)個(gè)的信號(hào)
《鐵道通信信號(hào)》訂閱單
基于FPGA的多功能信號(hào)發(fā)生器的設(shè)計(jì)
電子制作(2018年11期)2018-08-04 03:25:42
基于Arduino的聯(lián)鎖信號(hào)控制接口研究
《鐵道通信信號(hào)》訂閱單
基于LabVIEW的力加載信號(hào)采集與PID控制
Kisspeptin/GPR54信號(hào)通路促使性早熟形成的作用觀察
主站蜘蛛池模板: 亚洲天堂首页| 国产视频久久久久| 精品無碼一區在線觀看 | 亚洲男人在线天堂| 日韩色图区| 综合天天色| 中文字幕波多野不卡一区| 青青草91视频| 尤物国产在线| 国产AV无码专区亚洲A∨毛片| 97视频在线精品国自产拍| 亚洲男女在线| 国产美女自慰在线观看| 日韩av在线直播| 久操线在视频在线观看| 亚洲美女高潮久久久久久久| 91po国产在线精品免费观看| 99久久国产综合精品2023| 97人人模人人爽人人喊小说| 国产精品成人免费综合| 中国一级特黄大片在线观看| 最新亚洲人成网站在线观看| 亚洲国产精品日韩av专区| 无码在线激情片| 久久综合色天堂av| 国产传媒一区二区三区四区五区| 午夜三级在线| 国产一区二区免费播放| 亚洲综合色婷婷中文字幕| 香蕉精品在线| 亚洲视频免费在线看| 亚洲欧美不卡中文字幕| 四虎在线高清无码| 黄色网页在线观看| a级毛片在线免费| 亚洲国产中文综合专区在| 亚洲精品在线观看91| 性69交片免费看| 亚洲成a人片在线观看88| 久久网综合| 97超碰精品成人国产| 国产精品流白浆在线观看| 色九九视频| 国产精品va| 欧美精品色视频| 国产日韩欧美成人| 2022精品国偷自产免费观看| 美女扒开下面流白浆在线试听 | 激情午夜婷婷| 久久这里只有精品国产99| 天堂va亚洲va欧美va国产| 国产成熟女人性满足视频| 青青草一区| 国产女人在线视频| 国产网站免费看| 国产精品爆乳99久久| 国产69精品久久| 综合社区亚洲熟妇p| 久久久噜噜噜久久中文字幕色伊伊| 午夜国产大片免费观看| 69综合网| 亚洲人成人无码www| 久久久久亚洲AV成人人电影软件| 亚洲精品爱草草视频在线| 99青青青精品视频在线| 丁香六月激情综合| 玩两个丰满老熟女久久网| 无码日韩人妻精品久久蜜桃| 亚洲综合色吧| 久久综合国产乱子免费| 欧美在线一二区| a级毛片免费播放| 99精品伊人久久久大香线蕉| 国产国产人成免费视频77777| 国产流白浆视频| 色悠久久久久久久综合网伊人| 国产视频一区二区在线观看| 国产乱视频网站| 免费国产无遮挡又黄又爽| 国产香蕉一区二区在线网站| 黄色国产在线| 亚洲精品无码av中文字幕|