999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于GMM-HMM 的語音識別垃圾分類系統(tǒng)

2020-11-02 07:49:36鄧江云李晟
現(xiàn)代計算機 2020年26期
關鍵詞:信號模型

鄧江云,李晟

(江西理工大學理學院,贛州341000)

0 引言

近年來,隨著經(jīng)濟社會發(fā)展和物質消費水平大幅提高,我國垃圾產(chǎn)生量迅速增長,不僅造成資源浪費,也使環(huán)境隱患日益突出,現(xiàn)有的垃圾分類裝置主要為四色分類垃圾桶,現(xiàn)有的垃圾分類裝置存在只是簡單地通過文字標識提示了每種垃圾桶需要投放的垃圾大類。并不能直觀、細致地指示出具體垃圾種類的投放位置,導致垃圾分類推廣存在困難的問題。為解決該問題,本文設計并實現(xiàn)了一種基于語音識別的垃圾分類分裝置,通過投放者與裝置之間的語音交互,即投放者只需說出待投放的垃圾名稱,裝置便可以自動識別需要投放的垃圾類別,同時引導投放者將垃圾投放如正確的垃圾桶中。而隱馬爾科夫模型(Hidden Markov Model,HMM)提供了一種統(tǒng)計學模型,該模型對過程的狀態(tài)預測效果良好,適宜系統(tǒng)的短期狀態(tài)預測,因此可使用HMM 原理對字數(shù)較少的中文垃圾詞匯的識別模型進行建模。本設計先利用MFCC 對采集到的原始語音信號進行特征提取,再利用HMM 模型建立語音識別模型,其中利用混合高斯模型(Gaussian Mixture Model,GMM)擬合語音特征向量的概率密度分布函數(shù)。將提取的特征樣本分為訓練樣本集和測試樣本集,利用訓練樣本集訓練HMM 模型,利用測試樣本集測試訓練模型的識別準確率。最后通過一個實例驗證了設計的有效性。

1 語音識別基本理論

語音識別的目的是將聲音信號轉換為文本文字,也就是輸入一段語音信號,輸出對應的文本。一般的語音識別系統(tǒng)并不能直接識別原始的數(shù)字語音信號,需要先將語音信號的特征向量提取出來再進行識別。識別流程圖如圖1 所示。

圖1 語音識別系統(tǒng)流程

將語音數(shù)據(jù)庫中的原始語音數(shù)據(jù)進行預處理、特征提取后得到的特征向量作為訓練樣本進行無監(jiān)督學習,得到HMM 模型參數(shù),最后將模型參數(shù)帶入測試樣本,求解最大輸出概率,從而得到識別結果。

1.1 語音信號預處理

一般的原始數(shù)字語音信號往往包含各種噪聲,包括說話人唇齒碰撞的低頻噪聲,還有語音采樣裝置的電流毛刺,加上說話聲音的大小都會影響到語音信號識別結果,所以在進行特征提取之前按,我們需要先對語音信號進行一些預處理,預處理流程圖如圖2 所示。

圖2 預處理流程

預處理總共分為4 個步驟:中值濾波,歸一化,預加重,分幀與加窗。中值濾波的目的在于消除由于語音采樣電路本身性質引起的沖激信號、毛刺等噪聲。

其中x 表示語音數(shù)據(jù)向量,median 表示求括號中數(shù)據(jù)的中位數(shù)。

歸一化的目的是為了消除由于聲音振幅的大小對特征提取產(chǎn)生的影響,是音頻信號映射到同一區(qū)間[-1,1]。

為了消除聲音由唇與聲帶產(chǎn)生的低頻噪聲,將數(shù)字語音信號通過一個高通濾波器,這一步稱為預加重。高通濾波器的系統(tǒng)函數(shù)與時域表達式分別為:

研究表明[1],a 的取值范圍在0.93 到0.98 之間。

一般情況下,語音信號是在不斷變化的,為了簡化建模,假設語音信號是短時穩(wěn)定不變的。分幀處理的目的就是將數(shù)字語音信號分割為幀長為15~25 毫秒的幀,為了讓幀與幀之間平滑過渡,相鄰兩幀會有一個重疊部分,重疊部分稱為幀移。一般情況下,幀移為幀長的(0,0.5)倍長度之間[1]分幀信號如圖3 所示。

在經(jīng)過分幀處理后,每一幀的截斷處是不平滑的,不利于后續(xù)處理。解決辦法是使用窗函數(shù)對截斷處的不連續(xù)變化進行平滑,減少泄露,降低傅里葉變化后旁瓣強度,將能量集中在主瓣內。常用的窗函數(shù)以及對應基本指標如表1 所示。

圖3 語音信號分幀

表1 窗函數(shù)指標

處理語音信號一般采用邊界平滑下降的海明窗[2],海明窗函數(shù)W(n)表達式為:

加窗處理方式為:

1.2 語音信號特征提取

(1)MFCC 原理

根據(jù)人耳聽力對頻率的敏感度是非線性的,定義一種符合人耳聽覺敏感度的頻率:梅爾頻率Fmel:

人耳的耳蝸結構相當于一組MEL 濾波器組,其傳遞函數(shù)Hm(k)為:

f(m)表示第m 個三角濾波器的中心頻率。利用MATLAB 繪制梅爾濾波器組,如圖4 所示。

圖4 梅爾濾波器組

該圖體現(xiàn)了不同頻率信號通過梅爾濾波器組后的衰減程度(橫坐標代表頻率,縱坐標代表衰減系數(shù)),該濾波器組由24 個梅爾濾波器線性相加構成。

(2)特征提取流程

基于MFCC 的語音特征向量提取流程如圖5所示:

圖5 特征向量提取流程

由于梅爾濾波器是在頻域上處理語音信號,所以需要先通過(FFT)快速傅里葉變換將每一幀語音數(shù)據(jù)由時域信號轉換為頻域信號:

將轉換后的數(shù)據(jù)通過梅爾濾波器組Hm(k),即可得到語音特征向量Y。此時的特征向量已經(jīng)可以用于訓練與識別,但由于每一幀語音包含的采樣點數(shù)較多(一般為200 到1000 個左右),用于訓練或識別會大大提高運算量,降低系統(tǒng)的實時性。本文的解決方法是利用離散余弦變換(DCT)壓縮特征向量信息:

其中,m 為13 維向量[3]。考慮到實際語音信號是動態(tài)變化的,而每一幀語音是假設短時不變的,所以我們需要一個指標來表示語音的動態(tài)變化性質,一般通過計算每一幀特征向量m 的一階差分與二階差分來實現(xiàn)[4]:

2 基于GMM-HMM的語音識別模型

2.1 GMM-HMM模型原理

HMM 是比較經(jīng)典的機器學習模型,在自然語言處理,模式識別等領域都有著廣泛的用途,一般用于解決含有兩類數(shù)據(jù)(觀測序列,狀態(tài)序列)的問題,該模型由俄國科學家馬爾科夫提出[5],目的是解決統(tǒng)計過程中狀態(tài)和行為之間的“聯(lián)動性”,即某個行為的發(fā)生與不同狀態(tài)之間存在特定的概率關聯(lián)。

圖6 隱馬爾科夫模型

如圖6 所示,{1,2,3}為模型狀態(tài)序列,而{O1,O2,O3}為模型觀測序列。狀態(tài)之間可以相互進行轉換,其轉換結果由狀態(tài)轉移概率矩陣決定。而每一種狀態(tài)可以同時對應多種觀測值,其中離散的對應關系使用觀測概率矩陣表示,連續(xù)的對應關系則使用概率密度函數(shù)表示。HMM 的參數(shù)及其含義如表2 所示。

表2 隱馬爾可夫模型參數(shù)及其含義

混合高斯模型(Gaussian Mixture Model,GMM)是一種統(tǒng)計學模型[7],可以用來表示在總體分布中含有K個子分布的概率模型,表示了觀測數(shù)據(jù)在總體中的概率分布,由K 個子分布組成的混合分布,而每一個子分布都遵循高斯分布,理論上混合高斯分布可以用于擬合任意分布的樣本,因此本文使用GMM 擬合語音特征向量的分布情況,其概率密度函數(shù)為:

其中,μ為數(shù)據(jù)均值(期望)向量,Σ 為協(xié)方差矩陣,D 為數(shù)據(jù)維度。

前后向算法用于解決HMM 模型三大問題中的參數(shù)學習問題。求解前后向概率的公式為:

前向概率αt(j)表示在t 時刻,狀態(tài)為j 且觀測序列為{o1,o2…,ot-1,ot} 的概率。后向概率βt(i)表示在t時刻,狀態(tài)為j 的且從t+1 時刻到T 時刻的觀測序列為{ot+1,ot+2…,oT}的概率。其中aij表示狀態(tài)轉移概率矩陣,bj(t)表示觀測概率矩陣。

2.2 孤立詞識別算法

在基于HMM 建立的孤立詞模型當中,經(jīng)過MFCC提取出的特征向量序列為狀態(tài)序列,而文本信息為觀測值。由于在孤立詞的HMM 當中,一段語音信號僅僅對應了一個觀測值,所以求解最大概率并識別的方式為遍歷每個孤立詞模型,求解出概率最大的模型對應的詞匯,流程如圖7 所示。

圖7 孤立詞訓練與識別流程

本文采用了無監(jiān)督學習的方法進行模型的訓練。利用K 均值算法將每一個孤立詞分為4~6 種狀態(tài)[6],通過最大期望(Expectation-Maximum,EM)算法求狀態(tài)之間的轉移概率矩陣。狀態(tài)轉移概率矩陣與前后向概率向量之間的遞歸公式[7]為:

由于語音信號受情緒、環(huán)境影響較大,不同的人音調、音色也存在許多差異,導致同一個詞匯存在無數(shù)種與之相對應的語音波形。使用觀測概率矩陣B 來作為語音特征狀態(tài)與觀測值之間的對應關系是不切實際的,所以本文采用GMM 來擬合語音特征觀測向量的分布情況,使用多維混合高斯分布密度函數(shù)P(X|θ)來代替(4-5)中的bj(ot+1),其中X表示第(t+1)幀的語音特征向量,θ表示第狀態(tài)j 對應的GMM 參數(shù)。

利用遞歸與重估的方式訓練參數(shù)往往都需要一個指標來判斷是否完成訓練,本文采用最大輸出概率作為該指標。當連續(xù)兩次重估之后最大輸出概率之差小于10-6時,訓練完成。重估參數(shù)流程如圖8。

圖8 參數(shù)重估流程

維特比解碼是在給定一段觀測序列時,需要找到一條最佳路徑使得該路徑上的狀態(tài)序列轉移為改觀測序列時概率P*最大,P*即為最大輸出概率。在完成對HMM 模型訓練之后,使用維特比算法求解測試樣本相對于每一個孤立詞模型的最大輸出概率,比較得到概率最大的模型即可完成識別任務。

3 實例分析

現(xiàn)有的國家標準將垃圾分為四個大類,分別是可回收垃圾、廚余垃圾、有害垃圾、其他垃圾,本文對每一種類各選擇了3 個詞匯進行識別實驗。采用MATLAB完成對孤立詞語音模型的訓練和識別。

圖9

首先通過函數(shù)audioread 讀取出wav 文件當中的數(shù)據(jù),其調用方式為:

其中x 為數(shù)字音頻信號向量,fs 為采樣頻率,fname為文件名稱。由于人類發(fā)聲的頻率范圍一般在80Hz~3400Hz,由采樣定理可知采樣頻率應當為信號最高頻率的兩倍以上,所以這里fs 一般取8000Hz。提取出數(shù)據(jù)之后,采用自定義函數(shù)MFCC 對語音信號進行特征提取

輸出參數(shù)m 表示語音信號特征向量,原始語音信號波形以及對應特征向量波形如圖10。

圖10 語音波形

特征提取完成后,通過自定義函數(shù)tran 進行訓練,其調用方式為:

Samples 為元胞型數(shù)據(jù),包含了一個孤立詞所有訓練樣本的特征向量,而Hmm_mode 是一個存儲模型參數(shù)的結構體變量。訓練完成之后,使用自定義函數(shù)vit?erbi 求解測試樣本的特征向量對于每一個孤立詞模型當中的最大輸出概率:

輸出概率最大的模型對應的詞匯文本即為識別結果,如圖11 所示。

圖11 訓練過程

完成訓練之后,設計GUI 界面用于進行實驗驗證,如圖12 所示。通過“音頻選擇”按鈕選擇PC 上的音頻文件,點擊“開始識別”按鈕即可完成識別。

圖12 GUI界面

本次實驗共測試了10 個人的語音樣本,其中男生女生各5 人,測試結果(識別正確率)如表3 所示。

表3 語音識別結果統(tǒng)計表

實驗結果表明,總體識別正確率可以達到93.5%,說明本文設計的有效性和可行性。

4 結語

本文設計并實現(xiàn)了一種基于HMM 的語音識別垃圾分類系統(tǒng),該系統(tǒng)通過語音交互自動識別垃圾種類信息,并指導垃圾的分類投放。該系統(tǒng)采用統(tǒng)計學習方法中的HMM 模型對語音信號進行建模,相比于一般的機理建模,該方法可以通過不斷增加訓練樣本來提高識別率,識別不同的詞匯時也無需重新建模,只需更新訓練樣本即可,這在社會發(fā)展迅速,有關垃圾的新興詞匯不斷增加的背景下顯得尤為重要。經(jīng)過實驗驗證,本設計識別率高,可以為我國垃圾分類的智能化提供有效的技術支持。

猜你喜歡
信號模型
一半模型
信號
鴨綠江(2021年35期)2021-04-19 12:24:18
重要模型『一線三等角』
完形填空二則
重尾非線性自回歸模型自加權M-估計的漸近分布
孩子停止長個的信號
3D打印中的模型分割與打包
基于LabVIEW的力加載信號采集與PID控制
一種基于極大似然估計的信號盲抽取算法
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 亚洲男人在线天堂| 日韩精品一区二区深田咏美| 久久五月视频| 香蕉eeww99国产精选播放| 亚洲香蕉伊综合在人在线| 尤物特级无码毛片免费| аⅴ资源中文在线天堂| 美女免费精品高清毛片在线视| 欧美亚洲第一页| 毛片久久久| 日韩欧美国产三级| 99国产在线视频| 国产美女在线免费观看| 中文字幕亚洲乱码熟女1区2区| 天天躁夜夜躁狠狠躁躁88| 丁香婷婷在线视频| 欧美色99| 国产精品第一区在线观看| 亚洲最猛黑人xxxx黑人猛交| 久久精品国产91久久综合麻豆自制| 欧美日韩在线国产| 国产sm重味一区二区三区| 小蝌蚪亚洲精品国产| 少妇精品网站| 中文一级毛片| 波多野结衣一级毛片| 亚洲综合色区在线播放2019| 第一区免费在线观看| 99久久精品国产综合婷婷| 人妻一本久道久久综合久久鬼色| 日本免费a视频| 免费AV在线播放观看18禁强制 | 国产成人精品优优av| 国产精品污污在线观看网站| 91国语视频| 91无码视频在线观看| 欧洲亚洲一区| www.日韩三级| 亚洲欧美一区二区三区麻豆| 亚洲成人黄色在线| 精品人妻无码中字系列| 亚洲91在线精品| 精品91在线| 欧美一级在线播放| 露脸一二三区国语对白| 91国内在线观看| 欧美亚洲国产精品久久蜜芽| 高h视频在线| 欧美一区国产| 久久永久免费人妻精品| 99ri国产在线| 精品一区二区三区波多野结衣| 中日韩一区二区三区中文免费视频| 国产h视频在线观看视频| 国产理论精品| 国产成人精品亚洲77美色| 99久久亚洲精品影院| 永久免费无码成人网站| 成人国产精品视频频| 中文字幕亚洲第一| 日韩精品亚洲一区中文字幕| 国产极品粉嫩小泬免费看| 日韩亚洲综合在线| 午夜一级做a爰片久久毛片| 四虎成人精品在永久免费| 91在线国内在线播放老师| 国产激情第一页| 国产精品永久不卡免费视频 | 思思热在线视频精品| 国产成年无码AⅤ片在线 | 精品久久777| 亚洲无码37.| 国产99久久亚洲综合精品西瓜tv| 特级做a爰片毛片免费69| 99热这里只有精品免费| 免费三A级毛片视频| 国模视频一区二区| 欧美不卡在线视频| 99re经典视频在线| 亚洲人成高清| 国产特级毛片| 在线国产毛片手机小视频|