999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于卷積神經網絡的語音情感識別方法

2016-05-14 09:14:37邵兵杜鵬飛
科技創新導報 2016年6期

邵兵 杜鵬飛

摘 要:語音是人與人之間最直接、最自然的交互途徑,也是人機交互的重要方式。在人工智能領域,對語音的情感識別和理解至關重要,而一般的語音識別系統在實現語音轉文字時往往損失了很多的語音情感信息。該文介紹一種利用卷積神經網絡進行語音情感識別的方法。論文首先從心理學與人工智能的角度討論了情感計算的框架和語音情感識別的方法,然后介紹了語音的關鍵特征提取和歸一化問題,通過40組濾波器來提取每一幀音頻的數據,之后通過構建卷積神經網絡,對輸入的音頻特征進行逐層訓練,通過特征的逐層表達實現高層顯著特征的凸顯,最終產生語音情感分類的模型,最后通過一定的數據集,對分類模型進行驗證。

關鍵詞:卷積神經網絡 語音情感識別 語音特征提取 情感計算

中圖分類號:TN912.34;TP183 文獻標識碼:A 文章編號:1674-098X(2016)02(c)-0087-04

1 情感識別框架研究

創造具備自我認知和自我意識的強人工智能一直是人工智能研究人員的終極目標。從心理學的角度來講認知、意識和情感是緊密相連和相互作用的。(見圖1)

情感是智能的本源。研究情感計算對真正強人工智能的誕生,對人類認知、意識和高等生命體本質的研究起著重要作用。但是在人工智能最開始的研究階段,研究的重點主要是推理、語音識別、圖像分類等領域。雖然有科學家提出情感對人工智能的發展重要性,但是一直沒有引起足夠的認識。直到1995年MIT的Picard教授才正式提出情感計算概念,研究賦予機器像人一樣觀察、理解和生成各種情感特征的能力。情感計算主要研究如何將人的情感進行數字化和量化。主要方向包括情感識別和表示、情感的合成、情感系統的建模等。在情感識別方面主要又包括基于生理體征,例如心率信號、皮膚電信號、腦電信號等進行的識別和基于人體表征,例如表情圖片、語音進行的識別。近年來語音情感識別領域(SER, Speech Emotion Recognition)吸引了越來越多的人進行研究,而且目前大部分的自動語音識別(ASR,Automatic Speech Recognition)系統尚不能有效地識別語音的情感特性。這導致在語音與文本進行轉化時造成了很大一部分信息的流失,所以研究語音情感識別問題非常重要。

語音情感識別的關鍵技術包括:情感庫的建立、語音情感特征提取、特征降維與選擇、情感識別[1]。(見圖2)

該研究首先采用40組濾波器組對音頻轉化的頻域數據進行特征提取。對訓練的音頻數據進行分幀截取操作。然后采用卷積神經網絡,通過自稀疏編碼的方式對原始數據進行逐層的特征抽取,從初級層次特性至到產生高層次的有效特征。最后對提取的高層次有效特征采用SoftMax回歸分類器進行有效分類。

2 情感語音信號的特征抽取

2.1 語音情感特征概述

語音情感識別問題本質上是一個機器分類問題,對于機器分類問題,特征的選擇與提取非常重要,目前來說在語音情感識別領域有效特征大體分為如下幾類。

2.1.1 基于聲學的特性

包括語音的基頻特性、共振峰、短時能量、短時能量峰值和基頻倒譜以及梅爾倒譜等特性。

2.1.2 基于文本的特性

通過ASR系統進行文本轉化后,對提取的文本進行處理,提取有效詞頻特征信息。

2.1.3 基于聲學和語言學混合特性

結合音頻的聲學特性和文本特性進行綜合識別。

2.2 音頻特征提取的主要方法

語音信號處理領域通過對原始的頻譜特征進行變換產生的波形非常多。過去雖然對原始頻譜進行變換丟失了不少的語音數據信息,但是產生的多種變換特征促進了語音識別和語音情感分類系統的識別率提升。比較典型的除了短時平均幅值、短時最大幅值、共振峰、基頻等,被應用最多的為梅爾頻率倒譜系統(MFCC)特征。梅爾頻率倒譜系數將人耳的聽覺感知特性和語音信號的產生機制有機結合,其通過對頻譜能量譜用三角濾波變換后得到濾波器組,然后取對數,最后進行反離散余弦得到MFCC,在語音情感分類領域利用39維的MFCC系數取得了一定的突破,但是MFCC丟失了很多原始信息,而利用卷積神經網絡進行學習時越原始的數據帶來越好的效果。原始頻域不僅保留更多的信息,而且可以使用卷積和池化(pooling)操作表達處理語音多變性。這里根據Sainath等人[2]提出的通過學習定義在能量譜上的濾波器數組參數作為輸入特征。(見圖3)

(1)具體處理過程如下:

(2)首先讀取音頻時域數據和采樣率。

(3)對時域數據進行分幀處理。

(4)對分幀數據加漢明窗。

(5)進行傅立葉變換轉化為頻域數據。

(6)利用濾波器組進行變換每一幀得到40組梅爾濾波器組特征。

(7)進行歸一化操作。

(8)對音頻進行裁剪,裁剪的音頻幀數為40。

3 使用卷積神經網絡進行音頻情感分類

3.1 卷積神經網絡

人工神經網絡提出于20世紀80年代,由單層感知機逐步發展為多層感知機,它從信息處理角度對人腦的神經元進行抽象。大量的節點之間相互連接,每個節點都有特定的激勵函數。在早期發展階段,由于梯度爆炸問題和計算能力有限,神經網絡的發展一直停滯。2006年Hinton提出了深度置信網絡(Deep Belief Network,DBN)的深度產生模式[3]。使用這種算法可以更好地初始化DNN的訓練,從而開啟了深度學習發展的新篇章。

卷積神經網絡(Convolution Neural Network)為深度學習在目標識別和分類領域的較早應用。近年GPU計算能力增加和海量業務數據的出現,使得大規模的CNN在機器視覺和語音分類等領域得到了廣泛應用。

卷積神經網絡本質是一種前饋神經網絡,卷積神經網絡有3種結構上的特征:局部連接、權重共享以及空間或時間上的次采樣。卷積神經網絡的層與層之間采用局部連接,減少了計算量。

卷積神經網絡的層與層之間的連接權值是共享的,比如圖4中的m層與m-1層,每個m層神經元與3個m-1層的神經元進行連接,這個3個連接的權值是一樣的。實際應用中,可以通過設置多種不同的濾波器來提取不同的濾波參數,從而實現提取不同的目標特征。例如對于圖像而言,就是提取不同的圖像邊緣。在卷積神經網絡中隱藏層的參數個數和隱藏層的神經元個數無關,只和濾波器大小和濾波器的種類有關系。

卷積神經網絡除了局部連接和權值共享的特性,糾正線性單元(ReLU,Rectified Linear Units)激活函數也保證了實際訓練中的單邊抑值和稀疏特性,同時為了保證泛化特性,采用L2/L1正則化范數作為激活偏置。

3.2 具體實現

(1)輸入層:輸入按幀數進行裁剪的音頻40×40。

(2)卷積層1:濾波器大小為3×3,共有20個濾波器,得到20個大小為36×36的特征映射。

(3)池化層1:卷積層1后面跟著子采樣層。子采樣層的目的是減少特征映射的神經元個數。通過池化操作,可以大大降低特征的維數,避免過擬合。最大子采樣函數的定義為:

(1)

該層采用最大子采樣方法,由特征映射中2×2的領域點采樣為1個點,也就是4個數中最大的。最終的特征映射數目為18×18。

(4)卷積層2:濾波器大小為3×3,采用40組濾波,最終特征映射的數目為16×16。神經元的個數共有40×16×16=10240。

(5)池化層2:采用2×2的池化操作,特征映射數目為8×8。

(6)卷積層3:采用的濾波器大小為3×3,采用60組濾波器,最終特征映射的數目為6×6,神經元的個數為60×6×6。

(7)池化層3:得到特征映射數目為3×3。

(8)卷積層4:采用濾波器大小為2×2,采用80組濾波。特征映射數目為2×2。

(9)全聯接層:共有80×2×2=320個神經元。

(10)輸出層:通過softmax回歸算法將特征映射到目標的6個分類。softmax是logistic回歸的多類形態。利用softmax函數定義目標y=c的后驗概率為:

(2)

對于樣本(x,y),輸出目標y={1,…,C}。我們用C維的one-hot向量表示輸出目標。對于類別C

(3)

具體表現見圖5。

4 測試與驗證

驗證采用CASIA漢語情感語料庫。該數據庫由中科院自動化所錄制,由4位錄音人(兩男兩女)在純凈錄音環境下(信噪比約為35 dB)分別在5類不同情感下(高興、悲哀、生氣、驚嚇、中性)對500句文本進行演繹而得到,16 kHz采樣,16 bit量化。經過聽辨篩選,最終保留其中9 600句。

輸出結果測試:見圖6。

在epoch次數為200時準確率達到81%。

參考文獻

[1] 詹永照.視覺語音情感識別[M].北京:科學出版社,2013.

[2] T.Sainath,B.Kingsbury,A.Mohamed,etal.Learningfilter banks within a deep neural network framework[M].In Proceedingsof The Automatic Speech Recognition and Understanding Workshop(ASRU).2013.

[3] G.Hinton,S.Osindero,Y.Teh.A fast learning algorithm for deepbelief nets[J].Neural Computation,2006(18):1527-1554.

[4] 韓文靜,李海峰,阮華斌,等.語音情感識別研究進展綜述[J].軟件學報,2014,25(1):37-50.

主站蜘蛛池模板: 国产特一级毛片| 无码在线激情片| 午夜视频日本| 亚洲精品图区| 扒开粉嫩的小缝隙喷白浆视频| 四虎永久在线| 人妻夜夜爽天天爽| 日韩无码视频播放| 国产高清无码第一十页在线观看| 东京热一区二区三区无码视频| 亚洲无码91视频| AV无码一区二区三区四区| 久久久黄色片| 欧美亚洲欧美区| 白浆免费视频国产精品视频| 国产玖玖视频| 成人日韩视频| 超清无码一区二区三区| 国产高潮流白浆视频| 久久无码av三级| 91丝袜乱伦| 精品视频免费在线| 国产精品刺激对白在线| 亚洲自拍另类| 青青草91视频| 无码aⅴ精品一区二区三区| 亚洲第一网站男人都懂| 国模私拍一区二区| 激情无码字幕综合| 国产成人无码播放| 找国产毛片看| 欧美日韩在线亚洲国产人| 国产区在线看| 最新国产你懂的在线网址| 成人一级免费视频| 青青青国产视频| 91成人在线免费视频| 在线观看国产小视频| 欧美怡红院视频一区二区三区| 国产精品爆乳99久久| 精品久久人人爽人人玩人人妻| 永久免费av网站可以直接看的| 久久久噜噜噜久久中文字幕色伊伊| 在线播放精品一区二区啪视频| 天天色综合4| 日韩最新中文字幕| 欧美精品亚洲二区| 在线精品亚洲一区二区古装| 国产精品99一区不卡| 99re精彩视频| 在线观看视频99| 小说 亚洲 无码 精品| 免费人欧美成又黄又爽的视频| 国产一级特黄aa级特黄裸毛片| 69国产精品视频免费| 亚洲国产精品无码AV| 欧美日韩午夜视频在线观看| 亚洲一区毛片| 在线综合亚洲欧美网站| 国产亚洲高清在线精品99| 成人综合在线观看| 香蕉视频在线观看www| 福利在线免费视频| 99久久人妻精品免费二区| 国产又色又爽又黄| 免费无码AV片在线观看国产| 国产视频a| 国产h视频在线观看视频| 精品无码一区二区三区电影| 日韩第八页| 日韩二区三区| 五月婷婷精品| 美女无遮挡免费网站| 九色在线视频导航91| 在线观看国产精品日本不卡网| 高清乱码精品福利在线视频| 中文国产成人精品久久| 亚洲性日韩精品一区二区| 亚洲欧美在线综合一区二区三区| а∨天堂一区中文字幕| 久久成人免费| 亚洲欧美极品|