999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Kinect的聽障人士語言能力康復(fù)輔助系統(tǒng)

2016-09-20 07:22:40劉建通四川大學(xué)計算機學(xué)院成都610065
現(xiàn)代計算機 2016年7期
關(guān)鍵詞:特征提取康復(fù)特征

劉建通(四川大學(xué)計算機學(xué)院,成都 610065)

基于Kinect的聽障人士語言能力康復(fù)輔助系統(tǒng)

劉建通
(四川大學(xué)計算機學(xué)院,成都610065)

0 引言

據(jù)2014年的數(shù)據(jù)統(tǒng)計,中國有2780萬聽力殘疾人,接近中國總?cè)丝跀?shù)的2%。聽障患者特別是聾啞兒童的康復(fù)工作是國家和社會高度關(guān)注的問題之一,中央財政在聾兒康復(fù)救助項目上大力投入,為聾兒實施人工耳蝸手術(shù)和助聽器免費佩戴和康復(fù)訓(xùn)練。助聽器、人工耳蝸及相關(guān)手術(shù)能夠讓聽障患者恢復(fù)聽力,但聽力的長期喪失會使聽障患者的語言能力受到較大影響。只有通過語言康復(fù)訓(xùn)練,才能讓聽障患者的語言能力達到正常人的水平。而我國在語言康復(fù)訓(xùn)練專業(yè)人員方面存在巨大的缺口,這直接導(dǎo)致我國聽力與言語障礙兒童的康復(fù)率只有29.7%,大量的聽障患者恢復(fù)聽力后仍面臨艱難而長期的語言能力康復(fù)訓(xùn)練過程,不能達到正常人的語言能力水平。

人類認知的語言過程是多通道的。在面對面交流的過程中,人們不僅通過聲音來理解對方的說話內(nèi)容,也通過觀察對方的表情、口型等方式獲取信息,從而更準(zhǔn)確地理解說話內(nèi)容。而對于聽力障礙者來說,視覺信息顯得尤其重要。唇讀原本指的就是聽障患者通過唇部動作和面部表情感知正常人的說話內(nèi)容的一種方法。計算機領(lǐng)域的唇讀(lip reading/speech reading,以下簡稱唇讀)或唇語識別是指通過分析說話者的唇形變化特征,根據(jù)唇形特征和語音音素之間的對應(yīng)關(guān)系,判斷說話內(nèi)容的技術(shù)[1]。唇讀的研究內(nèi)容主要包括唇部檢測和定位(lip detection)、唇動特征提取(lip feature extraction)以及唇動特征識別。近年來,唇讀技術(shù)在科研和工業(yè)界得到了廣泛的關(guān)注和研究。唇讀技術(shù)可以應(yīng)用于輔助語音識別、輔助手語識別、口型合成、聾人輔助教育等領(lǐng)域。

Kinect是微軟公司推出的體感設(shè)備,具有人臉追蹤的功能。開發(fā)者可以使用Kinect進行人臉追蹤,從人臉追蹤的結(jié)果數(shù)據(jù)中,定位嘴唇部分,并提取唇動特征信息。

鑒于我國的聽障人士語言能力康復(fù)訓(xùn)練的現(xiàn)狀,以唇讀技術(shù)和Kinect技術(shù)為基礎(chǔ),本文提出了一種聽障人士語言能力康復(fù)輔助系統(tǒng)的設(shè)計方案。聽障人士說話后,通過Kinect來完成唇部的檢測、定位以及唇動特征提取。然后根據(jù)識別算法,識別提取到的唇動特征,并與預(yù)定義的標(biāo)準(zhǔn)唇形匹配,得出正確率,反饋給用戶。用戶根據(jù)系統(tǒng)的反饋,不斷修正自己的發(fā)音方式,達到輔助康復(fù)的效果。

1 唇讀中的關(guān)鍵技術(shù)

1.1唇部檢測和定位

唇部檢測和定位是所有的唇讀系統(tǒng)首先需要解決的問題。以前的唇讀研究中曾使用人工標(biāo)定的方法來定位唇部。而唇讀系統(tǒng)要達到的目標(biāo)是在無任何限制條件和人機交互的前提下,能夠自動地將不同光照、不同皮膚顏色、不同說話者準(zhǔn)確定位、跟蹤、識別和理解[2]。因此,智能型的檢測手段不斷研究出新。

1.2唇動特征提取

唇動特征提取是唇讀的關(guān)鍵環(huán)節(jié)。唇語識別是在提取到的唇動特征的基礎(chǔ)上完成的。唇動特征提取方法大致可以分為三類:基于像素的方法、基于模型的方法和混合方法。

1.3識別方法

唇讀和語音識別都屬于動態(tài)序列特征識別的范疇,它經(jīng)歷了和語音識別類似的發(fā)展階段。從最初的模板匹配方法到之后漸漸成為主流的基于HMM模型的方法和基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的方法。

2 Kinect相關(guān)技術(shù)

2.1Kinect 簡介

Kinect是微軟公司推出的體感設(shè)備,有如下組件:一個彩色攝像頭,一個紅外線發(fā)射器和一個紅外線接收器,如圖1所示。

圖1 Kinect外觀示意圖

其中,彩色攝像頭用來獲取彩色圖像,紅外線發(fā)射器和接收器可以共同獲取深度數(shù)據(jù)。其相機坐標(biāo)空間如圖2所示。

圖2 Kinect的相機坐標(biāo)空間

微軟同時提供了Kinect for Windows SDK,開發(fā)者可以利用該SDK在Windows平臺上開發(fā)應(yīng)用程序,驅(qū)動Kinect設(shè)備完成骨骼跟蹤、動作捕捉、語音識別等功能。在1.5版本以后的SDK中,微軟增加了一個輔助工具——Face Tracking(人臉追蹤)SDK,可以進行人臉追蹤[3]。

2.2使用 Face Tracking SDK 定位唇部并提取唇動特征

Face Tracking SDK是用來在Kinect for Windows SDK的基礎(chǔ)上完成人臉追蹤的。通過分析Kinect設(shè)備提供的每一幀的彩色數(shù)據(jù)、深度數(shù)據(jù)和骨骼追蹤數(shù)據(jù),F(xiàn)ace Tracking SDK可以返回人臉追蹤的結(jié)果,其中包括頭部的3D坐標(biāo)和根據(jù)臉部模型預(yù)定義的121個點的坐標(biāo) (這里使用的是1.8版本的Kinect for Windows SDK,版本不同,坐標(biāo)點個數(shù)可能有差異),如圖3所示。

圖3 Kinect設(shè)備追蹤人臉時返回的121個面部特征點

通過調(diào)用FaceTrackFrame.GetProjected3DShape()和FaceTrackFrame.Get3DShape()方法,可以分別獲取這121個特征點的2D坐標(biāo)和3D坐標(biāo)。在這121個點中,有18個點用來定義嘴唇部分,其中8個點用來表示內(nèi)唇,10個點用來表示外唇。在圖4中,可以直觀地看到表示嘴唇的18個點。

由于特征點的坐標(biāo)來自對每一幀數(shù)據(jù)的分析,而Kinect采集數(shù)據(jù)的幀率可以達到30fps,因此可以將18個唇部特征點坐標(biāo)的變化作為唇動特征信息。由此,即借助Kinect完成了唇讀系統(tǒng)中的唇部檢測定位和唇動特征信息提取的任務(wù)。

圖4 表示嘴唇部分的18個特征點

3 系統(tǒng)設(shè)計

3.1主要模塊

基于Kinect的聽障人士語言能力康復(fù)輔助系統(tǒng)包含三個模塊:

(1)人臉模型參數(shù)采集模塊

在 Kinect人臉追蹤的結(jié)果中,還包括基于Candide-3人臉模型的參數(shù)。Candide-3模型[4]是一種通用的參數(shù)化人臉模型,使用少量的參數(shù)就可以模擬人臉的表情和動作,可以節(jié)省很多計算時間,因此廣泛應(yīng)用于三維人臉重建、人臉動畫合成和視頻傳輸中[5]。開發(fā) 者可以通過調(diào)用 FaceTrackFrame.GetAnimation UnitCoefficients()方法獲得Candide-3模型的參數(shù)。基于這些參數(shù),可以完成人臉模擬、口型合成等任務(wù)。

人臉模型參數(shù)采集即使用Face Tracking SDK驅(qū)動 Kinect進行一段時間的人臉追蹤,得到基于Candide-3人臉模型的參數(shù),其中包括6個動畫單元(Animation Units)和11個形態(tài)單元(Shape Units)[6]。這些參數(shù)可以用于進行標(biāo)準(zhǔn)口型動畫的合成。在光照正常和人臉位置合適的條件下,這一過程僅需要幾秒鐘時間。

(2)口型合成與標(biāo)準(zhǔn)唇形定義模塊

口型合成模塊即根據(jù)要練習(xí)的文字,使用Candide-3人臉模型參數(shù)進行口型動畫的合成。參數(shù)中的動畫單元用來模擬嘴唇、眉毛等臉部動作,形態(tài)單元用來模擬面部形態(tài),如鼻子的位置,嘴唇的位置和寬度等。口型動畫合成后可以在程序窗口中播放,讓用戶可以直觀地進行模仿和學(xué)習(xí)。

標(biāo)準(zhǔn)唇形定義即根據(jù)要練習(xí)的文字,計算出標(biāo)準(zhǔn)的唇動特征信息,這一信息將用于之后的唇形識別過程。

(3)唇動特征提取與識別模塊

這一模塊中要做的主要工作是提取唇動特征,并根據(jù)預(yù)定義的標(biāo)準(zhǔn)唇形,使用識別算法進行識別和匹配,計算出用戶發(fā)音時唇形的正確率,反饋給用戶。

Kinect可以在用戶發(fā)聲練習(xí)的過程中實時地獲取唇部特征點的坐標(biāo)變化信息,這些信息可以用于唇動特征的識別。

識別模塊要解決的主要問題是如何定義唇形正確率。例如如果采用KNN算法,是否可以根據(jù)提取到的用戶發(fā)音時的唇動特征數(shù)據(jù)的特征向量與標(biāo)準(zhǔn)的唇動特征向量的距離遠近來得出正確率。實際上,在識別過程中不需要知道唇部特征點的絕對坐標(biāo),只需要知道特征點坐標(biāo)的相對關(guān)系。因此可以對這些特征點坐標(biāo)做一些預(yù)處理操作。文獻[7]使用Kinect對土耳其語中表示顏色的單詞進行了唇語識別,在獲取特征點坐標(biāo)后,對坐標(biāo)數(shù)據(jù)進行了預(yù)處理,獲得了嘴唇張開的角度數(shù)據(jù)。然后針對這些角度數(shù)據(jù),使用KNN算法進行識別,取得了較好的效果。這里用于識別的單詞數(shù)較少,只包括15個表示顏色的土耳其語單詞。但這種處理特征點坐標(biāo)數(shù)據(jù)的方式具有一定的借鑒意義。識別算法是系統(tǒng)實現(xiàn)的難點,還有待進一步的研究。

3.2工作流程

基于Kinect的聽障人士語言能力康復(fù)輔助系統(tǒng)的主要工作流程如圖5所示。

圖5 系統(tǒng)工作流程圖

(1)用戶(聽障人士)進入系統(tǒng)后,系統(tǒng)首先進行人臉模型參數(shù)的采集,即根據(jù)一段時間內(nèi)Kinect設(shè)備進行人臉追蹤的結(jié)果,得到基于Candide-3人臉模型的參數(shù)。

(2)用戶輸入要練習(xí)的文字內(nèi)容。系統(tǒng)根據(jù)用戶的輸入內(nèi)容,計算出標(biāo)準(zhǔn)的唇動特征數(shù)據(jù),并使用上一步中獲取的基于Candide-3人臉模型的參數(shù)來合成正確的發(fā)音口型,然后播放口型動畫。

(3)用戶可以先觀看口型動畫,在點擊開始學(xué)習(xí)后,開始發(fā)音練習(xí)。

(4)用戶練習(xí)過程中,系統(tǒng)將驅(qū)動Kinect設(shè)備,追蹤人臉,獲取唇動特征信息。接著對獲取到的唇動特征信息進行識別,并與輸入的文字所對應(yīng)的標(biāo)準(zhǔn)唇動特征進行匹配,得出正確率,反饋給用戶。用戶可以反復(fù)進行練習(xí)過程,不斷修正自己的發(fā)音方式。

4 結(jié)語

本文提出了一種基于Kinect的聽障人士語言能力康復(fù)輔助系統(tǒng)的設(shè)計方案。系統(tǒng)借助Kinect的人臉追蹤功能,完成唇部檢測定位和唇動特征提取的任務(wù)。但與此同時,Kinect本身也會消耗比較多的計算資源。而在識別和匹配的過程中,又要求較好的實時性。因此如何處理表示唇動特征的坐標(biāo)點數(shù)據(jù),并尋找準(zhǔn)確而高效的識別和匹配算法將是本系統(tǒng)實現(xiàn)的難點和下一步的研究方向。

[1]姚鴻勛.視覺語言——唇讀綜述.電子學(xué)報,2001,29(2):1-8.

[2]榮傳振,岳振軍,賈永興,王淵,楊宇.唇語識別關(guān)鍵技術(shù)研究進展.數(shù)據(jù)采集與處理,2012,27(2):277-283.

[3]吳國斌,李斌,閻驥洲.KINECT人機交互開發(fā)實踐[M].北京:人民郵電出版社,2013.

[4]CANDIDE-a parameterized face.http://www.icg.isy.liu.se/candide/

[5]胡峰松,林亞平,鄒北驥,張茂軍.應(yīng)用于人臉識別的基于Candide-3特定人臉三維重建.湖南大學(xué)學(xué)報,2008,35(11):69-73

[6]MSDN.Face Tracking Programming Guide.https://msdn.microsoft.com/en-us/library/jj130970.aspx#

[7]Alper Yarg,Muzaffer Dogan.A Lip Reading Application on MS Kinect Camera.In Innovations in Intelligent Systems and Applications (INISTA),2013 IEEE International Symposium on,pp.1-5.IEEE,2013.

Language Ability Rehabilitation;Lip Reading;Lip Recognition;Kinect

An Assistive System for Language Ability Rehabilitation of Hearing Impaired People Based on Kinect

LIU Jian-tong
(College of Computer Science,Sichuan University,Chengdu 610065

1007-1423(2016)07-0092-04

10.3969/j.issn.1007-1423.2016.07.021

劉建通(1990-),男,河北衡水人,碩士研究生,研究方向為機器智能2016-01-20

2015-02-10)

近年來,唇讀技術(shù)在科研和工業(yè)界得到廣泛關(guān)注和研究。唇讀能夠應(yīng)用于輔助語音識別、口型合成、聾人輔助教育等領(lǐng)域。Kinect是微軟公司推出的體感設(shè)備,具有人臉追蹤的功能,并能夠完成唇讀系統(tǒng)中的唇部檢測和定位以及唇動特征提取的任務(wù)。提出一種基于Kinect的聽障人士語言能力康復(fù)輔助系統(tǒng)的設(shè)計方案。

語言能力康復(fù);唇讀;唇語識別;Kinect

In recent years,lip reading has attracted widely attention from research community and industry.Lip reading can be used in the areas of auxiliary speech recognition,synthesis of lip reading,deaf-aided education.Kinect is one kind of motion sensors with face tracking func-tion,and it is used to complete tasks of lip detection and lip feature extraction in a lip reading system.Provides a solution of designing an assistive system for language ability rehabilitation of hearing impaired people based on Kinect.

猜你喜歡
特征提取康復(fù)特征
如何表達“特征”
基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
電子制作(2019年15期)2019-08-27 01:12:00
不忠誠的四個特征
腦卒中患者康復(fù)之路
特別健康(2018年2期)2018-06-29 06:13:44
抓住特征巧觀察
一種基于LBP 特征提取和稀疏表示的肝病識別算法
基于MED和循環(huán)域解調(diào)的多故障特征提取
殘疾預(yù)防康復(fù)法制建設(shè)滯后
補陽還五湯聯(lián)合康復(fù)治療腦卒中35例
線性代數(shù)的應(yīng)用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 午夜视频日本| 天天综合网亚洲网站| 嫩草国产在线| 欧美a网站| 亚洲区欧美区| 欧美午夜网站| 亚洲国产精品VA在线看黑人| 国产精品妖精视频| 国产精品尤物铁牛tv| 国产毛片久久国产| A级毛片高清免费视频就| 88av在线播放| 天天摸夜夜操| 香蕉伊思人视频| 日韩中文精品亚洲第三区| 日本久久网站| 日韩区欧美国产区在线观看| 久久综合伊人77777| 天堂va亚洲va欧美va国产| 国产尤物jk自慰制服喷水| 国产小视频免费观看| 美女国内精品自产拍在线播放| 国产综合无码一区二区色蜜蜜| 国产综合另类小说色区色噜噜 | 青青青草国产| 国禁国产you女视频网站| 福利在线不卡一区| 亚洲精选无码久久久| 美女被操91视频| 国产在线视频欧美亚综合| 亚洲国产高清精品线久久| 国国产a国产片免费麻豆| 性69交片免费看| 激情综合激情| 成人午夜视频免费看欧美| 国产尤物在线播放| 亚洲va欧美ⅴa国产va影院| 伊人成人在线| 四虎成人在线视频| 久久www视频| 热伊人99re久久精品最新地| 五月激激激综合网色播免费| 婷婷开心中文字幕| 国产一区二区三区精品久久呦| 亚洲成人一区二区| www.亚洲天堂| 狠狠干欧美| 亚洲日本精品一区二区| 欧洲高清无码在线| 99精品福利视频| 亚洲综合第一区| 亚洲黄网在线| 亚洲黄色视频在线观看一区| 欧美精品三级在线| 亚洲一区二区在线无码| 午夜精品久久久久久久无码软件| 国模在线视频一区二区三区| 日韩天堂在线观看| 一区二区三区精品视频在线观看| 欧美精品二区| 91麻豆国产视频| 国产第一页亚洲| 国产一区二区视频在线| 国产迷奸在线看| 毛片网站观看| 国产网友愉拍精品| 国产流白浆视频| 亚洲首页在线观看| 永久成人无码激情视频免费| 国产精品午夜福利麻豆| 国产乱人激情H在线观看| 一级做a爰片久久免费| 久久国产精品无码hdav| 二级特黄绝大片免费视频大片| 亚洲伊人天堂| 亚洲国内精品自在自线官| 成人国产小视频| 亚洲婷婷丁香| 青青操视频免费观看| 极品私人尤物在线精品首页| 成年人国产视频| 欧美成人一级|