秦喜文 李洋 董小剛* 高中華
(1.長春工業大學基礎科學學院,吉林長春 130012;2.長春工業大學汽車工程研究院,吉林長春 130012)
基于C5.0算法的人臉表情識別研究
秦喜文1,2李洋1董小剛1*高中華1
(1.長春工業大學基礎科學學院,吉林長春130012;2.長春工業大學汽車工程研究院,吉林長春130012)
本文通過對人臉表情圖像進行預處理,對預處理后的待測圖像進行特征點標定,統計出這些特征點之間的幾何特征,建立表情屬性表,構建基于決策樹C5.0算法的人臉表情識別模型,獲取分類規則,得到較好的識別精度,為人臉表情識別提供了一條有效途徑。
表情識別ASM決策樹C5.0
現代社會計算機與我們生活聯系的越來越緊密,如何讓計算機理解人類的意圖,受到了人類的重視。人臉表情識別研究在心理學、智能機器人、智能監控、虛擬現實等領域具有應用價值。人臉表情識別中最重要的兩個部分就是人臉表情特征提取和人臉表情規則提取,本文通過ASM算法得到特征點,并且根據這些特征點提取幾何特征屬性,建立表情特征屬性表,然后構建基于決策樹C5.0算法的人臉表情識別模型,給出了人臉表情識別規則,得到較好的識別精度。人臉表情識別技術領域仍然存在人臉識別與人臉表情識別異同性,人臉表情特征提取的針對性與準確性,人臉表情識別的可靠性、準確率不高的問題等。為了解決其他方法存在的問題,本文提出了基于決策樹C5.0的人臉識別研究,豐富了人臉表情識別方法。
決策樹算法的基本思路是通過對給定數據集進行訓練來構造一棵決策樹,從樹根到葉子的每一個路徑都是一條蘊含在數據中的規則。
C5.0模型的工作原理是根據提供最大信息增益的字段分割樣本。然后通常會根據不同字段再次分割由第一次分割定義的每個子樣本,且此過程會重復下去直到無法繼續分割子樣本。最后,將重新檢查最底層分割,并刪除或修剪對模型值沒有顯著貢獻的分割。
C5.0具體步驟如下:
(1)設S是一個樣本集合,目標變量C有k個分類,freq(iC,S)表示S中屬于iC類的樣本數,|S|表示樣本集合S的樣本數。則集合S的信息熵定義為:

(2)如果某屬性變量T,有n個分類,則屬性變量T引入后的條件熵定義為:

通過計算不同T帶來的信息增益率,并選擇信息增益率最大的輸入變量T作為最佳分組變量,這樣得到的分組組內取值趨同程度最高,對決策樹的分類具有顯著的指導意義。同時,C5.0使用信息增益率作為決策標準,能夠消除類別數量的不同對分類結果的影響。
本文通過C5.0來尋找一種精確、高效的基于人臉圖像提取特征的方法,從而構建出一套完備的人臉表情識別模型。

表1 訓練集與測試集的分類總體精度
2.1人臉表情圖像預處理與特征提取
本文采用表情庫是日本Kyushu大學ATR媒體信息科學實驗室Lyons博士提供的JAFFE人臉庫。這個數據庫包含10名日本女性的213幅表情圖像,其中每人提供7種基本表情。分別為中性、高興、傷心、驚訝、生氣、厭惡和害怕。
電子設備對人臉進行拍照時,會受到各種條件限制和隨機干擾,這種人臉圖像不能直接用,需要對拍攝的原始表情圖像進行尺度歸一化、灰度歸一化。然后要獲取圖像表情的特征點,對特征點定位,這里將采用ASM的特征點定位方法,進行asm特征點提取及幾何特征計算,得到表情特征屬性表,進行規則提取,最后得到識別結果。
我們通過ASM算法得到了76個特征點,并且根據這些特征點提取了嘴的高寬比,右眼寬高比,左眼寬高比等33個幾何特征屬性,建立表情特征屬性表,從而為下一步的表情識別規則提取提供了數據基礎。
2.2表情識別規則提取
決策樹分類模型及分類規則:通過上述模型構建功能對數據進行訓練,就可以得到半速率門限值最優化模型。該模型能夠以規則集或決策樹的形式展示模型內容。表1給出了對表情分類結果的統計,主要包括訓練樣本和測試樣本的正確與錯誤百分比。
從表1我們可以看出,訓練集的總體精度高于測試集的分類精度,除分類規則的影響外,還包括測試集的樣本數偏少,導致總體精度不如訓練集。不同表情測試圖像的識別率高低并不相同,在表情分類中,高興的識別率最高,其次是驚訝、憤怒表情,它們的識別率都超過85%,厭惡、害怕、悲傷和中性這幾種表情相對來說要低一些。這是因為驚訝、憤怒和高興這些表情人臉特征區域的變化較大,表情的相關性比較小,從而比較容易識別。
本文對人臉表情識別方法分析,并對它們各自適用性、優缺點進行闡述。針對人臉表情圖像進行人臉尺寸與灰度歸一化處理和特征點標定等預處理,進而提取出人臉表情的幾何特征,提出的方法實現表情特征屬性約簡,篩選出最優特征組合,利用C5.0算法充分挖掘人臉表情識別規則,豐富人臉表情識別方法。本文算法方面還需要在廣泛性上繼續改進,提高對不同的人,難分辨表情,不同面部裝飾表情的識別率。在后續的工作中,將進一步尋找人臉表情的特征,進而提高表情識別精度,使其識別速度更快且具有較高的準確性,建立一套完整、高效與精確的人臉表情識別。
[1]周曉旭,黃向生,徐斌,王陽生.基于Boost改進的嵌入式隱馬爾可夫模型的實時表情識別[J].計算機科學,2005.1 1.
[2]潘麗敏,謝爾曼,羅森林.基于Haar特征的Turbo-Boost表情識別算法[J].計算機輔助設計與圖形學學報,2011.08.
董小剛(1961—),男,漢族,博士,教授,從事應用統計的研究。吉教科合字2012(第119號)。