李翠 王小妮 劉園園

摘要:為了增強人機交互的人性化和多樣化,設計了一種基于SIFT算法的手勢實時控制系統。本系統只需普通PC機與攝像頭就能對手勢進行準確的識別。并且還可以進一步對采集到的圖像進行選擇,這一選擇主要是依據膚色檢測得來的,另外我們還可以采用SIFT算法找到與待測圖像相應的圖像,充分發揮手勢識別技術的優勢,利用輸出信息完成實踐應用的控制工作。該系統不需要建立大容量的樣本庫,運行速度較快,對手勢的識別具有較高的準確性。
關鍵詞:手勢識別;SIFT算法;膚色檢測;特征點
中圖分類號:TP391.4 文獻識別碼:A 文章編號:1001-828X(2016)015-000-01
引言
伴隨著全球信息技術的飛躍式發展,人們對計算機的使用提出了更高的要求,手勢交互方式具有較多的推廣優勢,如生動形象、具體等,因此手勢交互方法被普遍應用在人機交互工作中。
一般情況下,手勢控制系統可以被分為兩大類,主要依據就是輸入設備的差異,第一類是針對數據手套的手勢控制體系,第二類是針對視覺的徒手手勢控制體系。后者的控制體系通常需要較大容量的樣本庫為后續工作奠定基礎,還應該確切的描繪出不同手勢的具體范圍,對周圍環境的要求非常高[3]。
在上述問題的基礎上,下面文章中創建了一種SIFT算法的手勢控制體系。
一、針對手勢控制系統的相關設計
文章中的相關研究都是通過Windows操作系統平臺來完成的,利用Matlab開發工具設計和開發了手勢控制系統,借助普通攝像頭和家用PC機,對手勢進行識別,并成功控制了具體應用。我們可以大致把使用體系粉塵兩大類:第一類是針對手部膚色的檢測,第二類是針對SIFT算法的手勢識別技術。
1.基于膚色的手部區域檢測
不同的手勢不會改變皮膚自身的顏色,在所有的圖像中,手部膚色圖像是比較穩定的。不僅如此,人們的手部在太陽光的照射下色彩幾乎相同,并且色彩不會受到被檢測者的年齡、性別、種族的影響,可以通過手部膚色收集手部區域的基礎信息。
因為普通攝像頭收集到的圖片是RGB彩色空間的,因此無法對其直接處理,一定要把其轉換成YCbCr彩色空間,才能提升處理效果。
文章中把收集到的圖片進行圖像銳化處理,然后在YcbCr空間中提取膚色區域,最后對處理得到的二值圖像進行形態學運算,只有這樣才能得到較為滿意的手部區域圖像。
2.基于SIFT算法的手勢識別
經上一步的判斷后,若攝像頭采集到的圖像中包含有足夠面積的手部區域,則對其進行識別。本文采用SIFT算法對無背景干擾的手勢進行識別。
這種新型的算法的雛形是在上個世紀被人們發現的,隨后人們又對其進行了總結創新。運用這種算法收集到的SIFT特征向量屬于圖像的一種普遍特征,如果我們可以確保其亮度保持不變、尺度縮放比例不變,就能夠確保其噪聲、視角變化比例等的穩定性[1]。
SIFT算法主要有以下幾點:
首先,我們需要認真落實尺度空間的極值點。要想準確得到圖像尺度空間,我們需要利用高斯函數來獲取。
其次,我們需要科學選擇穩定的關鍵點。通過認真選擇那些計算出的極值點,去掉其中的不穩定因素,進而提升關鍵點的穩定性能極其自身抵抗噪聲的能力,為此我們可以參考文相關文獻[2]。
第三,我們應該把選好的關鍵點搭配相應的方向。要想確保SIFT自身的旋轉不變特征,就應該準確找到特征點的主方向。然后結合不同的特征尺度選擇相近的高斯平滑圖像L,準確計算L上每一個點的梯度和方向,隨后進行相鄰窗口的采樣分析,選用直方圖直觀呈現給人們所有點的梯度方向。
二、實驗結果與分析
為了驗證系統的有效性和準確度,本文選用了2種簡單手勢進行實驗,對2種手勢各采集1張,作為樣本圖像。兩種手勢對應的命令分別為開始、前進。
經過相應的研究我們不難看出,手勢控制體系的樣本圖像識別結果不會受到手指不同動作、手勢缺失以及光照差異的影響。
使用Matlab編寫了簡單的圖像播放器、音頻播放器,通過手勢控制系統對兩播放器進行操作。對每個播放器每種手勢各使用50次,統計兩播放器被正確控制的次數。
三、結束語
本文提出的方法對少量的手勢識別效果較佳,如要求識別大量手勢,則隨著各手勢間SIFT特征差異變小,識別結果容易出現錯誤。如果想取得比較好的效果,必須對現在采用的特征點匹配方法加以改進,提高特征點匹配準確率。同時,識別大量手勢需增加樣本圖像的數量,將增加計算量和識別耗時,為解決這一問題需要對手勢進行歸類,識別時對待測圖像進行粗分類,然后將待測圖像與其對應類別中的樣本圖像進行匹配。下一步將研究上述兩個問題的具體解決方案。
參考文獻:
[1]Darid G. Lowe. Object recognition from local scale-invariant features [C].International Conference on Computer Vision, 1999: 1150-1157.
[2]Darid G. Lowe. Distinctive Image Features from Scale-invariant Keypoints [J].International Journal of Computer Vision, 2004, 60(2):91-110.
[3]劉寅,滕曉龍,劉重慶. 復雜背景下基于傅立葉描述子的手勢識別[J].計算機仿真;2005,22(12):158-161.
現代經濟信息2016年15期