999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向網頁交互場景下的手勢識別改進算法研究*

2021-05-08 06:10:50周思昀施水才
通信技術 2021年4期

周思昀,施水才

(北京信息科技大學 計算機學院,北京 100192)

0 引言

相較于語言和文字,手勢是一種更加自然的交互方式。手勢識別技術使用戶能夠通過手勢對計算機下達指令,從而進行一系列操作,在人機交互、智能駕駛等領域均具有重要意義[1-3]。隨著計算機的普及,更加自然簡單的交互方式成為當下的發展需求。利用手勢進行交互,可有效避免使用計算機的復雜性,使得用戶不需要進行專業性訓練即可與計算機進行交互。此外,手勢識別作為非接觸式的交互方式,一定程度上更加方便快捷[4]。例如,應用于智能家居領域時,用戶不需要與屏幕進行接觸即可完成交互。在當下的疫情環境期間,采用非接觸式的手勢識別輸入指令,可避免接觸公共設施的屏幕,如快遞取件箱輸入驗證碼提取快遞,能夠有效避免人與人之間的病毒傳播。因此,在諸多方面來看,非接觸式手勢識別的研究對計算機技術的發展有著重要的促進作用,也具有對其應用的現實意義[5]。

使用手勢與網頁進行交互的過程中,存在著背景復雜度和計算機攝像頭所獲取的圖像像素過低的問題。針對手勢檢測問題,林海波等人提出一種通過使用深度圖像分割出手勢目標的方式對手勢進行提取[6]。張強等人提出一種基于改進YOLOv3的手勢實時識別方法對深度圖像進行目標識別[7]。這兩種方式都對深度圖像信息進行分析,在實際應用中對硬件設備需求較高,因此更適用于交互游戲機或實驗室環境。王龍等人采用通過對膚色進行檢測獲取手勢目標的方式,解決了在設備限制的情況下采用計算機視覺的方式對手勢進行提取[8-10]。但是,以上實驗均在簡單背景的實驗室環境下進行,對復雜環境的手勢識別精準度低于使用深度圖像的識別。因此,本文提出了一種針對復雜背景情況下的低像素二維圖像手勢目標提取方法,采用色彩空間轉換后的膚色提取和改進后的邊緣提取相結合的方法,利用卷積神經網絡進行特征提取和分類,再進一步使用支持向量機(Supportive Vector Machine,SVM)分類方法進行分類,通過分割閾值選取最優結果,有效提升了在復雜背景和計算識別量大的網頁交互環境下手勢識別的精準度。

1 研究方法

1.1 流程設計

針對應用場景進行創新,將手勢識別應用于網頁交互領域,實驗流程如圖1所示。

圖1 數字手勢模型流程

為解決在網頁交互使用場景下存在目標圖像背景復雜的問題,設計圖像預處理方法,對原始圖像進行處理,提升訓練的精準度。通過自適應曝光增強算法與色彩空間轉換,消除亮度對膚色提取的影響,最終實現初始圖像中手部的提取。將獲得的手部輪廓作為輸入數據,使用經過優化后的卷積神經網絡(Convolutional Neural Network,CNN)進行特征提取分類,并通過SVM分類實現對手勢的分類,進而經過篩選選定合適的結果,最終生成數字手勢識別的模型。

1.2 手勢圖像的獲取

手勢識別圖像拍攝于實驗室環境,通過攝像頭對6組手勢進行拍攝。為了避免因樣本量太少而導致訓練不足,通常使用如彈性變形、噪聲和仿射變換之類的方法進行樣本擴展。本文提出的波形失真方法可以在不改變手勢結構的情況下結合平移、旋轉和縮放來創建偽樣本,并實現樣本擴展。波形失真是一種通過正弦函數轉換原始圖像坐標的算法,可表示為:

通過調整正弦函數的幅度A和周期T,可以快速生成大量樣本。將正弦波的振幅和周期分別控制在間隔[0,6]和[80,120]中時,旋轉角度的字符在±30°之內,水平和垂直平移范圍在10%,縮放比例為10%,并隨機生成30個偽樣本圖像,共計獲得圖像12 000張,其中手勢圖像9 000張(每種手勢基礎圖像150張,通過旋轉縮放創建1 450張),非手勢的純背景干擾圖像3 000張,如圖2所示。隨機抽取900張手勢圖像和300張背景圖像作為測試樣本。

圖2 訓練手勢數據

1.3 圖像預處理

圖像預處理對于應用于網頁的手勢識別系統意義重大。應用于網頁交互的手勢圖像由于用戶的不確定性,往往具有背景復雜、亮度不確定的特點。圖3為復雜背景下的手勢圖像。手勢圖像的背景會對手勢獲取產生影響。本文中采用優化參數的自適應曝光算法,在圖像亮度過低時對圖像進行曝光處理,提高了手勢目標提取的精準度。此外,對于復雜的背景圖像,采用曝光處理能夠更好地區分前背景,在膚色檢測的步驟中避免背景中存在與膚色相近的顏色而對手勢目標的提取產生影響。

圖3 復雜背景下的手勢

由圖4和圖5對比可知,采用優化后的自適應曝光算法能夠有效避免光線過暗帶來的影響,從而順利實現對手勢目標的提取。

圖4 未采用曝光算法的手勢

圖5 采用曝光算法的手勢

應用于網頁交互的手勢識別的識別速度會對用戶體驗感產生影響。多余信息會對訓練速度和后續的識別速度產生影響。為降低訓練圖像噪點,減少圖像細節,對目標圖像進行高斯濾波。高斯模糊的實現是將原始圖像以正態分布進行卷積。二維高斯函數公式如下:

如圖6所示,將圖像通過該式(2)轉化為被濾波后的圖像噪聲將明顯降低,能夠有效減少后續處理工作量。

通過膚色檢測提取手勢的方法通常受到環境燈光或亮度的影響。本文根據Garcia等人提出的通過色彩空間轉換分離強度或亮度的方法[11],選擇Ostu閾值篩選算法對膚色進行提取。該方法使用YCbCr和HSV膚色子空間的近似值進行顏色聚類和過濾,以避免不同照明的影響[12]。

圖6 高斯濾波處理

RGB轉換為YCbCr的公式如下:

式中,Y表示亮度,Cb表示藍色光分量,Cr表示紅色光分量。通過提取其中的Cr分量,對Cr進行Ostu二值化的分割獲取掩膜。本文使用的Ostu方法設置閾值是一種自適應閾值二值化方法,采用聚類的思想,將圖像中的像素點按照灰度級進行區分。通過分析不同的像素點改變閾值,以實現皮膚顏色的自動檢測,最后通過腐蝕膨脹算法整理邊緣,過程如圖7所示。

圖7 圖像預處理過程

輪廓檢測基于邊緣中像素亮度的劇烈變化。根據邊緣的原因,對每個像素應用微分方法或微分方法,以檢測灰度顯著變化的像素并將其標記下來,如圖8所示。可見,邊緣檢測大大減少了數據量,分離了無關信息,并保留了主要結構。

1.4 基于CNN的特征提取方法

本文通過對卷積神經網絡構造進行調整,使用共享權值的稀疏連接并添加稀疏過濾器,有效提升了應用于網頁的手勢識別訓練速度和識別速度。卷積神經網絡主要由卷積層和池化層組成,通過設置卷積核在輸入的預處理后的圖像滾動對圖像的特征進行提取[13-14]。卷積神經網絡是由神經元組成的網絡系統結構,通過對各層之間進行相互連接形成整個神經網絡。

圖8 輪廓提取

卷積神經網絡的采樣層可以表示為:

在權值初始化后,傳統的卷積神經網絡樣本按順序經過卷積層、下采樣層和全連接層,通過向下傳播的方式獲取最后結果。但是,應用于圖像識別中的卷積神經網絡由于隱藏單元較多,將會出現連接權值過大的問題。此外,迭代次數的選定也將對訓練結果產生影響[15]。例如,訓練輪數過多可能產生數據過擬合或者局部最優解的問題;訓練輪數過少將會影響識別的精準度,導致特征提取不充分等問題。因此,需采用共享權值的稀疏連接并通過稀疏濾波器進行特征提取,以降低神經網絡數量級。全連接、稀疏連接對比如圖9所示。

圖9 全連接與稀疏連接

本文將特征識別分為兩個方面,分別對手掌和手指的特征進行提取,最后通過全連接將兩種特征進行權值計算生成整個手勢的特征。為避免不同指標具有不同的量綱和量綱單位,先對輸入的圖像數據進行歸一化處理,具體計算公式如下:

將手勢圖像的像素轉換成100×100后輸入卷積神經網絡,網絡結構中共設置4層卷積層。第一層卷積層中包含32個稀疏濾波器,卷積核尺寸選擇5×5,步長選擇為2。隨著層數的增加,稀疏濾波器的數量隨之增加。在卷積層中,稀疏濾波器將對圖像特征進行優化。

具有N個樣本的數據集稀疏濾波函數的目標函數為:

總體CNN算法網絡架構如圖10所示。

圖10 CNN網絡架構

池化層緊隨卷積層后,采用下采樣的方式進一步對特征圖進行壓縮,去除冗余。池化層算法選擇方面,根據數字手勢識別的特點,特殊特征值比平均特征值更重要。在池化層中選擇最大池化的算法對數據進行處理,即在特征圖中尋找最大值。這樣可以減少計算時間,提高不同空間位置特征的魯棒性。

池化算法的一般表達式為:

式中,l代表目前池化層數,down(·)代表池化函數。

將下一卷積層中的濾波器個數設置為64,輸入數據為上一池化層輸出的結果。通過第2層卷積層后,圖像尺寸縮小為50×50,后續卷積層做相同處理,最終得到6個大小為6×6的特征映射圖。進一步與下層全連接層相連,構成完整的卷積神經網絡。

設置3層全連接層對獲得特征圖進行聚類,可見層數的增加提升了模型非線性表達能力。逐層降低全連接層的輸出單元數,已達到對不同數字手勢特征圖像進行分類的目的,最終由1 024個特征類別抽象為6個數字手勢類別。全連接層的激活函數選取修正線性函數(ReLU)的改進函數Leaky ReLu。該函數為非飽和函數,能夠有效解決梯度消失的問題。此外,該函數是非線性的,能夠反向傳播錯誤并激活多個神經元。若輸入值為負,將為所有負值分配一個非零的斜率,避免了ReLu函數在訓練過程中由于將負值設置為0導致的問題。

1.5 SVM-CNN組合分類器

在使用CNN卷積神經網絡對數據進行分類后,再使用SVM分類器。當分類結果產生沖突時,采用SoftMax算法輸出最大值判決確定最終的結果,如圖11所示。卷積神經網絡與支持向量機的組合算法能夠將訓練識別的精準度提升2%~3%。支持向量機分類器是機器學習中常用的二分類處理方法。在樣本類別為K的情況下,需要K(K-1)/2個SVM子分類器確定分類結果。

SVM與CNN兩種分類器模型具有相對獨立性。通過選取適當的閾值TH,對結果的選擇進行判定。若SVM的分類結果不小于TH,則選擇SVM分類器結果作為手勢識別的最終結果;反之,則選擇CNN分類器的分類結果。本文采取通過驗證集評估的方式估計最優閾值。通過設定不同閾值對測試集進行驗證分類結果的正確性,最終確定正確率Pc與閾值TH之間的函數關系Pc(TH),從而獲得合適的組合分類器的分割閾值。由于閾值區間可能存在多個峰值,選取(tmin+tmax)/2作為組合算法的最終閾值。

圖11 SVM-CNN組合分類器

2 實驗結果與分析

實驗硬件平臺為Intel Core i7 2.6 GHz 6核,軟件平臺為TensorFlow 1.14.0,數據集為百度AI studio數字手勢數據集。

在框架下實驗使用百度AI studio數字手勢數據集對優化后的SVM-CNN組合分類器進行驗證。訓練過程中,采用隨機梯度下降法最小化訓練誤差。圖12為20輪訓練下手勢識別精準度的區別,在訓練到5~6輪時訓練數據開始收斂。此外,輪數的提高可以有效提高手勢識別的精準度。

由實驗結果可知,使用自適應曝光算法調整后的YCrCb色彩空間的膚色檢測算法能夠準確提取目標手勢,避免了光照和復雜背景環境對數字手勢識別的影響。采用高斯濾波對圖像進行降噪處理,能夠在一定程度上減少訓練計算量和訓練時間。

從表1結果可知,使用SVM-CNN組合的分類器模型對數字手勢識別的精準度有所提升。單一的SVM模型對手勢的識別正確率為97.28%,而傳統的CNN模型具有96.94%的識別率。由于缺少權值共享,上層網絡不能很好地服務于下層網絡。改進的SVM-CNN分類算法相較于單一模型的分類算法,具有更好的準確性。

如表2所示,在訓練時間方面,單一模型的訓練速度相較于組合模型的訓練速度快。改進的SVM與CNN的組合算法由于添加了分割閾值進行判定結果選擇,速度相較于單一模型來說并不具有優勢,但是識別效果具有顯著提升。此外,SVM與CNN的組合算法應用了稀疏矩陣和權值共享,降低了計算的復雜程度,一定程度上縮短了訓練時間,因此時間差距并不明顯。

圖12 不同訓練輪數下識別精準度變化(SVM+CNN)

表1 算法正確率對比

表2 訓練時間對比

為達到實時效果,通常視頻采用28 fps作為標準,即每秒鐘播放28幀圖像。實驗中對手勢模型的測試結果為如表3所示。

表3 各手勢識別時間

該結果通過對本文所提出模型使用Python自帶圖形化工具tKinter創建交互界面,實時獲取手勢數據并計算平均識別時間獲得。不同的手勢由于提取特征的不同,在識別時間上略有差距。本文實驗模型識別時間在50 ms左右,距離實時處理略有差距,但為實時識別處理墊底研究基礎,在實際應用中可考慮適當提高硬件性能以達到實時效果。手勢識別的準確率平均可達95.76%,識別精準度較高。通過對手勢添加指令能夠有效獲取當前鼠標位置并對鼠標進行移動,或下達對網頁放大縮小的指令。

3 結語

本文根據應用于網頁交互的手勢識別的特點改進手勢提取算法,有效通過圖像預處理和膚色識別對目標手勢進行提取和跟蹤,并實現使用SVMCNN組合算法正確識別手勢0~5。通過實驗可以看出,使用SVM-CNN的組合算法對手勢進行識別具有可行性。在模型訓練過程中,需要測試不同的參數,以提高訓練模型準確性,如更改不同的學習率和使用不同的激活函數。

未來研究將集中研究更有效的手勢跟蹤和手勢識別方法,記錄和識別手勢運動的軌跡。在將手勢識別應用于網頁交互的過程中,可繼續獲取每一次交互產生的數據,并對此進行進一步的學習,以完善該應用。此外,可研究其他關于動態手勢在運動過程中產生的動態模糊的問題的健壯和有效方法,以便將系統組件集成到具有主動視覺系統的擬人化自主機器人的手勢接口和虛擬環境應用中。

主站蜘蛛池模板: 中文成人在线视频| 亚洲中文在线视频| 日韩国产欧美精品在线| 亚洲欧美激情另类| 国产一级做美女做受视频| 狼友av永久网站免费观看| 中文字幕调教一区二区视频| 日本在线国产| 国产精品原创不卡在线| 亚洲第一视频网| 天天综合色网| 久久久久久高潮白浆| 亚洲国产成人麻豆精品| 2020精品极品国产色在线观看 | 亚洲欧美精品在线| 国产亚洲视频播放9000| 波多野吉衣一区二区三区av| 香蕉蕉亚亚洲aav综合| 国产精品蜜芽在线观看| 久操线在视频在线观看| 国产精品va免费视频| 亚洲国产精品一区二区第一页免| 国产综合无码一区二区色蜜蜜| 一级毛片在线直接观看| 久久精品人人做人人爽97| 日韩a级片视频| a毛片在线| 日韩欧美国产成人| 爱色欧美亚洲综合图区| 女人爽到高潮免费视频大全| 免费国产一级 片内射老| 亚洲综合经典在线一区二区| 国产亚洲精久久久久久无码AV| 一本色道久久88综合日韩精品| 国产永久在线视频| 国产成人一区在线播放| 午夜欧美理论2019理论| 91九色国产在线| 国产中文一区a级毛片视频 | 中文字幕日韩视频欧美一区| 国产拍揄自揄精品视频网站| 国产一级小视频| 欧美不卡视频在线| 日本久久免费| 都市激情亚洲综合久久| 日本午夜在线视频| 国产最新无码专区在线| 国产第一福利影院| 亚洲AⅤ无码日韩AV无码网站| 2020国产在线视精品在| 亚洲伊人久久精品影院| 亚洲综合色婷婷中文字幕| 538国产在线| 亚洲欧洲日韩久久狠狠爱| 男人的天堂久久精品激情| 亚洲国产一区在线观看| 亚洲69视频| 国产 在线视频无码| 国产成人精品在线| 久久窝窝国产精品午夜看片| 久久这里只有精品2| 久久综合九色综合97网| 色婷婷综合激情视频免费看| 久久精品嫩草研究院| 久久人搡人人玩人妻精品一| 免费在线国产一区二区三区精品 | 美女免费精品高清毛片在线视| 国产成人精品亚洲日本对白优播| 亚洲国产日韩在线成人蜜芽| 重口调教一区二区视频| 欧美午夜在线播放| 久久久久国产一级毛片高清板| 91网红精品在线观看| 国产无人区一区二区三区| 国产福利免费视频| 国产精品一区二区国产主播| 好吊色国产欧美日韩免费观看| 中文字幕在线观| 国产乱子伦一区二区=| 伊人色在线视频| 欧洲欧美人成免费全部视频| 日韩高清中文字幕|