999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于TSM框架的三維空間動態手勢識別模型

2021-06-28 07:03:40吳心怡徐火生
艦船電子工程 2021年6期
關鍵詞:特征模型

吳心怡 徐火生 李 恒 胡 超

(武漢數字工程研究所 武漢 430000)

1 引言

動態手勢識別需要通過連續的視頻幀序列來學習和訓練手勢動作的時空特征,進而對不同的動態手勢進行分類識別。采用RGB數據與深度數據特征融合的方法,如文獻[1~3]分別提取RGB圖像和深度圖像的手勢特征,再進行融合與分類,識別效果較好但訓練所需數據量較大;引入光流信息輔助提取特征的方法,如文獻[4~5]分別對動態手勢的RGB圖像和深度圖像提取光流信息,再對光流信息進行特征提取與分類,識別效果優秀,魯棒性高,但模型復雜度也相對較高。為了解決上述問題,本文提出了一種基于TSM框架的動態手勢識別模型,通過使用一種高效的時間移位模塊來融合不同時間維度上的手勢特征信息[6],再結合復雜度較低的基礎網絡ResNet50,實現對手勢動作序列的識別。該模型能夠在2D網絡模型上達到3D網絡模型的識別效果,大大降低了模型的復雜度。

2 基于TSM框架的動態手勢識別模型

如圖1所示,模型首先對視頻數據進行預處理,將視頻幀歸一化至224×224大小,再將視頻均勻分成n個片段,每個片段采樣1幀圖像得到圖像幀序列{F1,F2,…,Fn} 送入殘差網絡進行卷積操作[7~8],再沿著時間維度對特征圖的部分通道進行移位替換操作,通過時間移位模塊得到移位特征,該特征融合了當前幀與相鄰幀的特征信息來進行時間維度建模。這一系列操作能夠讓更具代表性的手勢特征在時間維度上高效傳播,保持2D網絡的復雜度并達到3D網絡的效果。

圖1 模型整體結構圖

一段視頻的維度可表示為A?R(N×C×T×H×W),其中N是批處理大小,C是通道數,T是時間維,H和W是圖片的高度和寬度。TSM模塊首先將視頻均勻分成n個片段,每個片段采樣一幀,即將整個視頻采樣為n張圖片,這時時間維度T=n。文獻[6]驗證了在時間T維度上分別用前后兩幀各1/8的通道來替換當前幀1/4的通道,能夠取得最好的融合效果。為了不破壞主干網絡的空間學習能力,將時間移位模塊以旁路的形式插入到殘差塊之間,也因此能夠在更多的主干網絡上融合時移模塊,增強模型的魯棒性。

3 實驗

實驗選擇了兩個大型動態手勢基準數據集EgoGestrue和 Chalearn IsoGD LAP。EgoGestrue是一個多模態的大規模數據集,包含83類靜態或動態手勢,由2081個RGB-D視頻、24161個手勢樣本和來自50個不同主題的2953224幀組成。手勢視頻來自6個不同的室內外場景,既包含靜態的背景,同時又包含室外的運動背景[9~10]。Chalearn IsoGD LAP數據集包括249類動態手勢,由21個不同的人執行,每個RGB-D視頻只代表一個手勢,共有47933個RGB-D手勢視頻[11~12]。

實驗使用兩顆Intel Xeon Gold 6142 Processor 32核心CPU,128GB DDR4 2666MHz RDIMM內存,Nvidia Titan RTX 24G顯卡。模型的訓練基于Win?dows操作系統和Pytorch框架,使用Python語言編寫代碼。EgoGestrue數據集的視頻參數為640×480@30fps,Chalearn IsoGD LAP數據集的視頻參數為320×240@15fps,將視頻幀剪裁至224×224輸入網絡,每個視頻片段平均分為4個片段,每個片段采樣一幀,批處理大小為32,初始學習率設置為0.01,每20個epoch(訓練周期)學習率衰減10倍,最終將訓練50個epoch。

實驗結果如表1所示,本文提出的方法在Ego?Gestrue上達到了88.8%的準確率,與表現最優的3D網絡模型僅相差0.5%的準確率;如表2所示,在Chalearn IsoGD LAP數據集上達到了69.3%的準確率,超過了使用C3D系列方法的準確率。訓練過程的精度曲線和損失函數曲線如圖2和圖3所示。考慮到本方法使用2D網絡進行分類訓練與測試,復雜度和數據量遠低于3D卷積神經網絡,在以視頻片段為樣本的訓練環境中是一種“性價比”較高的方法。

圖2 模型在EgoGestrue數據集上精度曲線和損失函數曲線

圖3 模型在ChaLearn IsoGD LAP數據集上精度曲線和損失函數曲線

表1 EgoGestrue數據集實驗結果

表2 Chalearn IsoGD LAP數據集實驗結果

4 結語

本文提出了一種基于TSM框架的動態手勢識別網絡模型,首先將視頻數據進行采樣得到關鍵幀,再送入殘差網絡來提取具有代表性的手勢特征,通過時間移位模塊從時間維度上融合手勢特征,從而進行動態手勢分類。在大型動態手勢數據集EgoGestrue和Chalearn IsoGD LAP上進行實驗驗證,準確率分別達到了88.8%和69.3%。雖然犧牲了一定精度,但模型所需數據量僅為RGBD模式下的一半,復雜度也相對更低,在這種情況下識別效果能夠超過3D網絡方法,并且接近RGBD模式下的最高準確率,體現了該方法的高效性。未來的工作將在RGB-D模式下進一步驗證該方法的性能表現,同時著重研究如何提升模型的精度。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产精品亚洲五月天高清| 性视频久久| 一本大道香蕉久中文在线播放| 国产男人天堂| 国产精品成人一区二区不卡| 欧美色视频网站| 精品少妇三级亚洲| 欧美成人精品一区二区| 亚洲国产成人精品无码区性色| 欧美亚洲欧美| 久久综合亚洲鲁鲁九月天| 人妻熟妇日韩AV在线播放| 青青草欧美| 亚洲欧美综合另类图片小说区| 精品欧美一区二区三区久久久| 国产成人综合久久精品尤物| 免费高清毛片| 亚洲欧美自拍中文| 国产亚洲精品在天天在线麻豆 | 国产一级一级毛片永久| 麻豆国产精品| 亚洲三级色| 国产一在线| 国产成人精品第一区二区| 国产在线观看人成激情视频| 国产精品熟女亚洲AV麻豆| 欧美亚洲中文精品三区| 最新亚洲人成网站在线观看| 视频国产精品丝袜第一页| 亚洲男人的天堂在线| 丁香六月综合网| 亚洲日韩日本中文在线| 国产日本一线在线观看免费| 国产女人18毛片水真多1| 成人福利在线看| 国产a在视频线精品视频下载| 99久久精品国产综合婷婷| 亚洲AV电影不卡在线观看| 精品第一国产综合精品Aⅴ| 四虎AV麻豆| 国产无码精品在线播放| 丁香亚洲综合五月天婷婷| 精品無碼一區在線觀看 | 国产在线观看一区二区三区| 日韩a级毛片| 国产精品主播| 亚洲 成人国产| 欧美a级完整在线观看| 国产麻豆永久视频| 亚洲成在人线av品善网好看| 精品剧情v国产在线观看| 在线视频亚洲欧美| 伊人久久久大香线蕉综合直播| 日本影院一区| 亚洲一区二区在线无码| 亚洲aaa视频| 国产激爽大片在线播放| 18禁黄无遮挡网站| 欧美日韩成人在线观看| 欧美日韩一区二区三区在线视频| 激情六月丁香婷婷| 9cao视频精品| 四虎永久免费在线| 国产欧美日韩视频一区二区三区| 欧美色图第一页| 国精品91人妻无码一区二区三区| 成人韩免费网站| 91视频区| 91无码人妻精品一区二区蜜桃| 美女免费精品高清毛片在线视| 伊人网址在线| 亚洲精品视频免费| 婷婷色婷婷| 九色91在线视频| 亚洲综合第一区| 国产网站一区二区三区| 日本高清有码人妻| 自拍偷拍欧美日韩| 啊嗯不日本网站| 欧美精品综合视频一区二区| 成色7777精品在线| 久久伊伊香蕉综合精品|