樊英澤,楊煉鑫,王彥博,張劍書
(南京工程學院,江蘇 南京 211167)
人體姿態識別就是通過視頻圖像或傳感器獲取人體關鍵點數據,構建人體骨架信息,并基于此判斷人體的姿態和行為。人體姿態識別在人機交互方面有著非常重要的作用,同時也在人體運動分析、康復訓練輔助以及智能安防等領域有著廣泛的應用前景。因此,人體姿態的估計與識別一直以來都是國內外專家學者關注的研究熱點。本文結合AlphaPose模型和支持向量機模型設計了一個人體姿態識別與標記系統。
目前,從原始數據獲取方式的角度來看,人體姿態分類方法[1]主要可以分為基于傳感器技術的方法[2]和基于計算機視覺的方法[3]這兩大類。基于傳感器技術的方法數據采集成本較高,且會影響運動的舒適性,因此更適合一些小規模少目標的專業運動分析領域。基于計算機視覺的方法可以讓目標對象擺脫交互設備的束縛,更適合應用于公共場所這類多目標的姿態識別。本文通過AlphaPose模型[4]進行姿態估計。AlphaPose模型提出了RMPE(region multi-person pose estimation,區域多人姿態檢測)框架來克服檢測框質量不高的問題,主要分為三個部分:SSTN, NMS, PGPG。這套方法能夠精確地將圖片里的人物框提取出來,并將其鼻子,眼睛,耳朵,肩部,肘關節,腕關節,髖關節,膝關節,踝關節相應的坐標檢測出來。
在利用AlphaPose模型提取目標關節點的位置信息后,根據各關節點的坐標向量即原始特征構造并提取出可用于人體姿態分類的有效特征,并通過SVM模型,結合訓練數據集以及篩選出的人體姿態特征,訓練人體姿態分類模型,實現基于AI的人體姿態分類。
本文設計和實現基于支持向量機的姿態識別及標記系統,其架構如圖1所示。從邏輯上分為四個功能模塊,即成員信息管理模塊、自定義文件標記模塊、任務文件模塊、姿態識別模塊[5]。

圖1 基于支持向量機的姿態識別及標記系統架構
(1)主界面。本系統為多人協同的圖片數據標記系統,用戶類型分為兩種,管理員和普通用戶成員,其中管理員擁有用戶管理和任務管理權限,普通用戶只擁有圖片標記權限。用戶登陸后可以選擇本地文件夾,對文件夾里的圖片進行識別和標記,也可以執行管理員分配的姿態標記任務[6]。此外,系統支持圖片識別與圖片批量識別功能,用戶可以進行圖片姿態識別。如圖2所示:

圖2 系統主界面
自定義文件標記模塊中,系統提供半自動標記功能,用戶可以自主選擇本地文件夾,然后對文件夾里的圖片進行識別和標記。自定義文件標記界面如圖3所示:

圖3 自定義文件標記界面
用戶可以點擊左側的輔助識別按鈕,調用系統中的識別模型對待標記的圖片進行預識別。識別結果將顯示在界面下方,用戶只需直接核對AI的識別結果。若結果有誤可點擊重置圖框按鈕并手動畫框,然后點擊修改按鈕,即可完成數據標記。用戶也可以不借助AI進行純手動標記,在圖片區域按住鼠標左鍵來框選目標所在區域,選中區域的左上角和右下角的坐標會顯示在圖片左側,再通過點擊下方的姿態按鈕來為當前圖片文件中的目標添加標簽[7]。
同時,用戶可以通過任務文件模塊選擇管理員發布的標記任務進行數據標記,如圖4所示:

圖4 任務標記界面
在任務文件模塊中,用戶也可以選擇調用AI輔助識別進行圖片姿態標記,具體功能和自定義文件標記模塊類似。
姿態識別模塊包括單張圖片識別和批量圖片識別兩個主要功能,調用已訓練好的支持向量機模型直接對圖片或文件夾中圖片進行標記并保存數據結果,如圖5、6所示。

圖5 圖片識別界面
在姿態識別模塊中,用戶可以自行載入文件夾,并使用AI對文件夾內的圖片進行定位和姿態識別,若結果有誤可以重置圖框并進行修改,最后保存結果數據[8]。
本系統實現了姿態估計和姿態分類,同時也提供了對人體姿態標記的功能。本系統提供半自動標記功能,既可以通過模型快速地識別并檢測出圖片數據中人類的姿態,也可以方便快速地為圖片數據中的人類目標添加位置標簽和姿態標簽。本系統提供的半自動化標記和多人協同標記可以在很大程度上提高圖片數據的標記效率和標記準確率。

圖6 圖片批量識別界面