楊光耀
(北京維周智能科技有限公司,北京 102600)
深度學習算法是當前計算機領域中實現視覺感知、目標識別等目標的常用方法,借助CPU 和GPU 強大的運算能力,通過模擬人體視覺、聽覺等復雜功能的物理作用機制來完成過去很多因受運算水平和認知深度限制而難以實現的任務。當一個運動的物體作用于人眼時,眼睛通過分析人體的關鍵特征點隨時間的變化趨勢,在動態標記特征點的基礎上對運動狀態進行識別,從而做出相應的判斷。基于特征變化規律的姿態識別是眼睛的主要功能,同時也是一個信息采集與深度加工的過程。在對眼睛物理機理和目標識別過程進行研究的過程中,有學者結合神經網絡運算方法提出了OpenPose 姿態識別算法。該文重點研究該姿態識別算法的實現過程。
OpenPose 是一個基于卷積神經網絡和監督學習的開源項目,主要用于人體姿態識別。該項目最早由美國卡耐基梅隆大學提出,既可以用于單人姿態識別,也可以用于多人姿態識別。該算法在線辨識人體在運動過程中產生的肢體、表情等部位的變化狀態,再通過卷積神經網絡進行特征提取與識別,經過在線訓練之后可以用于類似場景。OpenPose 可以對運動中的人體進行關鍵點自動辨識,在相同運動時間內采集多個關鍵點進行特征標記,之后對這些關鍵點進行持續跟蹤。在跟蹤過程中,對攝像機拍攝到的扭曲畫面進行參數評估和實時補償,最大限度地提升對人體姿態識別的精度。……