王 磊
(陜西警官職業學院,陜西 西安 710000)
當前,體育事業的快速發展使人們對運動項目的重視程度越來越高,運動員在訓練過程當中要嚴格按照規定做出特定的動作,但難免會做出錯誤動作。由于運動員的運動速度較快、訓練人數較多,因此教練很難在短時間內準確識別出錯誤動作,此時就需要依靠相關技術和算法來完成。
文獻[1]利用語義特征立方體切片技術對人體動作進行運動特征識別和提取。與時序分割網絡算法結合起來使用,選取InceptionV4主要網絡完成人體動作的表現形式描述和特征提取,并將其轉換為二維空間和時間上的特征圖切片;同時通過時空特征融合模塊,對提取的結果進行多維度切片的權重分配,從而得到人體動作的特征識別結果。該方法在不增加網絡參數量的前提下能夠快速捕獲人體運動信息,并且具有較高的識別效率,但是對識別設備要求較高,不利于大范圍推廣使用;文獻[2]利用深度學習算法對視頻中的人體動作進行識別。在模型中輸入信號的數量以及類型,引入特征提取算法,從三個維度分別對模型進行訓練,得到視頻中人體動作的特征和識別結果。該方法實現簡單,但是沒有事先對視頻圖像進行預處理,結果中含有的影響因素較多。
圖像視覺特征技術在特征識別、目標捕捉以及動態圖像重構等領域占據了舉足輕重的地位。為此文章利用圖像視覺特征技術對運動圖像進行重建和動作捕捉,從而優化文獻方法不足,在結合人體動態特征的基礎上,實現對錯誤動作特征的精準捕捉。該技術不僅可以規范運動員的訓練動作、提高訓練水平,還能夠準確判斷出錯誤動作,及時改正,提高比賽的公平、公正性。
圖像視覺特征技術捕捉運動員的錯誤動作,主要是依靠特征提取與建立坐標系實現的。對每個訓練動作提取關鍵關節部位的坐標點,通過對比標準動作的坐標點,來判斷其是否為錯誤動作。仿真分析也驗證了研究方法在圖像處理與特征提取和錯誤動作捕捉方面均具有非常明顯的優勢。
首先,通過體育訓練動作圖像做閾值分割處理,獲得二值圖像,再引入腐蝕算法,減少噪聲點和其他因素的影響。為了避免圖像邊緣部分對特征提取產生影響,利用圖邊緣標記和外邊緣跟蹤技術找到圖像的外邊界,對其進行填充并保存。完成圖像的預處理后,可得到若干個包含目標的內部連通圖像,從中選取待識別區域,進行特征提取,計算其形狀特征,完成匹配識別。
拍攝光線和角度的影響,運動員訓練圖像中可能會存在多個白色連通區域,對這些區域進行分析和特征提取十分困難,對錯誤動作捕捉來說也有很大影響。在捕捉過程中,連續兩幀下的目標動作不會有太大的差異。基于此,文章通過確定上一幀的目標動作位置信息,評判當前幀中目標動作的規范程度。同時在動作捕捉過程中實時確定目標動作的中心位置,及時校正和引導搜索方向和范圍。
根據式(1)計算待識別區域的+≤3階規則矩,由此得到與之對應的Hu氏不變矩,作為圖像識別特征向量。

(1)
式中,表示圖像中某個區域,其中任意像素點為(,),表示圖像的低階規則矩,表示Hu氏特征矩中的匹配函數值。
在文章中,將上一幀捕捉到的目標主體作為矩陣的基準,再結合相應歐式矩陣計算相似匹配度量函數:
=+
(2)
式中,表示前一幀目標圖像的特征量。表示目標圖像的數據節點。在Hu氏矩中隨機選取一個相似度閾值,當閾值大于時,認為該區域中包含目標動作;當閾值小于時,則認為該區域中不包含目標動作,進行下一個待識別區域的搜索。在實際的運用中,圖像中待識別區域數量的多少根據實際情況而定。
明確當前幀是否存在目標動作后,使用小波變換提取存在目標動作的特征,首先,對訓練圖像在不同尺度的帶通濾波器下做濾波處理,分解得到不同尺度下的圖像信號。其次,結合小波包分析算法,對圖像信號進行深入分析和挖掘,對圖像中的高頻部分做深入分解。實現過程如下所示
(1)首先,隨機選定一幅RGB圖像,按照R、G、B對其進行分解,得到、、三幅圖像;然后,分別針對每幅圖像做兩層小波包分解處理,得到每幅圖像中第二層的16個特征信號,分解結構圖如圖1所示。

圖1 二維圖像小波包分解三層分解樹結構圖
以圖像舉例說明,在圖1中,用(,)表示分解樹的結構,其中,表示層數=0,1,2,表示節點數=0,1,…,15。每個節點對應一個圖像信號特征,節點(0,0)代表圖像。
(2)結合小波包分解算法實現對信號特征的重構,明確每個頻帶內包含的信號特征。
(3)將各個頻帶內的信號整合起來進行總能量的計算。假設與2(=0,1,…,15)對應的總能量為2(=0,1,…,15),那么:
2=


(3)

(4)由于三幅圖像中包含的頻帶以及信號能量都不相同,以能量作為特征向量,構建過程如式(4)所示:
=[20,21,22,23,…,215,]
(4)
當信號能量較大時,2(=0,1,…,15)也為較大的數值,通過式(4)對其進行歸一化處理:
=[∑|2|2]
(5)
′=[20,21,22
,23,…,215]
(6)
向量′就是經過歸一化處理后得到的向量。
(5)對圖像、同樣進行歸一化處理,得到:

(7)

(8)
′、′、′就是體育訓練圖像的小波特征向量。
(6)根據形狀特征和小波特征得到原始圖像的特征向量為:

(9)
由于體育訓練項目眾多,每個項目的場地面積大小不同。通常情況下,比賽場地長寬分別為17m、12m,以場地中任意一個角作為坐標系的原點所在位置,得到如圖2所示的三維坐標系,圖中場地高度為5m。

圖2 訓練場地三維坐標系
運動員在訓練過程中會做出騰空的動作,在構建的三維坐標系內運動,可以更加清楚地掌握運動員所做的每一個動作。
在描述運動員訓練動作特征時,以騰空的標準動作為規范,對其中比較重要的關節部分進行標記,例如肩關節、手關節、腳關節和膝關節等,以便獲取更加清晰的訓練動作特征。重要關節部位標記過程如下所示。
(1)肩關節坐標點。
肩關節分為左肩和右肩,在標記坐標點時需要分開標記。文章將左肩的坐標點標記為(,,),右肩標記為(,,),用和分別表示左肩和右肩。
(2)手關節坐標點。
運動員在做騰空動作時,手關節是緊緊收縮在一起的,然后向某一個部分集中發力,完成該動作后,手關節鋪開,呈平面狀。手關節同樣分為左手和右手,用和表示,那么左手的坐標點標記為(,,),右手標記為(,,)。
(3)腳關節坐標點。
同樣用和表示左腳和右腳,將左腳的坐標點標記為(,,),右腳標記為(,,)。
(4)膝關節坐標點。
同樣用和表示左膝和右膝,將左膝坐標點標記為(,,),右膝標記為(,,)。
運動員在進行體育訓練時,需要按照標準執行動作,否則就會被認為是錯誤動作,影響后續訓練效果,嚴重還會導致扭傷。因此,需要利用小波特征提取錯誤動作數據,通過識別區域來捕捉錯誤動作的整體參數并進行小波分解,來進行當前幀訓練特征檢測,實現錯誤動作三維捕捉模型。圖像序列錯誤動作捕捉流程圖如圖3所示。

圖3 圖像序列錯誤動作捕捉流程圖
所以在發現錯誤動作時,要及時糾正。文章以體操中騰空動作為例,標準執行步驟共分為3步:
步驟一:首先向前助跑,然后左腿直接向前上方擺踢,右腿隨之離地騰空;
步驟二:左手、右手同時向上擺起,與此同時,右腳向前上方擺踢,高于右肩膀高度。左右手向上擺起后,將右手與右腳腳面相擊,此時,左腳保持腳尖向下的狀態;
步驟三:右腳著地后左腳隨之著地,完成一系列的騰空動作。
在這個過程中,如果運動員沒有按照標準執行,就會扣除相應的分數。常見的幾種錯誤動作如下所示:
(1)右腳高度低于肩膀高度:將騰空動作定義為,將定義為錯誤動作,表示動作特征。完成該動作涉及4個坐標點,左右腳尖和左右肩膀,通過對這4個部分在軸上的位置信息進行分析,即可確定運動員是否出現錯誤動作。評價方式分為以下兩種情況:


(2)相擊落地:將騰空動作定義為,定義為手掌,表示動作特征。該動作同樣涉及了4個坐標,兩個手掌和兩個膝關節。判斷是否為錯誤動作分為兩種情況:
情況一:當相擊落地是左腿時,左膝和左手的坐標點分別為(,,)、(,,),在執行該動作時,當≠、≠、≠時,即可判斷該動作為錯誤動作,當=、=、=時,說明該動作為標準動作。
情況二:當相擊落地是右腿時,右膝和右手的坐標點分別為(,,)、(,,),在執行該動作時,當≠、≠、≠時,即可判斷該動作為錯誤動作,當=、=、=時,說明該動作為標準動作。
通過上文的特征提取與錯誤動作分析,得到基于圖像視覺特征技術實現錯誤動作的智能化捕捉,在此之前,需要建立一個三維視覺捕捉模型。動作捕捉采用的是貝葉斯算法,實現過程如下所示。
將(,,…,)和(,,…,)定義為錯誤動作的屬性和模式向量,將定義為訓練動作模式類型,根據訓練項目的不同可以分為多個不同的類型,用,,…,來表示。通過分析錯誤動作屬性,可得到個判斷函數,用1(),2(),…,()來表示。根據貝葉斯算法準則,動作模式的屬性分類,即可得到如式(10)所示的三維視覺判別函數:

(10)
用(|)表示錯誤動作的后驗條件概率值,即可得到如式(11)所示的當前幀中(|)的公式:

(11)
式中,()表示動作發生的證據因子,()表示動作發生的錯誤序列。計算公式如式(12)所示:
()=(|)*
(12)
式中,表示錯誤動作檢測系數,通過錯誤動作三維捕捉模型,得到錯誤動作的三維視覺檢測模型如式(13)所示,

(13)

為了驗證所研究方法的可行性,在圖像預處理和錯誤動作捕捉方面進行實驗驗證。
首先在圖像預處理與特征提取方面進行實驗驗證。選取的訓練圖像如圖4所示,識別的目標是圖片中運動員,其他信息均為雜質,特征提取識別結果如圖5所示。

圖4 實驗圖像
圖5(a)為經過閾值分割后,主體目標和噪聲點同時存在的二值圖像;圖5(b)是經過濾波處理和區域連通后進行孔洞填充的結果;圖5(c)中矩形框內的人物是經過預處理和形狀識別后得到的目標主體。可以得出,圖5(c)中突出了主體目標,去除了其他雜質和噪聲點的影響,為后續進行錯誤動作捕捉做好了基礎工作。

(a)閾值分割
為了驗證所研究方法在錯誤動作捕捉方面的性能,隨機選定了600個體操動作數據集,其中樣本數據集為480個,測試數據集為120個。識別結果如圖6~圖8所示,圖中左側均為標準動作,右側均表示研究方法捕捉到的錯誤動作。

(a)標準動作 (b)捕捉到的錯誤動作
對比圖6(a)和圖6(b),可以發現圖6(b)中運動員的兩個手掌均沒有向前方伸平,與標準動作不符,即可判定該動作為錯誤動作,按照比賽規定應扣除相應的分數。
對比圖7(a)和圖7(b),可以發現圖7(b)中運動員的兩只腳與單杠之間的距離過于接近,且高度過低,與標準動作不符,可能會影響到下一步的動作,甚至會出現觸碰單杠的情況,導致嚴重的比賽失誤,甚至使運動員受傷。

(a)標準動作 (b)捕捉到的錯誤動作
對比圖8(a)和圖8(b),兩幅圖片可以發現圖8(b)中運動員支撐地面的腿與標準動作不符,沒有呈現與地面垂直的情況,并且出現了腿部彎曲。可能造成的后果是腳踝扭傷甚至摔倒,不論出現哪種情況,都會對運動員的身體造成一定的傷害。

(a)標準動作 (b)捕捉到的錯誤動作
利用圖像視覺特征技術對體育訓練錯誤動作進行捕捉。首先,對圖像進行預處理和特征提取;其次,建立訓練場地三維坐標系,對每個動作的關鍵關節部位進行坐標點的標記,通過對比標準動作坐標點的位置,即可判斷該動作是否準確。仿真分析中,通過與傳統方法展開對比,文章所研究的方法展現出了較高的捕捉精度。