黃重宇
重慶交通大學機電與車輛工程學院,重慶 400074
由于人口老齡化和工作強度的增加,造成人體運動能力不足、肌肉萎縮乃至截肢等現象增加,而相關人群無法擁有正常的生活動作能力。伴隨近年來可穿戴設備如外骨骼穿戴式機器人的發展,其通過感知人體的生物信號進行模式識別,最終提供相應輔助的能力,為人群恢復正常動作能力提供了重要的幫助[1]。
表面肌電信號(surface electromyography,sEMG)是一種良好的能反應人體肌肉活躍水平的生物電信號,由于其蘊含信息豐富和測量無侵入性的優點受到模式識別領域廣大技術人員的關注。基于sEMG信號的模式識別最終目的在于為機器人提供控制源,使機器人感知人體運動趨勢,為人體運動提供助力,精確的模式識別不僅可有效提高設備的助力能力,對實現柔順助力、促進身體運動水平恢復也至關重要[2]。
雖然目前基于sEMG信號的模式識別方法有了不錯的進展,但現有的下肢動作模式識別方法仍然存在動作類別少、肌電信號數據量不足、特征融合冗余及分類器識別率低等問題[3]。本文針對以上問題,采集爬坡、上樓、下樓及平地行走4種動作的下肢sEMG信號,通過綜合考慮特征相關性和任務貢獻度,構建了一組優異的特征組合作為分類器的輸入,旨在有效提高動作模式分類識別的精度與效率。
針對基于sEMG信號的下肢動作模式識別研究中動作類別不足的問題,本文采集了人體下肢4種動作(爬坡、平地行走、上樓、下樓)的sEMG信號以進行后續動作模式識別特征融合方法研究。采用OT Bioelettronica表面肌電記錄設備采集受試者在運動過程中的股直肌(RF)、股外側肌(VL)、股內側肌(VM)、股二頭肌(BF)、內腓腸肌(MG)、外腓腸肌(LG)、脛骨前肌(TA)7塊肌肉[4]的肌電信號,采樣頻率設置為2 048 Hz。受試者包括10名年輕受試者,年齡23~25周歲,身高156~185 cm,體質量45~80 kg,均無過往病史。且每種動作每人采集5~10組,每次組間休息3 min,以避免肌肉疲勞的影響,同時為了排除汗液的影響,在采集開始前使用酒精擦拭并待其自然風干,以降低靜電干擾[5]。
sEMG信號是一種由神經肌肉系統產生的微弱的生物電信號,其幅值范圍在0~5 mV,頻率在0~500 Hz,主要能量集中在20~150 Hz[6],同時由于sEMG信號是一種具有隨機性且不平穩的信號,在采集過程中極易受到外界噪聲干擾,因此須對其進行去噪處理。
對原始信號(見圖1)及其頻譜圖(見圖2)進行分析,發現采集的sEMG信號能量主要集中在20~400 Hz且存在明顯基線漂移,所以對信號進行20~400 Hz的巴特沃斯帶通濾波去噪處理,濾波效果如圖3所示,可以明顯觀察到原始sEMG信號的基線漂移問題得到了解決,且毛刺相對原始sEMG信號明顯減少,證明20~400 Hz的帶通濾波具有一定有效性。

圖1 原始sEMG信號

圖2 頻譜圖

圖3 濾波前后對比圖
目前常見的特征包括時域特征、頻域特征和時頻域特征等,而為了保證分類識別的實時性,應該選擇計算耗時少的特征[7],因此本文僅對時域特征進行分析,并采用重疊窗口[8]提取特征,窗口長度選擇500,步長選擇250,重疊部分為50%。現提取以下時域特征進行特征分析,其中定義xi表示sEMG信號中第i個樣本點的幅值,Ni為該時間窗內的采樣點個數,sgn(x)表示符號函數。
1.3.1 絕對平均值
sEMG信號的絕對平均值(MAV)反應了肌肉的作用力大小,即:
(1)
1.3.2 均方根值
均方根值(RMS)能夠代表sEMG信號的有效值,反應其高斯分布特性,即:
(2)
1.3.3 方差
sEMG信號的方差(VAR)反應了sEMG信號幅值的變化程度,即:
(3)

1.3.4 過零點數
sEMG信號經過零點的次數(ZC)反應信號波動的劇烈程度,即:
(4)

1.3.5 積分肌電值
積分肌電值(IEMG)大小反應了肌肉的活動程度。
(5)
1.3.6 波長
波長(WL)屬于信號的波形特征,反應sEMG信號的振幅信息和波動頻率信息,即:
(6)
1.3.7 斜率符號變化次數
sEMG信號的斜率變化次數(SSC)直接反應sEMG信號的變化程度,即:
(7)

特征融合是將多種特征結合在一起,以實現從數據不同層面進行綜合信息提取,形成一個更全面的特征表示方法。然而現有特征融合方法鮮有考慮特征之間的相關性以及特征對于任務的貢獻度,多是簡單將不同特征直接拼接在一起,此種方法極易造成特征數據冗余、模型過擬合或計算資源浪費。因此在本文中首先對已提取特征數據(各類別樣本數均為4 096)進行斯皮爾曼相關系數計算來衡量相關性大小,計算公式如下所示。
(8)
式中:rs表示相關系數,di表示每對特征數據的秩差,n表示樣本大小。其中相關系數大于0為正相關;小于0為負相關;越接近±1,代表量2組變量之間相關性越強;越接近0代表2組變量相關性越弱。
由圖4特征相關性熱力圖可以看出,特征IEMG、MAV、RMS、VAR、WL之間相關性較高,而SSC、ZC與其相關性較低,因此只保留IEMG、MAV、RMS、VAR、WL中的1個特征,而對SSC和ZC暫時均保留。

圖4 特征相關性熱力圖
為了評估各特征在下肢動作模式識別任務中的貢獻度,本文使用MATLAB搭建4種常見機器學習模型,包括決策樹、線性判別器、支持向量機及K近鄰,以4種模型的平均分類精度作為衡量特征任務貢獻度的指標,并在后續對比實驗中使用該4種模型。
首先本文將各特征數據集及其標簽進行隨機打亂處理,按照8:2的比例劃分為訓練集和測試集,訓練集用于模型的訓練和優化,測試集用于評估模型的性能和泛化能力。為減少隨機誤差采用交叉驗證的方法進行多次實驗,以提高模型的分類穩定性。平均分類精度如圖5所示。

圖5 特征精度圖
由圖5可知,特征貢獻度從大到小為:ZC>WL>MAV>IEMG>RMS>VAR>SSC。結合前述相關性結果最終選擇特征“ZC+WL”作為特征融合的結果。
為了說明特征有針對性融合的優勢以及相比原始信號直接輸入模型的優勢,本文添加2個對照試驗,分別為使用原始信號(各類別樣本數為317 440)作為輸入以及將所有特征直接拼接融合作為輸入的試驗,其分類精度以及平均耗時如表1所示。

表1 分類精度及耗時
結果顯示:與單一特征輸入相比,A、B這2種特征融合均顯現了特征融合的優勢,不僅提高了分類精度,同時也增加了訓練效率,確保了實時性。相較于直接將原始數據輸入模型,采用特征組合作為輸入不僅減少了數據量,降低了運算時間,還提供了更有效的信息,顯著提高了分類精度。而相對于將所有特征直接拼接融合,通過從特征的相關性和任務貢獻度出發,進行特征篩選得到的最終特征組合集在分類精度上變化微小,同時大幅度減少了耗時,既保證了精確性又保持了實時性。
本文提出了一種基于特征相關性和任務貢獻度的特征篩選方法,并在此基礎上實現了多特征融合的下肢動作模式識別。首先采集爬坡、平地行走、上樓以及下樓4種動作的下肢肌電信號作為實驗數據,并對數據進行含噪分析和去噪處理,然后提取了實時性較高的時域特征。通過斯皮爾曼相關系數計算特征之間的相關性,刪除冗余特征以避免特征集合維度爆炸和模型過擬合,接著結合機器學習模型檢測特征對于任務的貢獻度,通過單一特征貢獻度進一步篩選獲得最終的特征組合。試驗結果表明,相較于傳統的單一特征和原始信號,以及直接將所有特征拼接的方法,本文中的方法在分類精度和實時性方面均表現更優,可為特征篩選和多特征融合模式識別領域提供一定參考價值。