閔玉寒,張國興,張磊
(1.山東省濟寧市微山縣第一中學,微山277600;2.中國礦業大學計算機學院,徐州221116)
人體活動識別是近年來的研究熱點[1]。活動識別的目的是識別用戶不顯眼的活動或者行為,并對這些行動采取必要的響應[2]。目前,人體活動主要有三種方法:基于視頻的方法[3]、基于環境傳感器的方法[4]、可攜帶傳感系統方法[5]。基于加速器的活動活動識別方法雖然能夠提供更高的識別率,然而對長期的活動監控是不可行的[6]。相比之下,安裝在腰部、胸骨或者背部的加速計能夠較好地識別基礎活動(如站立、走路、跑步),但在基礎活動的過渡過程和動態活動中(如上樓、下樓)識別較差。從頻率或者時間域提取的特征具有不同的準確率。頻率域特征需要大量的排列組合來識別活動,因此其時間復雜度太高。時間領域的特征可以從時間序列中很容易的提取出來且計算復雜度較小。然而,用這些特征進行識別時準確率不高。
針對以上問題,本文將樣本熵[7]引入到人體活動識別領域,因為樣本熵作為時間序列穩定性的度量能夠檢測出時間序列發生異常的時間點,從而實現長期的人體活動識別,并且通過觀察排列熵,樣本熵對測試準確率的影響來判斷其有效性。
樣本熵是一種非線性的度量序列的復雜度和統計量化的動力學參數,用一個非負數來衡量一個時間序列的復雜度,反應時間序列中的新信息率。樣本熵對時間序列的長度要求不高,可以用于長度較短的時間序列的檢測。
采用樣本上從活動序列數據抽取樣本熵特征,算法如下:
(1)設原始時間序列為{Y(i),i=1,2,…,n},共 n 個點。將時間序列進行重構,得到重構矩陣X(i)。

其中,j=1,2,3…,K,m為嵌入的維數,τ為延遲時間,K=n-(m-1)τ。
(2)定義重構矩陣的兩個向量X(i)與X(j)之間的距離d[X(i),X(j)]為兩個向量對應元素中差值最大的一個。即:

(3)對于給定閾值r,對于每個值統計d[X(i),X(j)]小于r的數目及此數目與距離總數n-m的比值,記為,即:

其中 i=1~n-m+1,i≠j。

(5)則此序列的樣本熵為:

將其表示成:

極限學習機(ELM)是一種新的前反饋神經網絡方法。該方法通過隱藏層輸出矩陣的廣義逆操作進行分析確定,用最快的速度提供最大的泛化能力[8]。本文采用EML作為活動識別分類器。
對于N個不同的樣本(xi,ti)∈Rn×Rm有L個隱藏節點的輸出函數G(ai,bi,x)的SLFNs可以用下面的公式來建模:

其中(ai,bi)是隱藏節點的參數,βi是第i個隱藏節點和輸出節點的權重向量。

H是神經網絡隱藏層的輸出矩陣,H矩陣的第i列是和x1,x2,…,xN關聯的第i個隱藏節點的輸出。
實驗采用UCI HAR Dataset數據集,該數據集包含30名志愿者的活動數據。他們攜帶著智能手機完成了六個動作。通過嵌入在手機上的加速度計和螺旋儀,獲取三軸向線性加速度和三軸角速度,通過視頻標識給活動類別加標簽。將實驗數據隨機分為兩組,70%的數據作為訓練集數據,其余30%的數據作為測試數據。
為了驗證本文方法,將ELM和SVM(支持向量機)相比較。首先用其原始數據進行實驗,將原始數據直接輸入到SVM、ELM。將原始數據進行了預處理,形成了長度為256的時間序列,實驗樣本有5159個。實驗結果如表1:

表1 原始數據訓練結果
從表1可以看出,用原始數據進行訓練,準確率很低,最好情況不會超過30%。
對原始數據進行提取,計算其樣本熵(SE)。將時間序列的長度擴大到512,樣本數目有2579個,其SE如表2。

表2 長度為512時計算結果表
其中,維數取值為5,SE中的維數取值為2,r取值為0.2std。從表2中的數據我們可以看出,Walking、Upstairs、Downstairs的熵值較小,說明其時間序列的復雜度較小,而 Standing、Sitting、Laying的熵值較大,說明其時間序列的復雜度較高。
對SE進行學習,其結果在表3中顯示。

表3 長度為512時機器學習的結果表
從上表中看出,對比原始數據,SE能明顯的提高測試準確率。且ELM準確率高于SVM。
通過實驗不難看出,樣本熵作為人體活動識別過程中的一個重要處理過程,可以顯著的提高人體活動識別的準確率。
本文將樣本熵引入到人體活動識別的領域,通過計算活動序列數據的樣本熵作為序列特征,采用ELM作為分類器,提出了基于樣本熵和ELM的人體活動識別方法。在UCR數據集上的測試結果表明:本文方法較好地提高了人體活動識別的準確率。
[1]Reyes-Ortiz J L,Oneto L,Samà A,et al.Transition-Aware Human Activity Recognition Using Smartphones[J].Neurocomputing,2016,171(C):754-767.
[2]馮輔周,饒國強,司愛威,孫野.排列熵算法的應用和發展.裝甲兵工程學院學報,2012,26(2).
[3]凱澤斯.視頻監控系統的活動識別和檢測的概念及設計[J].數碼世界,2015(10):33-34.
[4]王金甲,孔德明,劉建波,等.基于傳感器數據的人類活動識別研究[J].高技術通訊,2016,26(2):207-214.
[5]劉斌,劉宏建,金笑天,等.基于智能手機傳感器的人體活動識別[J].計算機工程與應用,2016,52(4):188-193.
[6]Chen C,Jafari R,Kehtarnavaz N.A Survey of Depth and Inertial Sensor Fusion for Human Action Recognition[J].Multimedia Tools&Applications,2016:1-21.
[7]Ahmad R F,Malik A S,Amin H U,et al.Nonlinear Features Based Classification of Active and Resting States of Human Brain Using EEG[C].IEEE International Conference on Signal and Image Processing Applications.IEEE,2016:264-268.
[8]Guang-Bin Huang,Qin-Yu Zhu,Chee-Kheong Siew.Extreme Learning Machine:Theory and applications,ScienceDirect Neurocomputing 70 2006:489-501.