蔣思琪,王向勇
(江蘇省郵電規劃設計院有限責任公司,江蘇 南京 210019)
隨著21世紀科學技術的飛速發展和計算機設備的普及,人體行為識別已經成為眾多國家重點關注和研究的對象,其對改善人類的生產生活有著巨大的意義。所謂人體行為識別,是指對觀測對象(主要是人)的動作類型和行為模式進行認知與識別,其數據來源通常是圖像、可穿戴的傳感器設備、視頻信號、無線信號等。人體行為識別是一門涉及多學科、跨越多領域的研究內容,它包括模式識別、計算機視覺、人工智能、機器學習、傳感器技術等。它的應用領域主要包括智能家居、體感游戲、個性化應用、人體姿態監護等。傳統的基于視覺的行為識別技術易受光線、視距傳播等因素的影響,而基于傳感器的行為識別需要使用者佩戴專用設備,影響了行為識別技術的推廣。WLAN環境下基于CSI的人體行為識別技術以其成本低、隱蔽性好、環境適應性強等優勢,近年來受到廣泛的關注。本文研究WLAN環境下基于CSI的人體行為識別方法。該方法首先對人體行為的CSI信號進行分析,然后利用滑窗提取CSI信號特征,利用核密度估計方法求出檢測門限,最后利用DTW算法進行人體行為識別。根據真實環境數據驗證表明,本文提出的基于CSI的人體行為識別方法識別率高,系統魯棒性強。
如圖1所示的環境,環境中包括靜態反射物(墻)和動態反射物(人),接收端解算出來的CSI數據應該是多條路徑信號的疊加,可表示為:
H(fj,t)=|H(fj,t)|×arg(H(fj,t))
(1)


圖1 CSI信號傳播環境

圖2為人對CSI鏈路進行干擾前后,CSI信號幅值的變化情況。從圖中可以看出,在無人干擾時,CSI的幅值|H(fj,t)|處于一個相對平穩的狀態;當人對鏈路進行干擾時,|H(fj,t)|的抖動要明顯強于靜默階段,通過提取|H(fj,t)|的抖動特性,可以判斷當前時刻目標是否有目標(行為)。

圖2 人干擾鏈路前后CSI幅值的變化
通過上節的分析可知,信號的抖動性能夠衡量當前時刻是否有目標(行為)。基于此,本文將通過CSI幅值|H(fj,t)|的變化進行分析用以判斷當前鏈路中是否有目標(行為)。為此首先需要提取CSI信號流中蘊含的可以表征抖動性的信息,實現信號特征的提取。
信號流是指接收端在一段時間內采集到的按照時間順序排列的|H(fj,t)|數據序列。它的特點是數據量很大并且容易受到噪聲影響,如果直接對其進行計算,不僅不能保證系統的實時性,而且很容易使行為數據淹沒在靜默數據中。因此,系統首先需要利用滑動窗口(簡稱滑窗)技術,對滑窗內數據流的變化情況進行提取,分析短時間內的信號抖動情況。
滑窗是對窗內包含的短時間的CSI數據進行特征提取,滑窗技術及信號提取的示意圖如圖3所示。

圖3 滑窗提取信號特征示意圖
如圖3所示,對于第j個子載波,假設接收端獲取到n+l-1個CSI幅值數據,則需要利用n個長度為l的滑窗對這些樣本數據進行處理,每個滑窗Wj,i通過特征提取函數g(Wjn)來計算特征xj,i。
方差是在概率論和統計中衡量隨機變量或一組數據離散程度的度量,它可以反映滑窗內信號的抖動性。因此,本文選取滑窗內方差作為刻畫信號抖動性的度量標準。其計算公式如下:
(2)
(3)
要進行行為提取,首先需要區分靜默狀態和行為狀態。通過前面的分析可知,行為狀態下CSI信號的抖動性要強于靜默狀態,因此,可以通過核密度估計方法,求出靜默狀態下的滑窗方差的分布模型,從而求取檢測門限,以判決是否有行為。
核密度估計方法是一種非參數統計的方法,它是根據待估樣本的自身屬性來確定其分布的情況,相比于參數估計法,該方法不需要樣本的先驗知識和預先對參數進行設置,適合對大量數據進行概率密度估計。
在非參數核密度估計中,CSI接收端接收到n+l-1個信道頻率響應值H(f,t)作為樣本,利用公式(2)和公式(3)對樣本進行信號特征提取,然后利用公式(4)的核密度估計函數對提取出的n個滑窗方差xj,1,xj,2,…,xj,n的概率分布進行估計:
(4)

由式(4)可知,非參核密度估計可以將離散的特征參數的概率密度連續化。在非參數核密度估計中,認為當前觀測值的真實值可能是周圍的某一個值,且該真實值的概率是由核函數反映的,核密度估計的原理圖如圖4所示。

圖4 核密度估計原理圖
由上面的分析可知,利用核密度估計方法來對樣本進行估計,核函數與帶寬hj的選擇決定著估計出的概率密度曲線是否靠近真實情況。
對于核函數,一般只需滿足對稱性和歸一性,其效果差異不大,本文選取高斯核函數,公式如下:
(5)

(6)

在得到概率密度分布后,其檢測門限可設定為Kj,利用公式(7)和公式(8)求取檢測門限了。
(7)
kj=F-1(1-α)
(8)
這里Fj(x)表示第j條鏈路的累積概率分布函數。檢測門限kj為其α下分位數,α一般取0.05。最終結合多個子載波的檢測門限,求取聯合檢測門限kopt。
(9)
在行為提取階段,CSI幅值|H(fj,t)|的方差δt要不小于檢測門限kopt,于是通過檢測δt≥kopt的一段數據,即可得到行為階段對應數據,其過程可由圖5描述。

圖5 在線行為提取流程圖
圖中陰影部分是為了防止偶然誤差導致行為提前開始或提前結束而設置的緩存帶,行為提取的具體步驟描述如下。
步驟1:利用公式(2)和公式(3)計算當前時刻各個子載波的方差,并計算其和,得到聯合方差δt;
步驟2:初始化緩存帶,即cache=0,并設定緩存帶大小S;
步驟3:比較δt與公式(9)計算出的檢測門限kopt的大小,若δt≥kopt,cache=cache+1;否則,t=t+1,跳轉到步驟1;
步驟4:觀察緩存帶是否已滿,若cache>S,表示緩存帶已滿,記錄當前時刻為開始時刻t0;若cache≤S,表示緩存帶未滿,cache=cache+1,t=t+1,計算當前時刻的δt,跳轉到步驟3;
步驟5:清空緩存帶cache=0,t=t+1,計算當前時刻的δt;
步驟6:比較當前時刻的δt與檢測門限kopt的大小,若δt 步驟7:觀察緩存帶是否已滿,若cache>S,表示緩存帶已滿,記錄當前時刻為結束時刻t1;若cache≤S,表示緩存帶未滿,cache=cache+1,t=t+1,計算當前時刻的δt,跳轉到步驟6; 步驟8:提取原數據中的t0~t1時間段的數據。 至此,行為提取就完成了。 由于不同行為的序列長度不一致,導致傳統的曼哈頓距離、歐式距離、切比雪夫距離等距離計算方式都無法使用,為此研究者提出使用DTW算法來計算行為特征序列之間的相似度。DTW算法是一種常用于語音識別中來解決發音長短不一導致的語音序列不等長的模板匹配算法,其特點是使用該算法時系統不需要提前對樣本序列進行訓練。其核心思想是:相同行為的特征序列具有非常相似的形狀,但是其形狀并不是完全對齊的,所以在計算相似度時需要先將兩個序列中的某一個(或者兩個)扭曲,以達到更好的對齊。假定Q={q1,q2,…,qi,…,qm},C={c1,c2,…,cj,…,cn}為兩種行為的特征序列,利用公式(10)得到匹配度矩陣G。 (10) 式中,d(i,j)表示qi和cj的距離,一般情況下d(i,j)=|qi-cj|;G(i,j)表示序列{q1,q2,…,qi}與序列{c1,c2,…,cj}的匹配度。通過遞推,計算得到G(m,n)即為兩段序列的匹配度。計算過程的示意圖如圖6所示。 圖6 DTW計算過程 如圖6所示,兩段特征序列的最終匹配度為2,虛線箭頭為其計算過程。 (11) (12) 式中, (13) DTW算法需要結合KNN等算法使用,在在線階段通過DTW算法來計算特征相似度,完成人體行為的識別。 為了驗證本章行為提取算法的有效性,選擇兩種具有代表性的實驗測試環境進行算法的驗證和行為提取系統的性能分析。測試環境1選擇在面積大小為40 m×30 m的廣場,該環境為室外空曠環境,障礙物較少,多徑分量也較少,實驗中發射機與接收機之間相距10 m。測試環境2選擇在面積大小為15 m×8 m的室內辦公場所,該環境擺設物較多,環境相對比較復雜,實驗中發射機與接收機之間相距8 m。圖7分別展示了兩種典型實驗測試環境的結構圖。 圖7 兩種典型的實驗環境平面結構圖 本文的實驗主要是檢測人的各種行為,故在測試時接收機與發射機的離地高度為1.2 m。接收設備與發射設備均為配有intel 5300網卡的ProBox23 MS-B083迷你主機,發射機與接收機均采用單天線結構。 本文采集了日常生活中常見的5種行為:走、跑、坐下、蹲下、倒下,在室外空曠和室內多徑兩個環境中分別建立行為數據庫。以室外環境為例,該數據庫中包含了上述5種測試行為,每種行為30組,共計150組行為,每組行為的采集時間長短不一致。測試數據邀請不同的志愿者測試這5種行為,每種動作采集100組,共計500組測試行為,接收數據頻率為1 000 Hz,測試行為前后均有一段靜止時間。 根據以上診室采集的數據進行算法驗證,對室外空曠環境中測試的{走、跑、坐下、蹲下、倒下}各個行為的識別率如圖8所示。 綜合所有行為,算得的整體識別準確率為89.8%。 對室內多徑環境中測試的{走、跑、坐下、蹲下、倒下}各個行為的識別率如圖9所示。 在室內多徑環境內,綜合所有行為算得的整體識別準確率為89.0%。 綜合室外空曠環境和室內多徑環境下行為識別準確率可知,本文提出的WLAN環境下基于CSI的人體行為識別方法能夠有效識別人體行為,算法魯棒性高。 圖8 室外空曠環境行為識別準確率 圖9 室內多徑環境行為識別準確率 由于目前人體行為識別技術在智能家居、體感游戲、個性化應用、人體姿態監護等領域的需求越來越大。本文研究了一種WLAN環境下基于信號狀態信息的人體行為識別方法。該方法首先對人體行為的CSI信號進行分析,然后利用滑窗提取CSI信號特征,利用核密度估計方法求出檢測門限,最后利用動態時間規整算法進行人體行為識別。在真實實驗場景下分別采集室外空曠、室內多徑環境下走、跑、蹲、坐、倒五種行為的WLAN數據進行驗證,實驗結果表明本文提出的WLAN環境下基于CSI的人體行為識別方法能夠有效識別人體行為,具有較高的算法魯棒性。 參考文獻: [1]Aggarwal J K, Ryoo M S. Human activity analysis: Areview[J]. Acm Computing Surveys, 2011, 43(3): 16. [2]Tahmina Zebin, Patricia J Scully, Krikor B Ozanyan. Human activity recognition with inertial sensors using a deep learning approach[C]. IEEE SENSORS. Orlando: IEEE, 2016. [3]Scott D W. Scott's rule[J]. Wiley Interdisciplinary reviews computational statistics, 2010, 2(4):497-502. [4]谷雨, 權良虎, 陳孟妮,等. 基于WLAN背景噪音的被動式人體行為識別研究[J]. 中國科學技術大學學報, 2015, (4): 308-313.5 基于DTW的人體行為識別算法



6 算法驗證與分析
6.1 實驗環境

6.2 實驗數據采集與處理
6.3 實驗結果分析


7 結束語