賴佳磊, 陽召成, 鮑潤晗, 周建華
(深圳大學電子與信息工程學院, 廣東深圳 518060)
人體的日常活動包含著大量信息,是與外界信息交換的重要方式,能夠在特定場合直觀地傳遞有效信息。人體活動監(jiān)測在安防監(jiān)控、人機交互、醫(yī)療監(jiān)護等領(lǐng)域中發(fā)揮著重要的作用。因此,近年來隨著智能物聯(lián)網(wǎng)的普及和發(fā)展,人體活動分類的問題也成為研究的一大熱點。雷達傳感器以其獨有的優(yōu)勢吸引了許多研究者的目光,利用雷達進行人體活動分類的研究也不斷涌現(xiàn)。雷達進行人體活動分類通常包含兩步:一是人體目標檢測;二是活動分類。
對于人體目標檢測,常見的檢測器如恒虛警檢測器(Constant False Alarm Rate,CFAR)被廣泛應用。CFAR檢測器是指假定噪聲服從某一分布時,設定恒虛警概率對輸入信號進行判別,最后進行目標檢測的方法。文獻[1]利用改進的CFAR檢測器,提出了一種新的基于可變窗口的CFAR圖像艦船目標檢測算法,其仿真結(jié)果表明該算法的優(yōu)越性。在文獻[2]中,對數(shù)排序統(tǒng)計恒虛警檢測器(Ordered-Statistic Constant-False-Alarm-Rate,OS-CFAR)用于每幀距離單元的有效點檢測,進行人體目標探測和跟蹤。
對于活動分類,大部分學者利用微多普勒效應對人體雷達回波進行特征提取,進行目標的活動分類。人體的微多普勒效應最早由Chen[3]提出,是指由于人體這種多散射點目標對雷達有著不同的徑向速度,因此能夠產(chǎn)生不同多普勒頻移的效應。文獻[4]則進一步提取微多普勒特征,采用支持向量機(Support Vector Machine,SVM)分類器對人體動作進行分類。隨著深度學習的發(fā)展,越來越多研究者采用卷積神經(jīng)網(wǎng)絡(Convolution Neural Network,CNN)這種分類器,利用人體微多普勒信息進行人員的活動分類[5-8],并且都取得了可觀效果。在文獻[9]中,作者利用多個雷達傳感器對微多普勒特征采用長短期記憶神經(jīng)網(wǎng)絡(Long Short-Term Memory,LSTM),也取得了較好的性能。然而,雖然深度學習在一定程度上取得了很好的效果,但是這種處理方法需要消耗較大的計算資源,并不一定能夠保證實時性的計算結(jié)果。在智能物聯(lián)網(wǎng)應用中,邊緣計算在傳輸和延時方面是明顯優(yōu)于云端計算的。因此,提供一種低復雜度、計算需求小的活動分類方法,在一定程度上能夠完成物聯(lián)網(wǎng)終端邊緣計算的目標。
本文提出一種基于脈沖超寬帶(Impulse Radio Ultra-Wideband,IR-UWB)雷達的低復雜度室內(nèi)人員日常活動分類方法。該方法首先利用改進的OS-CFAR檢測有效距離單元目標;其次,提取基于平均多普勒頻率、信息量和多普勒能量的3種微多普勒特征進行動靜目標粗分類;最后,對于動目標采用兩個細胞單元的長短期記憶神經(jīng)網(wǎng)絡(LSTM)對人體活動進行細分類。日常人體活動類別有:靜止、走路、坐下和起立。實驗結(jié)果表明:細分類別下(走路、坐下和起立)的測試準確率能夠達到92.52%。
基于對人體探測安全的考慮,本文選用Novelda公司生產(chǎn)的X4M03[10]雷達模塊,該雷達模塊的功率僅為118 mW,具有低功耗的特點。X4M03雷達模塊是發(fā)射高斯包絡的脈沖多普勒雷達,其載頻為7.29 GHz,信號有效帶寬為1.4 GHz,硬件射頻采樣率為23.328 GHz。發(fā)射信號模型如下:
(1)
式中,V為電壓值,t為快時間,ωc為載頻,τ由雷達帶寬fb決定,表示為
(2)
對于回波信號,首先硬件對回波進行采樣得到射頻信號。接著對射頻信號進行移動平均雜波抑制去除背景靜止雜波[2],利用數(shù)字混頻獲得包絡信息,由此取模得到慢時間-距離圖(以下簡稱時距圖)。
如圖1所示,本文實驗是針對室內(nèi)環(huán)境下人體活動展開探測。因此,該場景不僅會有很多強的靜止雜波,還會有大量多徑效應存在,將對識別產(chǎn)生強干擾。為了去除雜波信息和避免雷達多徑效應對人體微多普勒信息的干擾,這里利用幅度拐點的OS-CFAR檢測器對雷達時距圖進行目標檢測。

圖1 實驗場景
首先,對每一幀多個距離單元的幅度進行排序,求排序后的二階導數(shù),進而得到拐點。將拐點對應的幅度提取出來。如果排序后沒有拐點,則說明該幀很大概率沒有目標信息,此時取最大幅度代替拐點幅度。由此,每一幀都將得到一個幅度排序后拐點的值。
其次,以滑窗的形式,每窗積累20幀數(shù)據(jù)統(tǒng)計幅度的值。對于雜波數(shù)據(jù),觀察統(tǒng)計的幅度,取對數(shù)之后可以近似認為服從均值為μ,方差為σ2的高斯分布。圖2為積累1 min后對數(shù)幅度排序之后的統(tǒng)計直方圖,可以明顯看到服從高斯分布。

圖2 對數(shù)幅度排序統(tǒng)計直方圖
最后,得到雜波的分布后,設定一個門限值Th,對每一幀下的距離單元進行判定,若滿足如下條件,則認為是有效距離單元點:
(3)
式中,x(n,k)為雷達時距圖,n為幀序列,k為距離單元序列。
同時,選取每一幀最靠近雷達的10個有效距離單元點為有效目標點,這是為了避免后面的多徑效應所帶來的有效單元點。圖3(a)是經(jīng)過檢測器后的時距圖,圖3(b)是未經(jīng)過檢測器的時距圖。從圖中結(jié)果可以明顯看出:檢測器能夠避免雷達多徑效應和雜波影響。

圖3 有無檢測器的時距圖對比
在除去噪聲和多徑效應后,對時距圖提取微多普勒特征,可以得到更加干凈的譜圖,這也是后續(xù)可以采用較低復雜度的分類器進行分類的原因。微多普勒譜圖是通過短時傅里葉變換得到的,如圖4為走路—坐下—起立—走路的時頻圖。其變換如下:

圖4 時頻圖(走路-坐下-起立-走路)

(4)
式中,x(n,k)為雷達時距圖,n為幀序列,k為距離單元序列,ω為變換頻率,w(m)為高斯窗函數(shù)。
對變換后的時頻圖提取了3個特征,利用3個特征可以對目標進行動靜粗分類。
1) 軀干多普勒頻率(速度),提取公式如下:
(5)
式中,F(xiàn)為短時傅里葉變換的點數(shù)。
2) 中高頻信息量,公式如下:
(6)
式中,f∈φ表示f包含所有頻率。
3) 多普勒能量值,公式如下:
(7)
按0.1 s進行滑窗,窗的長度為1 s,分別對1 s內(nèi)的3個特征值求平均,得到該時刻下的特征值。圖5顯示了3種特征值隨時間的變化。對于每一個特征值均可設定一個區(qū)分運動和靜止的門限值,超過某一門限值則判定為運動。若3個特征有超過2個判定運動(或者靜止),則認為目標在運動。區(qū)分動靜目標后,第2節(jié)將介紹動目標細分類方法。

圖5 3個特征值隨時間變化圖
對于已經(jīng)粗分類后的人體活動,本文將利用LSTM網(wǎng)絡進行細分類。首先,需要將由運動到靜止和由靜止到運動兩種狀態(tài)找出來,提取這種短時間內(nèi)狀態(tài)轉(zhuǎn)換的時頻圖作為樣本。選取該時刻前后一共兩秒的時間為樣本的序列長度。由于雷達的幀數(shù)設定為100幀,短時傅里葉變換的點數(shù)為80點,因此,樣本為200*80的矩陣圖。
將矩陣圖進行LSTM網(wǎng)絡的訓練,可以得到訓練好的模型,進而對測試集進行分類。本次實驗一共有7個人參與了實驗,得到樣本有1 390個。
為了降低計算復雜度和充分利用時頻矩陣的時序性,這里采用兩個細胞單元的LSTM網(wǎng)絡進行訓練,LSTM層后面通過Softmax層進行三分類。每個LSTM層有100個神經(jīng)元。
LSTM網(wǎng)絡結(jié)構(gòu)(如圖6所示)的輸入由新輸入xt和上一步的輸出值ht-1組成,輸出由ct和ht組成。ct的作用是負責記憶信息的細胞單元。整個LSTM網(wǎng)絡中,還有中間單元,包括遺忘門、輸入門和輸出門。LSTM每一步的計算流程如下公式所示:
(8)
(9)
(10)
(11)
(12)
(13)
式中,wf,wi,wc,wo分別是不同單元的權(quán)重,bf,bi,bc,bo分別指不同單元的偏置。sigmoid函數(shù)和tanh函數(shù)如下公式所示。通過不停迭代權(quán)重和偏置,讓網(wǎng)絡學習到特征的分布,進而識別出相應的動作。
(14)
(15)
本節(jié)將基于實測數(shù)據(jù)分析本文提出的方法在室內(nèi)環(huán)境下的分類識別效果。本實驗采用5-折交叉驗證的方法說明算法精度。5-折交叉驗證是將所有樣本分為5堆樣本集,依次提取5堆樣本中的其中一堆作為測試集,其他4堆作為訓練集進行網(wǎng)絡訓練。因此,每個模型參數(shù)都需要進行5次訓練,取測試集精度的平均值作為最終的訓練效果。每次實驗迭代次數(shù)為500次。本文將對比不同LSTM細胞個數(shù)和不同LSTM神經(jīng)元個數(shù)對結(jié)果的影響,從而得出最優(yōu)的模型。
表1顯示了兩個LSTM結(jié)構(gòu)下,不同神經(jīng)元數(shù)目的性能對比。表2顯示了100個神經(jīng)元下不同LSTM結(jié)構(gòu)數(shù)目的性能對比。綜合兩個表,可以看到:在100個神經(jīng)元和兩個LSTM結(jié)構(gòu)下,得到了92.52%的最高準確率。

表 2 100個神經(jīng)元下LSTM結(jié)構(gòu)不同數(shù)目的性能對比
圖7顯示了在最高準確率下,每次實驗的準確率與迭代次數(shù)的關(guān)系。這些實驗結(jié)果充分說明了本文算法的可行性。

圖7 最高準確率下5次實驗的測試精度與迭代關(guān)系
在復雜度和精度方面,本小節(jié)將通過對比其他方法,進一步說明算法的可行性。在特征分類中,常用的分類器如SVM、卷積神經(jīng)網(wǎng)絡、LSTM網(wǎng)絡將用來作算法的對比。
整個的對比結(jié)果可以用表3來概括。對比文獻[9]同樣采用的LSTM網(wǎng)絡,該方法將3個雷達采集數(shù)據(jù)應用于兩個800個神經(jīng)元的LSTM細胞單元進行識別,達到了最高準確率98.19%。雖然該方法一共識別了21個動作且準確率較高,但是3個雷達采集數(shù)據(jù)獲得3個時頻圖的方式限制了其應用場景,同時一共1 600個神經(jīng)元的結(jié)構(gòu)也大大超過本文200個神經(jīng)元的結(jié)構(gòu)。對比文獻[4]采用的6個SVM模型,雖然SVM比起神經(jīng)網(wǎng)絡復雜度低一點,但是其準確率最高只有90%,低于本文的準確率。對比文獻[5]采用的傳統(tǒng)卷積神經(jīng)網(wǎng)絡,該網(wǎng)絡在最高準確率96.9%下采用3個卷積層和池化層,2個全連接層。其中每個卷積層有20個5*5的卷積結(jié)構(gòu),2*2的最大池化層,2個全連接層分別包含500個神經(jīng)元和7個神經(jīng)元。這些參數(shù)個數(shù)是遠高于本文的個數(shù)的。由此可見,相比已有的神經(jīng)網(wǎng)絡方法,本文算法的計算復雜度更低。

表3 與其他方法的對比
本文提出了一種基于IR-UWB雷達的低復雜度室內(nèi)人員日常活動分類方法。首先,在室內(nèi)復雜多徑效應下,采用幅度拐點OS-CFAR檢測方法提取有效距離單元;其次,采用微多普勒特征提取方法對動靜目標進行粗分類;最后,采用兩個細胞單元的LSTM網(wǎng)絡對動目標進行細分類。實驗結(jié)果表明:最終的測試平均準確率達到92.52%。