侯興民, 李 冉, 張玉潔
(煙臺大學 土木工程學院, 山東 煙臺 264005)
身份識別在安全系統中具有重要作用,基于生物特征識別可以提供更高級別的安全識別精度。生物特征主要分為兩大類:靜態生理特征,比如面部特征、虹膜特征、指紋特征等;行為特征,比如步態特征、語音特征等。步態特征屬于人們在行走過程中特有的一種行為特征,相關研究證明每個人的步態特征都是唯一的[1],它不僅與一個人日常行為有聯系,還與體重、鞋型和行走地面狀況有關。步態特征采集簡單,當一個人行走時便可以采集腳步信號,不需要個人主動識別,具有一定隱秘性,同其他生物特征一樣還有不可模仿以及無法復制等優點[2]。因此,高精度的生物步態識別在安全與監督以及個人行為識別方面有較大的應用前景。
目前已有一些通過采集人員行走的腳步振動的研究,表1中匯總了相關研究。通過穿戴設備獲取振動信號,Bisio等[3]利用智能手機的加速度計信號在老年人和患者中進行活動狀態識別。采用SVM、決策樹進行分類,并對其識別性能進行了研究。然而,被測試者必須擁有智能手機才能進行監測,這樣很大程度限制了被測試者的正常活動;通過振動傳感器獲取腳步信號方面,Pan等[4]提出了一種室內識別系統,該系統利用振動傳感器采集腳步信號并通過引起的地板振動來識別不同的人。該研究僅限于無噪音的室內環境,但通過使用SVM,達到了85%的準確率。Jin等[5]利用振動傳感器對車輛、人和動物進行了分類,利用小波變換對信號進行特征提取使識別準確率達到91.7%。Anchal等[6]通過采集腳步振動信號預測了性別,數據集包含4名男性和4名女性測試者的腳步振動信號,并測試使用各種機器學習方法,來提高分類精度,使用線性SVM達到94.56%的識別率;通過話筒獲取腳步聲信號方面,Hori等[7]提出了一種利用單個腳步信號的音頻部分進行身份識別的系統,通過閾值處理自動獲取單個腳步信號,提取腳步信號的梅爾頻譜特征圖作為特征,在樣本數據為4人情況下,平均識別率達到98%。Shoji等[8]使用梅爾頻率倒譜系數(MFCC)、行走間隔和頻譜包絡相似性作為特征,采用K-均值聚類算法作為分類工具。張瑞興等[9]通過分析腳步聲信號的時域波形圖,提取腳步聲的間隔時間和腳步聲的持續時間,組成特征向量作為腳步聲信號的特征參數,采用k近鄰算法測試人數為8人平均識別率達到88%,實現在安靜環境下基于腳步聲的身份識別。
基于上述分析,目前針對采用振動傳感器獲取腳步振動信號進行個人身份識別的研究相對較少并且這些研究大都涉及到復雜的機器學習算法。本文直接對獲取到的單一腳步振動信號進行時域、頻域特征分析,選擇出特征參數之間的最優組合,并利用Lib-SVM工具箱計算多名測試者的平均分類準確率,通過設計多組腳步特征參數組合試驗,驗證了利用人員腳步振動信號,進行人員身份識別的可行性。
基于腳步誘發結構振動的人員特征身份識別系統技術路線如圖1所示。包含4個步驟模塊:數據采集、事件檢測、特征提取、人員分類。

圖1 技術路線圖
(1) 數據采集模塊,在樓地板上布置振動傳感器,獲取人員走動時引起樓地板振動的腳步信號;之后利用小波閾值去噪技術去除掉信號中的環境噪聲。
(2) 事件檢測模塊,獲取到去噪信號后,從一系列振動信號中去除掉非腳步信號,之后檢測分離出單一腳步信號用于后續特征分析。
(3) 特征提取模塊,對單一腳步振動信號從時域、頻域兩方面提取多個腳步特征參數,并對每位測試者信息進行標簽標注,之后將每位測試者提取到的有效腳步特征參數,疊加組合成特征向量。
(4) 分類方法與評估,一旦特征被提取出來,利用分類工具箱,計算每位測試者的平均分類準確性,并評估不同算法對分類結果的有效性。
行走時腳與地面碰撞產生振動并發出聲音,因此,腳步聲可以通過采集行走時產生的振動信號或聲音信號獲得。相比于腳步聲音信號,腳步振動信號更能反映出人員的身份信息,人行走時產生的振動信號頻率范圍為0~200 Hz[10]。

表1 腳步振動事件識別人員身份方法
腳步振動信號采集使用941B型拾振器(加速度檔位),COINV 智能數據采集儀,以及用于示波顯示以及數據存儲的筆記本電腦。測試時,為了使傳感器與地面接觸良好,采用耦合劑將傳感器垂直固定在地面上,數據采集設備安放如圖2所示;采樣頻率設置為4 000 Hz,放大倍數選擇10倍,測試單位選擇加速度;被測人員在距離傳感器30 cm左右的位置上進行一段直線距離的往復行走,記錄時間為300 s,保證每位測試人員能夠記錄到200以上個腳步脈沖事件。圖3中分別為單人、三人自由行走通過傳感器時腳步事件部分時域波形。

圖2 數據采集設備安放

(a) 單人自由行走
圖3所示即使在室內安靜的環境中,采集的腳步振動信號中也包含有一定的噪聲,這些噪聲來自于室內背景噪聲、采集設備自身噪聲、信號傳輸過程中引入的噪聲等。考慮到含有噪聲的腳步振動信號會對后期的特征提取、識別等處理帶來誤差,對含有噪聲的腳步振動信號進行小波閾值降噪處理[11]。
小波閾值去噪的基本原理為,去除掉低于閾值的部分,保留高于閾值的部分。圖4為采用小波閾值去噪前后信號時域、頻域對比圖。

(a) 去噪前時域信號
為濾除掉非腳步振動信號,需要從采集的信號中去除環境噪聲信息。例如,采集過程中突然的開門聲,椅子挪動或其他物體掉落下來產生的振動噪聲。這種與腳步振動信號類似的突發性振動脈沖事件,對后續腳步特征的提取和人員身份識別產生不利影響。因此,從采集的信號中獲取全部腳步事件是必要的。
事件檢測技術用于檢測整個信號中事件(本文為腳步信號)的存在和位置。圖5中標記出三個腳步事件。前人的研究中使用基于閾值的技術檢測事件,STA/LTA(短時窗平均/長時窗平均)算法[12]和基于峰度事件檢測技術[13]以及利用信號的能量進行事件檢測[14]。
然而直接將傳統的事件識別方法直接應用到腳步事件識中并不能取得理想的識別精度。圖3中,單人行走在正常行走狀態下,會出現一系列連續的勻速脈沖信號。因為他們的行走速度是一致的,導致引起的腳步振動信號具有一定的周期性。完成一個步行周期,前腳掌跟后腳掌之間的距離通常是固定的。利用這一步行特征,提出采用改進短時能量閾值檢測方法。

(a) 腳步時域信號

步驟2設置兩個能量閾值能量差閾值el和噪聲能量閾值tl,計數點閾值hdt。確定開始點,相鄰兩幀能量差滿足公式(1)中高于能量差閾值時,將前一點作為事件開始點,并進入事件檢測階段。這一過程中一旦短時能量E(s)滿足公式(2)中低于能量閾值tl且Cout值達到計數點閾值hdt時,將低于tl時前一點作為事件結束點。

(1)

(2)
式中,Count為能量閾值計數點。
圖6為腳步事件的檢測結果,(a)為正常行走下腳步振動信號的檢測結果,通過該方法成功分離出腳步事件起始位置;(b)、(c)、(d)依次為利用該方法從腳步正常行走周期過程中混入開門聲、彈球從1米高度掉落、書本從1米高度掉落三種突發性振動脈沖事件情況下檢測出腳步事件,表明從混合信號中獲取腳步信號該方法具有很好的適用性。

(a)
特征選取在任何生物識別的過程中都起著至關重要的作用,特征識別的精度取決于特征選擇的獨特性。通過提取腳步事件在時域和頻域方面的相關特征來進行人員識別。圖3中,同一位被測者腳步振動信號的幅值隨著離傳感器距離的增加而減小。這樣同一個人在經過傳感器時,會產生不一樣的腳步事件。為了消除這種距離的影響,Ekimov A等[15]在試驗中,要求測試人員在建筑地板上半徑為1 m,寬度為0.2 m的圓形軌道內行走。但是,這樣不可避免的改變了行人正常行走的姿態。

根據結構動力學原理[16],結構動力響應分析考慮的是輸入、輸出和結構三個因素之間的關系。這里所謂的結構可理解為傳感器布設的樓板,輸出則是測點記錄的速度時程,而輸入指的是引起該速度振動時程產生的外力,即人行荷載。本文研究本質上是一個結構動力學反問題:已知結構和輸出,來反演輸入的腳步特征,通過速度時程及其頻譜提取腳步荷載的特征參數指標,在線性范圍內,這些特征參數指標和輸入具有唯一的對應關系。
2.3.1 時域指標


(a) 時域腳步特征參數
2.3.2 頻域指標

支持向量機(support vector machine, SVM)由竇希杰等[17]首先提出的一種全新的機器學習方法,適用于小樣本分類。支持向量機的思想是建立一個分類超平面作為決策曲面,使得正例與反例之間的隔離邊緣被最大化;支持向量機的理論基礎是統計學習理論,是結構風險最小化的近似實現。對采集的多人信息進行分類屬于多分類問題,目前SVM多分類器方法構造主要是通過組合多個二分類器來實現多分類器的構造,如“一對一”法、“一對多法”、層次支持向量機等。
“一對一”算法(one against one,OAO算法)就是在任意兩個樣本之間設計一個SVM,n個樣本類別就需要設計n(n-1)/2個二分類器,主要包括構建p,q種類的二分類問題,如果樣本x屬于第p個分類,則q分類的權重增加1;否則,q分類的權重增加1。這樣x將屬于權重最高的分類。通過提取腳步事件不同方面的特征值組成特征矩陣作為輸入樣本來訓練SVM分類器。并選取分類指標對分類結果進行評價。
腳步振動信號的采集在煙臺大學土木館五樓西側走廊中完成,走廊長22.5 m,寬1.8 m,地板類型為大理石地板磚,采用脈動法實測樓板豎向自振頻率為27.88 Hz,阻尼比為0.29%。傳感器位于一側墻體0.5 m處,選取走廊中間一段長9 m,寬1.8 m的區域進行測試試驗,為了排除其他環境噪聲因素的干擾,獲得更高的信噪比,測試時間選在晚上;測試儀器為941B型拾振器,智能采集儀,采樣頻率設置為4 000 Hz,傳感器放置在離墻面0.5 m的位置。測試時,每位測試者單獨在走廊上反復沿直線行走20次,每次行走距離為9 m,每次可采集10~12個腳步振動信號,選擇離傳感器最近的5個腳步振動信號進行分析。

圖8 試驗測試環境
試驗采用自建數據庫進行訓練與分類,每位測試者采集300 s振動信號,利用改進短時能量閾值檢測方法,選取出每位測試者有效腳步事件,10名測試者共獲取500個有效腳步事件并計算出每位測試者有效腳步事件的16個腳步特征參數值,將不同測試者同一腳步特征參數繪制到同一張圖中,橫軸均為測試者編號,縱軸為不同腳步特征參數值其單位根據物理意義確定,無量綱單位均用幅值來表示,10位測試者采集到的腳步特征信息如圖9所示。

對比不同測試者腳步特征參數發現,相同特征下,同一位測試者計算得到的腳步特征值并不是一個定值,這是由于測得的腳步信號中含有不可避免的環境噪聲,但是每個人的腳步特征值均分布在一個離散的特定區間中。比如,波谷值最小值(F5)、峰值點的個數(F6)、均值(F7)、峰值因子(F10)、峭度因子(F11)、前五個峰值點的均值頻率(F14)、偏度(F15)、峰度(F16)。同一特征之間,不同測試者之間存在特征數值疊加情況,比如,持續時間(F1)中測試者8、9之間相同特征值個數達到8個,說明僅選用單一腳步特征值并不能作為人員區分的有效特征值。表2中,分別計算出了不同人員之間的腳步特征值的平均值,發現不同人員之間平均腳步特征值之間并不相同,可以將不同腳步特征組合起來,作為人員識別的依據。
3.2.1 試驗一
為了獲取不同人員數量之間的識別率,本研究選取2.3節中16個腳步特征參數,使用采集到的500個有效腳步事件,來構建特征向量。利用Lib-SVM工具箱RBF核函數進行分類模型訓練,并統計訓練不同人數時分類模型的平均分類準確率。
由表3可以看出,采用16個腳步特征參數,進行10人分類識別,平均識別率僅達到79.21%。說明選取這些腳步特征參數中有一些并不能為模型分類提供很好的準確性。

表3 SVM模型下不同人數的平均分類準確率
3.2.2 試驗二
為了進一步提高10名測試人員下分類準確率,選取最優數據特征,Joes等[18]通過從總特征中選取不同數量特征進行排列組合,選取最優特征組合來對相同樣本數目下識別精確度進行提高,最終通過該方法提高了5%的識別率。但是該方法使用的特征選取組合多,分類時間長。本試驗中采用皮爾遜相關系數法[19],繪制出不同特征之間的熱力圖。圖10表示選取的16個腳步特征參數進行相關性分析,對兩兩特征之間,相關系數在0~0.2進行選取,選擇出腳步信號的持續時間(F1)、信號下降時間(F3)、波峰值最大值(F4)、波谷值最小值(F5)、稍度(F9)、峰值因子(F10)、峰值點頻率(F12)、直流分量(F13)、前五個峰值點的均值(F14)、功率譜密度形狀統計特征(F16)共10個腳步特征參數,并利用上述分類器進行分類識別,平均分類準確率達到91%,相較于試驗一10人平均分類準確率提高了11.79%。分類測試結果如圖11所示。

圖10 特征選擇熱力圖
3.2.3 試驗三
試驗一、二中進行分類均采用Lib-SVM中的RBF核函數進行分類準確率的識別。為了提高分類的準確性,本試驗中采用試驗二中選取的10個腳步特征參數,分別在總人數3、5、7、10人樣本情況下,單獨一人自由行走通過傳感器時,采用線性核函數、多項式核函數、RBF核函數三種情況下對分類準確率的影響。結果顯示,3、5人情況下三種核函數均具有相同的平均分類準確率,7、10人情況下,采用線性核函數取得平均分類準確率最高,10人情況下平均分類準確率達到96%。通過對比可以看出對于該數據,采用線性函數作為核函數,最終的分類準確率最高。

圖11 分類結果圖
(1) 通過進行腳步特征參數選取,比較不同分類器核函數,識別人數為10人情況下,平均識別率達到96%,說明分類器在小樣本情況下,具有較準確的識別率。
(2) 使用SVM做分類預測時,需要設置的主要參數是懲罰參數c和核函數參數g,本試驗中將參數c和g的初始取值范圍為2-10~210,使其在2的指數范圍的網格內進行離散化查找,使用此參數建立的分類模型對數據的總體識別準確率為96%。

圖12 不同人數下不同核函數識別結果
本文中,通過采集人員行走引起的腳步振動信號,分析單一腳步特征參數,證明了提取有效腳步特征組合可以作為區分不同人員身份的依據,并得出以下結論:
(1) 相比于采用傳統事件檢測方法對腳步信號識別率不高,采用小波閾值降噪結合改進的短時能量閾值檢測法對獲取腳步事件具有準確的識別性能。
(2) 本研究中,提取腳步事件在時域、頻域共10個腳步特征參數組成最優特征組合,采用支持向量機進行分類識別,試驗表明,測試人數為3、5人時平均識別率均為100%,10人平均識別率最高達96%。證明了利用該方法,在小樣本情況下,對人員進行身份識別的可行性。
(3) 試驗設備僅需一個振動傳感器采集腳步振動信號,設備安裝布置簡單,試驗成本低。數據處理僅對單一腳步分析,計算量小分類效率高。
本研究還有如下問題值得做進一步工作:腳步振動信號受到不同地板類型、不同測試環境、不同鞋型等因素的影響,因此需要考慮上述因素,對腳步特征參數進一步優化,提高特征參數的普適性和有效性;隨著識別人員數量的增加,人員識別精度也相應下降,為了更加符合實際應用后續需要增加測試人員數量;目前對腳步振動信號的采集均是限定測試者進行單人行走,實際應用中多人行走是不可避免的,后續工作需要考慮多人行走情況下腳步振動信號檢測與人員識別。