宋暉等



摘 要:本文提出一種新的智能手機防盜方案:根據用戶掏手機動作過程中手機傳感器產生的數據,使用DTW(動態時間規整算法)作為分類算法,然后用Boosting算法進一步提升分類的準確性。該方案不僅可以實時智能防盜,而且還可以進行用戶認證。實驗結果表明,該方案能達到令人滿意的準確率。
關鍵詞:智能防盜;用戶認證;DTW算法;Boosting算法;行為特征
中圖分類號:TP311 文獻標識號:A
Abstract: This paper proposes a new scheme: according to the data produced by the phones sensors during users movement of picking phone out of pocket, use DTW as the classification algorithm, and then use the boosting algorithm to enhance the accuracy of classification. This scheme can not only provide intelligent antitheft timely but also provide user authentication. Experiments demonstrate that the scheme can achieve satisfactory accuracy.
Key words: Intelligent Antitheft; User Authentication; DTW; Boosting; Behavioral Traits
0 引 言
如今的智能手機更多地被用來管理個人信息(圖片、日程安排、銀行卡密碼等)、使用手機銀行等 [1]。這些個人隱私信息的丟失和泄露會給用戶帶來較大隱患。如何保護手機上隱私信息的安全已經成為人們普遍關注和重視的熱點問題。為此提出了各種各樣的解決方案,主要分為兩類:用戶認證和手機防盜。用戶認證即用戶進入系統前通過某種方法來驗證用戶的合法身份,防止非法用戶進入系統導致隱私信息泄露[2]。最常用的用戶認證是使用密碼、PIN或圖案密碼來進行身份識別。這種方法的缺點之一是密碼越長越復雜、即越安全,但復雜的密碼卻難以記憶,而且對于短時間內多次進入系統導致的頻繁解鎖將造成用戶使用上的十分不便。目前針對手機防盜采取的方案,大都屬于事后采取措施降低損失的方法。通常是在發現手機丟失后發送指令遠程鎖定手機,備份數據,刪除數據,遠程定位,近距離控響警報等操作,但卻僅僅能夠降低數據丟失和泄露的風險,找回手機的可能性多會很小。
本文提出一種新的手機智能防盜方案,針對用戶掏取手機這一過程,采集智能手機配備的加速度和角速度傳感器數據,從這些數據中提取用戶的行為特征值,根據特征值甄別這一動作。該方案根據掏取手機動作的傳感器數據,能同時完成用戶認證和手機的實時智能防盜功能,如果認證成功則自動解鎖系統,認證失敗則及時操控防盜警報、避免手機丟失。
1 相關工作
基于人體生物特征的認證方案如指紋識別、人臉識別、虹膜識別、視網膜識別等,相對于傳統的密碼方案具有更好的安全性和方便性。但是這類方案的缺點是需要特定的硬件支持(指紋識別器等),而且其中的人臉識別、虹膜識別則對周圍的環境帶有一定要求,再者如人臉識別可以通過使用面部靜態照片實施偽造,指紋也可以實現復制。在進入智能手機時代后,手機除了有觸摸屏之外還配備多種實用傳感器,能夠在使用手機期間獲得更多的有用數據,而后通過數據挖掘算法,抽取一定的特征值進行用戶行為特征識別認證。常見的基于行為特征的用戶認證主要有:動態手勢認證,語音識別,擊鍵行為認證,步態認證,手機使用習慣認證等[3]。然而基于擊鍵的用戶認證,需要用戶持續擊鍵一段時間才能識別用戶是否合法,而且這種擊鍵的特征可能因為手機尺寸和輸入法鍵盤布局的不同而有所變化,因而該種方法更加適合功能手機。并且這類認證方案僅能進行用戶認證而不能用于手機防盜。
目前的手機防盜方案,主要是在用戶發現手機丟失之后,通過某種形式遠程發送指令備份數據、刪除隱私數據、鎖定手機、手機定位以及手機警報功能。這種方案的缺點是用戶需要及時發現手機丟失,否則會導致信息丟失和泄露,而且通過定位和警報功能找回手機也頗為困難。
針對以上問題,本文提出基于掏兜動作手機傳感器數據設計的方案,不僅能實現手機智能實時防盜,避免手機丟失,還能實現用戶認證功能。
2動態時間規整算法(DTW)
DTW[4]是把時間規整和距離測度結合起來的一種非線性規整技術。算法的輸出是兩個時間序列的最小距離,輸出的值越小說明兩個時間序列越相似。本文使用DTW算法對樣本數據分類訓練和認證識別。在樣本訓練階段,假設訓練樣本集由N個樣本組成,分別記為,使用DTW算法分別計算訓練樣本集中任意兩個樣本之間的距離,選取其中的最大值maxDist作為訓練樣本集的模板特征。maxDist的計算公式如下:
在測試樣本識別階段,用DTW分別計算測試樣本和訓練模板中每一個樣本的相似度距離并記為,i=1…..N。若這些值中有半數以上小于此訓練模板的maxDist值,則該測試樣本識別成功。即滿足以下公式的測試樣本識別成功:
3 Boosting算法
Boosting[5]算法可以將若干個弱分類器組合起來,變成一個強分類器。弱分類器指識別錯誤率小于1/2的學習算法。識別準確率很高并能在多項式時間內完成的學習算法稱為強學習算法。Boosting算法使用弱分類算法產生基分類器,對分類錯誤的樣本分配更大的權值,并在下次分類時重點對分類錯誤的樣本進行處理。最后對這些弱分類器進行加權整合得到最終的強分類器。各個弱分類器的識別率不同,識別率越高的弱分類器權重越高,識別率越低的基分類器權重越低。
4實驗與結果分析
由于尋找弱分類器要比強分類器容易很多,通過Boosting算法可以提高弱分類器的準確率。因此,本文首先使用DTW作為弱分類算法,對數據進行初步分類。然后用Boosting算法對用DTW得到的弱分類器加權整合為強分類器,并與未整合之前的弱分類器作對比。整體實驗過程如圖1所示。
4.1數據采集程序
研究開發了一款基于Android 平臺的數據采集APP程序。程序采集掏兜動作過程手機加速度傳感器、角速度傳感器數據。程序有三個控制按鈕,開始按鈕即啟動本次數據采集,結束按鈕則終止本次采集,當再次按下開始按鈕將重新啟動下一次的數據采集,直到本次所需的樣本數目足夠時,對應按下退出鍵結束程序執行。為方便程序的使用,程序的開始和暫停也可以通過音量鍵的上下鍵來控制。數據采集程序運行圖則如圖2所示。
4.2數據采集
參與數據采集的用戶共有20人,其中15名男生,5名女生,每個人采集50個樣本數據。使用每人50個樣本中的40次作為訓練樣本,根據構建的分類模型訓練分類器,另外10次組成大小為200 的識別樣本集以驗證分類器的準確度。
4.3數據初步分析
為驗證方案的可行性,首先對樣本數據進行初步處理。繪制原始數據的時間序列圖,對每個人的樣本數據集按照加速度、角速度傳感器的X、Y和Z三個方向的數據分別繪制時間序列圖。圖3(a)和圖3(b)分別為兩個不同用戶X方向加速度10次樣本數據的時間序列圖。從圖中可以看出同一用戶不同樣本數據X方向加速度時間序列圖具有明顯的相似性,不同用戶樣本時間序列圖有明顯的差異性。通過觀察其他用戶其它傳感器數據的時間序列圖可以得到相同的結論。
4.4噪聲去除
從圖3(a)和圖3(b)中可以看到時間序列圖不太平滑,有一些點明顯有些偏離,這是由噪聲導致的。本文使用低通濾波器處理樣本數據,過濾掉高頻噪聲。對樣本數據進行FFT快速傅里葉變換將樣本數據從時域轉換到頻域。圖4所示為未使用SMA過濾的X方向加速度時間序列圖。圖5所示為X方向加速度一個樣本數據轉換的頻域圖。從圖中可以看出,大部分數據頻率低于10HZ,高于10HZ的數據是高頻噪聲。使用SMA(simple moving average)過濾器對樣本數據進行處理。圖6所示即為使用SMA過濾后的X軸加速度時間序列圖,圖7所示則為對SMA過濾后的樣本數據進行FFT變換得到的頻域圖。對比圖4和圖6可知SMA過濾之后的時間序列圖相比未過濾率之前更加平滑。對比圖5和圖7將會發現高于10HZ的噪聲數據基本被過濾掉。
4.5 DTW算法初步分類
圖8和圖9分別為x方向加速度的兩個樣本數據在DTW規整前和規整后的時間序列圖,規整后兩個樣本數據時序圖幾乎完全一致,可見DTW能夠盡可能減小時間位移對相似性計算的影響。
使用該方法對樣本數據加速度和角速度的X、Y、Z三個方向上的值分別進行分類模板訓練和測試樣本識別,得出加速度與角速度在X、Y、Z方向上的6個分類器的分類結果。本文使用認證系統性能評價中常用的兩個指標:FAR(False Alarm Rate)和IPR(Impostor Pass Rate)評價分類器的性能。圖10所示為這6個分類器的IPR和FAR值。
觀察該圖可見六個分類器中dtw_gry_y(Y方向角速度)的FAR最低為25%,IPR也最低為16.5。六個分類器得到的FAR介于25%~38%,IPR值介于16.5~24%。相比于其它認證方法,如步態認證得到EER(Equal Error Rate)為7%,擊鍵認證的EER為12.8%,僅僅使用DTW方法對樣本數據進行識別的結果還不夠理想。
4.6使用Boosting算法及類比同類認證
使用DTW的分類器正確率為62%~75%,屬于較弱分類算法。本文使用Boosting算法來提升這些弱分類器的準確率。圖11所示為使用Boosting算法得到的FAR、IPR和直接由DTW分類的六個弱分類器的FAR、IPR對比柱狀圖。
由圖可見,使用Boosting對DTW分類器加強后的FAR為12%,IPR為7.5%,和步態識別認證(EER為 7%)以及擊鍵認證(EER為12.8%)的準確率相近。但是步態識別認證需要相對較長的時間才能完成一次認證,而本文的方法在訓練后只需要一次掏兜動作即可完成認證。同樣地,對于擊鍵認證方法也需要一段時間的擊鍵動作才能收集到判斷是否為合法用戶的足夠數據,而且應用于智能手機上的擊鍵認證的準確率不如在電腦上高,且將受具體的虛擬鍵盤的布局的影響。
5 結束語
本文提出的基于智能手機掏兜動作識別方案,能夠同時實現手機智能實時防盜和透明用戶認證。樣本數據分類訓練完畢后,用戶某次的掏兜動作數據作為測試樣本進行識別,識別成功則手機自動解鎖,省去用戶手動解鎖操作;識別失敗則及時警報鈴聲,避免手機丟失帶來財物和信息損失。目前研究的不足之處是,Boosting之后的準確率還可以進一步提高,有待于在下一階段工作中改進。
參考文獻:
[1] SHAHZAD M, LIU A X, SAMUEL A. Secure unlocking of mobile touch screen devices by simple gestures: you can see it but you can not do it [C] // Proceedings of the 19th ACM Annual International Conference on Mobile Computing and Networking 2013, Florida: MobiCom, 2013:39-50.
[2] OGORMAN L. Comparing passwords, tokens, and biometrics for user authentication [J]. Proceedings of the IEEE, 2003,91(12):2021-2040.
[3] JAKOBSSON M, SHI E, GOLLE P, et al. Implicit authentication for mobile devices [C] // Proceedings of USENIX Summit on Hot Topics in Security 2009, Montreal: HotSec, 2009:9-14.
[4] BERNDT D J, CLIFFORD J. Using dynamic time warping to find patterns in time series [C] // Proceedings of KDD Workshop, Seattle,WA:AAAI Press, 1994:359-370.
[5] BUHLMANN P, HOTHORN T. Boosting algorithms: regularization, prediction and model fitting [J]. Statistical Science, 2007,22(4): 477-505.