張嘉璐 牟勇
(1.大連海事大學,遼寧大連 116026;2.中體彩科技發展有限公司,北京 100021)
隨著人們生活水平的提高和環境輔助的廣泛應用,在移動物聯網的高速發展下,行為識別領域得到了長足的發展[1]。但是在智能家居中泛在傳感器的行為識別仍然呈現出許多挑戰:例如通過傳感器觸發的異常行為數據點來分析居民日常行為[2],以便于有效地保護老年人和生活不能自理的人。根據上述原因,泛在傳感器下的智能家居環境中行為識別技術研究具有重要的學術意義。
在行為識別領域中,根據傳感器與人體的交互模式,可以將行為識別中應用的傳感器分為兩大類:非侵入式和入侵式傳感器。本文實驗的行為識別數據集均來自于華盛頓州立大學CASAS實驗室。
基于泛在傳感器的日常行為識別無法獲取用戶日常生活圖像、聲音等信息,只能通過傳感器傳輸的行為數據來對異常行為進行分析。通過對用戶觸發的傳感器進行分析,得到居民日常行為規律,從而將同一行為中與行為習慣規律相左的行為識別異常行為,本文主要研究兩種情況下的泛在傳感器智能家居異常行為:
(1)第一類為行為開始和結束時間異常。例如:在單用戶行為識別中,某一個用戶每天吃藥的開始時間通常在中午12點左右,但是突然有一天吃藥的開始時間發生在了下午或者其余時間,在這種情況下,發生的行為就屬于吃藥行為開始時間異常。
(2)第二類為行為持續時間異常。例如:在單用戶行為識別中,某一個用戶每天去衛生間的持續時間為30min左右,但是突然有一天去衛生間的時間持續了兩個小時,那么該行為就屬于行為持續時間異常,可能原因是用戶身體出現異?;蛘呤怯脩艏依锏脑O備壞了,可能需要維修等。
在日常行為識別中,異常行為識別[3-4]的方法主要是先將人工標注的正常行為進行建模,再將待測試行為與建模后的模型進行對比來判別是否為異常行為。本文根據不同行為的不同異常表現形式,首先對行為進行余弦相似度計算,將余弦相似度計算出的向量作為特征值。之后,采用DBSCAN聚類算法以正常行為為參照來對該類行為的特征進行聚類來進行異常行為識別。
余弦相似度是通過計算特征之間的距離來計算行為之間的相似度,公式1給出了余弦相似度在異常行為識別中的應用。本文將計算余弦相似度后的特征作為DBSCAN算法的輸入:
基于密度的聚類算法中最常用的算法之一為DBSCAN算法,其具有良好的抗噪性并且對異常數據敏感的特點。不但適用于凸樣本數據集,同樣適用于非凸樣本數據集。
本文首先,對第一種異常行為采用統計方法某一行為的開始和結束時間作為特征,然后用余弦相似度進行特征計算,計算后的距離值作為新的特征向量。采用DBSCAN算法來對這些特征向量進行聚類,從而進行異常行為識別。然后針對第二種異常行為統計觸發該行為的持續時間和傳感器作為特征向量,同樣余弦距離與DBSCAN算法來識別其中的異常行為。最后,通過對比實驗驗證了本文提出的異常行為識別方法可以有效識別異常行為。
為了驗證異常行為識別的有效性,本文采用hh103數據集分別展示了兩類異常行為識別的實驗結果。
如圖1所示,橫軸表示Cook_Lunch行為的開始時間,縱軸表示Cook_Lunch行為的結束時間(為了將特征描述更加清晰,將24h制的時間轉換秒值,例如:01:20轉換為相應的小數值為4800)。
從圖2中可以看出hh103數據集“Cook_Lunch”行為的發生時間和結束時間的特征向量利用余弦距離和DBSCAN算法相結合后,進行聚類之后獲得了該用戶有六個異常行為數據點,可能是用戶行為發生了異常行為。其中“Cook_Lunch”行為的開始與結束時間均異常的數據點有四個,行為開始時間異常的數據點有一個。從圖1中還可以看出,用戶的做飯開始時間在43000s結束時間在46000s,而異常點則不在此范圍內。
為了驗證第二類異常行為實驗的有效性,本章采用余弦相似度與DBSCAN算法對某個行為的持續時間和傳感器觸發頻次進行聚類。
圖2展示了hh103數據集的“Cook_Lunch”行為的持續時間的異常點情況。其中,這個圖的橫軸表示行為觸發的傳感器頻次,縱軸表示行為持續的時間。從圖2中看出,被檢測出的異常點有5個。其中,用戶觸發正常行為的持續時間在400s之內,而異常行為的持續時間則超過了400s,并且從圖2中也可以直觀的看出這5個行為偏離了其正常行為的范圍,因此可以考慮這5個行為為用戶“Cook_Lunch”的異常行為。
從本文監測的行為的開始/結束時間異常和持續時間異常的兩種異常行為識別可以看出不同用戶有自己特定的日常生活習慣在做相同的行為時,行為發生時間、結束時間以及持續時間都不相同。因此采用余弦相似度與DBSCAN結合對每個用戶的行為模式來檢測用戶行為的異常情況。