丁艷

摘要:行為識別技術在各國有多年的研究,行為識別技術應用廣泛,在運動、健康、管理等領域都有應用,目前在手機上,行為識別技術的應用多還僅停留在計步器階段,而手機的傳感器顯然可以實現更多有意義的健康功能。本文將對使用手機傳感器進行行為識別的研究思路進行闡述說明并介紹可選取的幾種行為識別模型。
關鍵詞:行為識別 手機傳感器 行為識別模型
一、研究思路
從識別人的簡單行為(走路,跑步等)開始,進行實驗和研究。主要思路為:第一,需要什么數據,數據如何獲取,什么樣的數據就足以識別出我們想要識別的行為,一般智能手機的傳感器有:線性加速度傳感器(type_Linear_acceleration):測量三個軸的加速度,但不包括重力加速度,單位為m/s2、重力加速度傳感器(type_Gravity):測量三個軸的重力加速度,用于檢測傾斜和方向的檢測,單位是m/s2、陀螺儀(type_gyroscope):測量三個軸的角加速度,用于旋轉角度的檢測,單位是rad/s、距離傳感器(type_proximity):主要用于檢測手機屏幕與物體的距離,比如通話時靠近屏幕熄屏,單位是cm、光線傳感器(type_light):用于根據外界光線來調節屏幕的亮度,單位是lx、氣壓計(type_pressure):返回當前環境的壓強,通常用于海拔高度的測量,單位是hPa、霍爾傳感器(type_temperature):測量設備周圍的磁場,單位是uT、溫度傳感器(type_temperature):測量設備當前溫度,單位是℃、GPS模塊:用于獲取當前設備的位置信息,具體信息為經度、緯度信息。在查閱資料后決定先只使用手機的加速度傳感器數據,根據資料可知,三軸加速度傳感器足以較為準確的反映出一個人的運動狀態,可用三軸加速度的XYZ三軸加速度作為識別數據。第二,數據需要經過什么樣的處理,數據獲取的規范是什么樣的 ?經過數據分析發現數據只需要進行方差標準差均值的轉換,即可去除加速度傳感器的方向性,將原本三維帶方向的數據轉換為三維不帶方向的數據,這對機器學習來說將會更好處理,數據讀取的規范可采用每秒50Hz的采樣速度對數據進行采樣。第三,需要使用什么樣的模型對數據進行預測?查閱資料后發現有多種簡單模型,有基于普通機器學習的SVM,簡單分類器,基于深度學習的單層神經元,多層神經元等等方法。由于機器學習的框架比較多,基本上所有的實驗和研究都可以在Tensorflow和karas集成框架上進行。為了使研究能有所成果,需要做出一個使用相關研究成果的應用程序,若使用安卓手機平臺,開發環境可使用Android Studio,并且可使用Google公司在2017年發布的Tensorflow lite庫,以使得應用能完整的支持由tensorflow框架所生成的模型,降低開發難度。
最后將研究的成果應用起來的應用程序的整體設計思路如上圖所示。由手機應用全權負責數據的采集、處理、計算和分析工作,并使用安卓系統內置的SQL lite數據庫,對分析出的結果和數據進行保存,方便以后進行查看。其中數據的計算可使用Tensorflow lite的模型計算庫進行計算,可以極大的方便我們對機器學習模型應用程序的開發,后續還可以對程序進行功能上的改進和優化,以適應各種不同的使用場景和需求。
對于使用的用戶來說,只需要掏出手機就可以看到自己今天的行為時間分布,健康狀態等等數據,并且可以對數據進行分析展示,甚至可以做到云端保存,這就是在研究行為識別技術之后,對行為識別技術的應用。
二、行為識別的模型選取
由易到難列出五種方案可供選擇:
1)決策樹(Decision Tree) 決策樹是一個類似于流程圖的樹結構,其中每個節點代表一個屬性上的測試,每個分支代表一個測試輸出,最后的葉結點代表類別。決策樹方便改寫為形如if- then的分類規則,易于理解。決策樹的核心算法是一種貪心算法,它以自頂向下的方式在訓練集的基礎上構造決策樹之后,獲取傳感器信息,即可得到該數據所屬的類別。
2)K近鄰分類(K-nearest neighbor)
俗稱KNN模型,KNN的思想也來源于向量空間模型,同樣采用將文本轉化為向量的思想。KNN是一種基于類比的分類方法,在訓練的過程中,KNN會生成所有訓練例的特征向 量,并將其保存下來。給定一組數據,在生成它的特征向量之后,KNN模型會搜索所有標簽,最相近的即為結果。
3)SVM(支持向量機,一種傳統的分類模型),徑向基核函數(Radial Basis Function, RBF)的SVM是較適于小樣本、多分類問題的分類模型,可將經過準確標記的原始傳感器數據或(和)提取的特征數據作為模型輸入來訓練模型,獲得模型參數,從而完成模型構建,以此模型可對測試數據(可以是實時采集的數據)進行人體活動行為或跌倒行為進行識別。
4)長短期記憶網絡(LSTM),LSTM是一種特殊的RNN 網絡即門控循環神經網絡(RNN),它可以學習長期時間的依賴信息,擅長處理依賴于時間序列的任務。可將經過準確標記的原始傳感器數據或(和)提取的特征數據作為模型輸入來訓練模型,獲得模型參數。以此模型可對測試數據(可以是實時采集的數據)進行人體活動行為或跌倒行為進行識別。
5)卷積神經網絡+LSTM,卷積神經網絡提取特征,再與LSTM聯結構造端到端的深度學習模型,,一方面因為卷積神經網絡(如VGG模型、Inception 模型,或自己構造深度學習模型)的加入使得網絡層次加深,視野擴寬,即可以自動提取到更加豐富的特征,從而提高了識別率;另一方面又因為LSTM的加入使得時序信息得以充分使用。LSTM對時序信息的有效處理,不僅可以提高識別率,同時還可利用LSTM推理能力使模型整體擁有一定程度的容錯能力。
以上三種模型決策樹和KNN最簡單,本科生使用應該從易到難,選擇簡單的模型對于本科生來說比較好理解和操作,并且效果會較為明顯。
參考文獻
[1]于濤.基于智能手機的人體行為識別研究[D].南京郵電大學,2019.
[2]任宇飛.基于SVM的人體運動分析與防跌倒檢測技術[J].信息技術,2019,43(06):56-59+68.
[3]王二虎.基于手機傳感器的人體運動姿態識別研究[D].陜西科技大學,2019.
[4]孔菁,郭淵博,劉春輝,王一豐.基于智能手機傳感器的基礎行為識別方法研究[J].計算機應用研究,2020,37(04):1081-1085.
[5]孔菁.基于智能手機傳感器的行為與身份識別研究[D].戰略支援部隊信息工程大學,2018.
[6]葉舒憲.中國文化的構成與“少數民族文學”:人類學視角的后現代觀照[J].民族文學研究,2009(02):55-64.