王麗曉



摘要:隨著社會的不斷發展,人工智能越來越深入的融入到人們的生活,而人工智能的一個應用智能家居大大提高了人們的生活水平。智能家居中最重要的部分就是人體安全監控,而這一技術的核心就是人類活動識別。傳統的識別技術速度慢、精確度低,而度量學習能很大程度改善傳統人類活動識別技術的不足。本文研究的是將大間隔最近鄰應用到人類活動識別中以提高識別效率。
關鍵詞:大間隔最近鄰;人類活動識別;度量學習
中圖分類號:TP391 文獻標識碼:A 文章編號:1007-9416(2020)02-0091-02
人工智能的核心是機器學習,而機器學習結果的好壞取決于對未知事物的分類精度,而在進行分類的過程存在著數據之間相似性的比較,傳統的相似性對于特定的相似性需求往往得不到好的效果,這就導致了度量學習的出現,得到一個比較實用的相似性比較標準。本文選用的度量學習算法是大間隔最近鄰,下面是論文的具體內容。
1 大間隔最近鄰算法
大間隔最近鄰算法(LMNN)是基于K-近鄰分類的馬氏距離度量。LMNN算法的最后結果是一個訓練馬氏距離,該度量能使距離目標數據最近的K個數據屬于同一類,使與目標數據不同類的樣本盡量遠離。算法的思想來源于對穩定的K-近鄰分類的兩個簡單的考慮。一方面,每個訓練輸入數據應當與其k個最相近的數據具有同樣類別;同樣的,具有不同類別的訓練輸入樣本應當使其盡量遠離訓練數據。算法訓練的最后結果是訓練得出樣本數據上的線性變換矩陣,經過該矩陣轉換后的樣本數據可以滿足上述兩方面的要求。在實際運行過程中,這兩方面的要求時通過兩個函數表達式來表達的。一個表達式是處理與目標數據具有相同類別且距離較遠的,經過表達式的變化使距離變小;另一個是處理與目標數據具有不同類別且距離較小,處理后使其遠離目標數據。這里有個問題,就是“大”和“小”的標準,此時需要引入新的概念來定義“大”和“小”。
2 算法介紹
2.1 樸素貝葉斯(NB)
樸素貝葉斯法是一種基于貝葉斯定理與特征條件獨立假設的分類方法。對于給定的訓練數據集,首先基于特征條件獨立假設學習輸入/輸出的聯合概率分布;然后基于此模型,對給定的輸入,利用貝葉斯定理求出后驗概率最大的輸出。因此,樸素貝葉斯需要得到幀被標簽為標簽的概率。
2.2 1-近鄰(1NN)
1-近鄰是k-近鄰的一種特殊情況。K-近鄰算法是一種基本分類與回歸的方法,它的輸入為樣本的特征向量,可以對應到特征空間;輸出為樣本的類別,實現對樣本的分類。K-近鄰假設了一個給定的訓練數據集,其中實例類別是已定的。對其進行分類時,對于新的實例,根據其K個最近鄰的大多數的表決來決定新實例的類別。運用到試驗中就是K-近鄰分類器通過在訓練數據中找到距目標數據最近的數據并將類別從鄰居傳播到目標數據來為每個目標數據分配類別。
2.3 伴隨有拒絕任務的1-近鄰(1NN-M)
伴隨有拒絕任務的1-近鄰是在1-近鄰的基礎上對數據的選擇設置了一定的范圍,合格范圍是距目標數據R寬的圓形范圍,超出圓形范圍的數據和別忽視。如果在R的范圍內沒有目標鄰居出現,我們就認為目標數據 “未觀察到”。那么目標數據的標簽將由所有“為觀察到”的數據中找到距離它最近的數據,由大多數的這個數據的類別決定目標數據的類別??紤]到需要在度量學習之后進行拒絕處理,那么需要我們手動選擇拒絕半徑,以在辨別和拒絕任務上實現同等的準確度。拒絕半徑可以通過交叉驗證的方法來選擇,以實現識別和拒絕任務之間期望權衡。
2.4 帶有大間隔最近鄰算法的1-近鄰(1NN-R)
LMNN算法簡單介紹如下。
LMNN算法學習了一個馬氏距離D:
(2-1)
LMNN的目標是訓練得到一個空間轉換矩陣——最大化不同類別數據間的距離,并且最小化相同類別數據間的距離:
最小化:
目標函數:
(2-2)
是一個二進制數,其值表示和是否同類,也是一個二進制數,其值表示是否是同類中選中的最近鄰,是松弛變量。在目標函數中,第一項最小化所有訓練樣本與其所選擇的近鄰之間的距離。第二項最大化所有樣本中(通過松弛變量)相同標簽樣本和不同標簽樣本之間的間隔。
LMNN訓練樣本數據最終得到一個空間轉換矩陣,其目的是使查詢數據按照我們的要求變換,我們可以通過選擇轉換后的k個與目標數據最近的樣本數據的類別來定義目標數據的類別。通一般情況下我們設置k=3。
3 樣本介紹
本文的實驗用到了2個公開的數據集,Weizman數據集和由論文提供的兩個樣本集中其中一個樣本集及Kernel1樣本集。下面簡單介紹一下樣本集的情況。
Weizman數據集是由9個演員演示10個活動形成標簽序列與3個額外的序列共93(9×10+3)個獨立動作序列用于訓練度量模型和評估分類精度。
Kernel1數據集包含由8個演員做14個活動形成的532個數據序列,僅從一個角度拍攝的。
4 評估規則
為了表達分類的效果,我們需要一個評價規則來描述分類效果,這個就是我們說的評估規則。將數據集分成兩部分及訓練是數據集和測試數據集,訓練樣本集用來訓練目標度量,測試數據集用于測試訓練結果。對于測試樣本集來說,訓練結果將數據正確分類的數量n與測試樣本總數N的比值就是我們要的測試結果。本文的分類正確率計算由下面公式計算:
具體的評估規則如下:
規則1:查找樣本集中某一個演員的所有序列的。
規則2:查找樣本集中所有與查詢序列動作和演員都匹配的序列。
規則3:查找查詢的數據。如果演員一個動作只做一次,那么該規則與與規則2相同。
規則4:查找測試集中與查詢動作相同的所有數據。
5 實驗結果
NB、1NN、1NN-M和LMNN算法在Weizmen數據集和Kernal1數據集在上的運行結果分別如表1、2所示。
分析在Weizmen數據集實驗數據,可以得到下面分析結果。NB、1NN和1NN-M算法的平均識別精度分別是93.84、95.71和97.58,通過計算我們可以看出應用LMNN算法的識別精度相較于NB精度提高了3.74,相較于1NN精度提高了1.8。從有拒絕任務的實驗結果中可以得到1NN和LMNN的平均識別精度分別是84.72和90.4,LMNN相較于1NN精度提高了5.68。
分析在Kernal1數據集實驗數據,可以得到下面分析結果。NB、1NN和1NN-M算法的平均識別精度分別是97.06、97.37和98.39,通過計算我們可以看出應用LMNN算法的識別精度相較于NB精度提高了0.31,相較于1NN精度提高了1.02。從有拒絕任務的實驗結果中可以得到1NN和LMNN的平均識別精度分別是8530和93.76,LMNN相較于1NN精度提高了8.46。
6 結語
從數據上看度量學習中大間隔最近鄰算法確實在一定程度上提高了人類活動識別的精度,我們在以后的研究中還可以嘗試其他的度量學習算法,將其應用于需要識別、分類任務的各個領域,以期待它更好的表現。
參考文獻
[1] Veeraraghavan A,Chellappa R,Roychowdhury A K. The Function Space of an Activity[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition.IEEE Computer Society,2006:959-968.
[2] Weinberger K Q,Blitzer J,Saul L.Distance metric learning for large margin nearest neighbor classify-cation[J].Advances in neural information processing systems,2006,18:1473.
[3] Weinberger K Q,Saul L K.Distance metric learning for large margin nearest neighbor classification[J].Journal of Machine Learning Research,2009,10(Feb):207-244.
[4] Do H,Kalousis A,Wang J,et al.A metric learning perspective of SVM: on the relation of LMNN and SVM[C]//AISTATS,2012:308-317.
[5] Khan Z A,Sohn W.Abnormal human activity recognition system based on R-transform and kernel discriminant technique for elderly home care[J].IEEE Transactions on Consumer Electronics,2011,57(4).
Research on Human Activity Recognition Based on Large Interval Nearest
Neighbor Algorithm
WANG Li-xiao
(Zhengzhou Vocational College of? Electronic and Information Technology, Zhengzhou? Henan? 451400)
Abstract:With the continuous development of society, artificial intelligence is more and more deeply integrated into people's lives, and an application of artificial intelligence in smart home has greatly improved people's living standards. The most important part of the smart home is human security monitoring, and the core of this technology is human activity recognition. Traditional recognition technology is slow and has low accuracy, and metric learning can greatly improve the deficiency of traditional human activity recognition technology. This paper studies the application of large-spaced nearest neighbors to human activity recognition to improve recognition efficiency.
Key words:large-spaced nearest neighbor; human activity recognition; metric learning