999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Log-Euclidean詞袋模型與基于Stein核稀疏編碼的人體行為識別算法的優化與改進

2019-12-19 02:05:49楊豐嘉
科技創新與應用 2019年35期
關鍵詞:優化

楊豐嘉

摘 ?要:人體行為識別作為計算機視覺研究熱點,在智能監控、人機交互、運動分析等領域具有廣泛的應用前景。文章運用時空特征協方差矩陣表征視頻中人體行為,分別研究并改進了基于Log-Euclidean詞袋模型與基于Stein核稀疏編碼的人體行為識別算法。

關鍵詞:識別算法;智能監控;優化

中圖分類號:TP391 ? ? ? ? 文獻標志碼:A ? ? ? ? 文章編號:2095-2945(2019)35-0010-02

Abstract: As a research hotspot of computer vision, human activity recognition has a wide application prospect in the fields of intelligent monitoring, human-computer interaction, motion analysis and so on. In this paper, the spatio-temporal feature covariance matrix is used to represent the human behavior in the video, and the human behavior recognition algorithms based on Log-Euclidean bag model and Stein kernel sparse coding are studied and improved respectively.

Keywords: identification algorithm; intelligent monitoring; optimization

1 本文主要貢獻及創新

本文主要研究特征協方差矩陣表征人體行為的方法,根據行為表征方式的不同以及協方差矩陣的幾何特性,分別研究并改進了一種基于Log-Euclidean詞袋模型的人體行為識別框架以及一種基于Stein核稀疏編碼的人體行為識別算法,主要貢獻及創新點如下:

第一,研究特征協方差矩陣融合不同特征表征人體行為的方法。綜合分析梯度與光流特征在行為表征中的作用,總結他人成果,重新組合改進梯度光流特征,提取人體邊緣與運動特性。為了提高行為特征的穩定性和魯棒性,引入基于時空輪廓信息的外觀特征。研究協方差矩陣計算預處理與歸一化方法。

第二,研究基于改進的Log-Euclidean詞袋模型的人體行為識別算法。將視頻劃分為連續視頻段,將視頻段劃分為相互重疊時空立方塊,在時空立方塊中計算協方差矩陣,為了利用歐式空間幾何特性,通過對數運算將協方差矩陣轉換為Log-Euclidean空間向量。改進Log-Euclidean空間詞袋模型人體行為建模,采用譜聚類代替傳統聚類算法如k-means進行字典學習,譜聚類操作簡便,對聚類數敏感度低,性能優于傳統聚類算法,采用局部約束線性編碼代替常見的軟/硬編碼、稀疏編碼算法,局部約束稀疏編碼重構良好、稀疏平滑,且擁有快速計算方法。結合空間金字塔模型進行特征池化,整合視頻行為特征,采用非線性支撐向量機進行行為分類與識別。

2 基于改進的Log-Euclidean詞袋模型的人體行為識別

人體行為識別算法包括行為特征提取、行為建模以及行為理解與描述三個關鍵技術。本章從關鍵技術入手,研究了提取時空立方塊特征協方差矩陣的方法,將協方差矩陣轉換為Log-Euclidean空間向量,將黎曼流形空間問題轉換為歐式空間問題;我們將經典的視覺詞袋模型(bag of visual words)運用于行為建模,并改進了傳統詞袋模型中字典學習與編碼方法,研究使用譜聚類[}3s}(spectral clustering)字典學習方法代替傳統的k-means等聚類算法,譜聚類相較于傳統的聚類方法操作簡便且性能優越,特征編碼采用局部約束線性編碼[}36}(LLC),而不是傳統的軟/硬編碼、稀疏編碼,LLC編碼基于稀疏編碼,但是采用局部約束代替稀疏限制條件,稀疏平滑且重構良好,能快速計算;最后,探討非線性支撐向量機(SVM)行為識別與理解。

2.1 行為特征提取

將視頻劃分為連續等長視頻段,將視頻段劃分為大小相同、相互重疊的時空立方塊(cuboids),對每個立方塊提取梯度光流特征或者外觀特征,計算相應的時空三維協方差矩陣,協方差矩陣位于黎曼流形空間。為了避免流形空間非線性運算,對協方差矩陣進行對數運算,從黎曼流形映射到對稱矩陣空間,即線性空間。對稱矩陣含有冗余特征,可以將對稱矩陣映射到Log-Euclidean空間,即將對稱矩陣有規律的拉伸為向量。在Log-Euclidean空間可以采用歐式空間方法對行為特征進行處理,從而識別人體行為。

2.2 改進的Log-Euclidean詞袋模型

在行為特征提取過程中,提取時空立方塊協方差矩陣,轉換為Log-Euclidean空間向量,為了更好的表征視頻中人體行為,我們采用改進的詞袋模型進行建模。傳統的詞袋模型通常采用k-means聚類進行字典學習,而改進的Log-Euclidean詞袋模型則在Log-Euclidean特征空間采用譜聚類[[35]進行字典學習,譜聚類相較于k-means等傳統聚類方法表現更好,且操作簡便,對聚類數的敏感度更低。傳統的詞袋模型通常采用軟/硬編碼、稀疏編碼等進行特征編碼,而改進的Log-Euclidean詞袋模型則采用局部約束線性編碼(LLC)對視頻段中人體行為進行編碼,LLC相較于常見的編碼方法具有局部約束與重構良好等屬性,局部是比稀疏更本質的屬性,并且具有快速算法,時間復雜度低。改進的Log-Euclidean詞袋模型操作簡便,具有更好的穩定性,能有效提高行為特征編碼的判別能力。結合空間金字塔模型進行特征池化,整合視頻段特征,最終生成視頻人體行為特征。

3 基于Stein核稀疏編碼的人體行為識別

為了改進視頻段協方差矩陣判別能力并加快分類識別速度,我們引入了基于對稱正定矩陣空間的協方差矩陣降維方法,該方法不需要進行空間和數據類型的轉換,可以降低特征協方差矩陣的維數,保留黎曼幾何特性,并能增加數據類內聚合度和類間離散度,從而提高識別準確率。改進的Log-Euclidean詞袋模型雖然相對傳統詞袋模型有不少改進,且提高了穩定性和特征編碼判別能力,但詞袋模型無疑仍是比較繁雜的框架,缺少實際應用價值。為了克服這些缺陷,我們將視頻段中改進的梯度光流協方差矩陣或外觀協方差矩陣與Stein核稀疏編碼算法進行組合構建行為識別框架,結構極其簡單,計算復雜度低,具有良好的識別準確率。核稀疏編碼是采用Stein核將協方差矩陣映射到再生核希爾伯特空間,進行稀疏編碼和字典學習。

3.1 視頻段特征協方差矩陣

在本章中,我們采用特征協方差矩陣表征視頻段人體行為。將視頻序列劃分為互相重疊的等長視頻段,在視頻段中進行深度時空特征采樣,提取每個像素的梯度光流特征或者外觀特征。融合各個特征,采用計算特征協方差矩陣,因此每個視頻段中人體行為可由單一協方差矩陣表征,行為特征極其簡單且具有協方差矩陣描述子的各種優勢。

為了節約內存,加快計算速度,將視頻劃分為長度為L的連續視頻段,為了增強行為識別的魯棒性,增加樣本的多樣性,使視頻段之間相互重疊,設移動步長為step。對于循環行為,最佳視頻段長度為一個完整的行為所需的幀數,至少包含一個完整的行為周期,視頻段長度的設置方法與第三章中一致。至于視頻段的重疊,是為了應對時間對齊問題的,對于劃分視頻段,其中行為的起始與終止時間是不確定的,存在隨機性。為了使訓練樣本能盡可能多樣化,對視頻采取一定程度的重疊劃分,移動步長N根據視頻長度設置,通常N≤L,以盡量匹配測試樣本中的各種情況,提高行為識別準確率。

對于每個視頻段,選擇梯度光流特征或者外觀特征,計算協方差矩陣。每個視頻段對應著唯一的特征協方差矩陣,因此該行為特征表示方法非常簡潔,大大降低了后續計算復雜度。

3.2 協方差矩陣降維

協方差矩陣可融合不同特征,保持較低的維數,但視頻段中人體行為存在多樣性,為了改進協方差矩陣的判別能力,同時提高識別理解速度,我們引入基于對稱正定矩陣空間的協方差矩陣降維。本節所研究的協方差矩陣降維方法不僅能保留流形的屬性又能直接使用現有的基于流形的識別技術,降維后的特征可以保持原始特征之間的關聯性,增加數據的魯棒性以及數據類間離散度和類內聚合度,因而能增加低維特征的判別能力,提高算法的識別準確率。

4 結束語

特征協方差矩陣是一種強有力的數字圖像表征形式,可以融合不同特征且維數相對較低,現如今正逐漸運用于人體行為識別領域。我們在綜合分析他人行為特征的基礎上,重新結合梯度與光流特征,改進梯度光流特征表征運動人體邊緣信息和運動特性。同時引入了基于運動人體時空輪廓信息的外觀特征。

將視頻劃分為連續視頻段,對視頻分段進行密實采用,計算時空立方塊特征協方差矩陣。由于協方差矩陣屬于黎曼流形空間,為了便于采用歐式空間特性,將協方差矩陣轉換為Log-Euclidean空間向量,同時也去除了協方差矩陣中的冗余特征。我們改進了Log-Euclidean詞袋模型:采用譜聚類代替傳統的聚類算法如k-means進行字典學習,譜聚類操作簡單,對聚類數敏感度低,性能優于傳統的聚類算法;采用LLC編碼代替傳統的軟/硬編碼、稀疏編碼等常見編碼算法,LLC編碼以稀疏編碼為基礎,但相對于稀疏編碼具有更好的重構穩定性,是稀疏平滑的,且具有快速計算方法。結合空間金字塔模型進行特征池化,整合視頻中行為特征,采用非線性SVM算法進行行為分類識別。我們在標準行為數據庫上采用LOOCV方法進行實驗分析,討論實驗參數對行為識別的影響,與其它方法進行對比分析,探討改進的Log-Euclidean詞袋模型法的有效性與不足。

參考文獻:

[1]裴啟程.基于Kinect的人體行為識別研究[D].南京郵電大學,2018.

[2]孫君鳳.基于運動歷史圖的人體行為識別算法研究[D].山東大學,2018.

[3]張超.基于RealSense的動態手勢設計及識別方法研究[D].華中師范大學,2018.

[4]楊萍萍.基于Kinect的手勢動作識別研究及其在虛擬仿真系統中的應用[D].南京大學,2018.

[5]敖琳.基于Kinect骨骼信息的人體動作識別與行為分析[D].哈爾濱工程大學,2018.

[6]楊喆.基于無人機平臺的目標檢測與人機交互算法研究[D].哈爾濱工業大學,2017.

[7]劉小建.基于Kinect的手勢識別及其在場景驅動中的應用[D].中北大學,2017.

[8]丁文文.基于三維骨架的時空表示與人體行為識別[D].西安電子科技大學,2017.

[9]李陽.基于深度圖像的動作識別及應用研究[D].國防科學技術大學,2016.

猜你喜歡
優化
超限高層建筑結構設計與優化思考
房地產導刊(2022年5期)2022-06-01 06:20:14
PEMFC流道的多目標優化
能源工程(2022年1期)2022-03-29 01:06:28
民用建筑防煙排煙設計優化探討
關于優化消防安全告知承諾的一些思考
一道優化題的幾何解法
由“形”啟“數”優化運算——以2021年解析幾何高考題為例
圍繞“地、業、人”優化產業扶貧
今日農業(2020年16期)2020-12-14 15:04:59
事業單位中固定資產會計處理的優化
消費導刊(2018年8期)2018-05-25 13:20:08
4K HDR性能大幅度優化 JVC DLA-X8 18 BC
幾種常見的負載均衡算法的優化
電子制作(2017年20期)2017-04-26 06:57:45
主站蜘蛛池模板: 国内精品91| 日韩一级二级三级| 欧美在线黄| 亚洲黄色激情网站| 一级毛片基地| 黄色国产在线| 欧美一区中文字幕| 亚洲AV无码久久天堂| 亚洲精品成人7777在线观看| 91精品免费高清在线| 日本亚洲成高清一区二区三区| 日韩精品成人网页视频在线| 高清无码一本到东京热| 波多野结衣亚洲一区| 国产精品19p| 全部无卡免费的毛片在线看| 91麻豆国产在线| 国产成人亚洲精品蜜芽影院| 国产精品成人免费视频99| 国产手机在线小视频免费观看| 亚洲二区视频| 日韩福利视频导航| 亚洲国产成人自拍| 日本a∨在线观看| 精品伊人久久久大香线蕉欧美 | 免费中文字幕在在线不卡| 好紧太爽了视频免费无码| 国产超碰一区二区三区| 91最新精品视频发布页| 波多野吉衣一区二区三区av| 国产又爽又黄无遮挡免费观看| 福利在线不卡| 欧美国产日韩在线播放| 亚洲第一色视频| 中文字幕永久视频| 日韩乱码免费一区二区三区| 国内精品自在自线视频香蕉| 久久青草热| 欧美日韩一区二区在线免费观看 | 国产乱人乱偷精品视频a人人澡| 亚洲精品无码久久久久苍井空| 青青青国产在线播放| a亚洲视频| 日本三级黄在线观看| 欧美成人精品一区二区| 色播五月婷婷| 亚洲综合第一页| 99偷拍视频精品一区二区| av色爱 天堂网| 香蕉精品在线| 沈阳少妇高潮在线| 热久久这里是精品6免费观看| 55夜色66夜色国产精品视频| 在线播放国产一区| 国产人人乐人人爱| 亚洲国产日韩一区| 99精品伊人久久久大香线蕉| 亚洲av成人无码网站在线观看| 国内精品手机在线观看视频| 精品人妻无码区在线视频| 综合五月天网| 中文字幕啪啪| 欧美有码在线| 欧美日韩v| 午夜性爽视频男人的天堂| 久久青草热| 亚洲区第一页| 最新亚洲人成网站在线观看| 999国产精品| 国产综合网站| 国产清纯在线一区二区WWW| 国产成人高清亚洲一区久久| 伊人久久大香线蕉aⅴ色| 天天躁日日躁狠狠躁中文字幕| 国产高清在线观看91精品| 亚洲福利一区二区三区| 午夜精品区| 亚洲视频在线青青| 五月天天天色| 日韩福利在线观看| 欧美日韩国产高清一区二区三区| 欧美亚洲另类在线观看|