999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度學習及其在動作行為識別中的進展

2016-05-14 13:09:56張行健賈振堂李祥
科技創新與應用 2016年6期
關鍵詞:深度學習

張行健 賈振堂 李祥

摘 要:深度學習是近年來備受關注的一個研究領域,是機器學習的一個延伸。通過構建深度學習神經網絡來提取特征是目前應用于動作行為識別中的一個新研究方向。為了引起更多的視覺領域研究者對深度學習的探索和深入,推動在動作行為識別中的研究,文章首先介紹了深度學習的由來、概念和原理,探討深度學習與機器學習(神經網絡)之間的關系;然后介紹近階段利用深度學習在動作行為識別中的進展。最后闡述深度學習目前發展所面臨的問題,以及對未來的展望。

關鍵詞:深度學習;行為識別;神經網絡

1 概述

動作行為識別是計算機視覺領域中的一個研究熱點,已經廣泛應用于智能監控、人機交互、視頻檢索等領域中[1]。動作行為識別技術是通過對視頻或者圖像中人體動作行為做出有意義的判斷。有效表達圖像(視頻)中的實際目標和場景內容是最基本,最核心的問題。因此,對于特征的構建和選擇得到廣泛關注,例如STIP、SIFT、MSER等。但是,能通過無監督方式讓機器自動從樣本中學習到表征樣本的特征,會讓人們更好地利用計算機來實現人的視覺功能。而深度學習作為神經網絡的延伸和發展,是通過逐層構建一個多層網絡來使得機器自動學習到隱含在數據內部的關系,從而讓學習到的特征更加準確性。

文章旨在探討深度學習與機器學習(神經網絡)之間的關系,并且介紹深度學習的由來、概念和原理;同時介紹目前深度學習在計算機視覺中的應用。最后提出深度學習目前發展所面臨的問題,以及對未來的展望。

2 深度學習

2.1 深度學習概述

深度學習源于人工神經網絡的研究,是機器學習的拓展。深度學習是經過組合低層特征來形成更加抽象的屬性類別和特征,從中發現原始數據的特征表征[2]?,F在用于動作行為識別的技術是通過“動作表征”+“動作分類器”的框架來進行行為識別的。其中“動作表征”是人們手動設計特征獲取到的,也就是在目前識別框架內存在一個對動作圖像(視頻)的預處理過程。

深度學習和淺層學習相對。目前許多學習算法是淺層網絡學習方法,具有一定的局限性,例如在樣本有限的狀況下,表示復雜函數的能力有限制,且對復雜分類問題的泛化能力也會受到一定約束[3]。而深度學習通過學習深層非線性網絡結構,達到復雜函數逼近,又能在樣本少的情況下學習原始數據的特征。BP算法作為傳統神經網絡的典型算法,雖然訓練多層網絡,但僅含幾層網絡,訓練方法很不理想[3]。因為其輸入和輸出間非線性映射讓網絡誤差函數形成含多個極小點的非線性空間,因而經常收斂到局部最小,且隨著網絡層數的增加,容易過擬合。而深度學習可以獲得分布式表示,通過逐層學習算法來得到原始輸入數據的主要變量。通過深度學習的非監督訓練完成,同時利用生成性訓練避免因函數表達能力過強而出現過擬合情況。

2.2 深度學習原理

傳統機器學習僅含單層非線性變換的淺層網絡結構,而且淺層模型單一。這對于深度網絡來說易造成陷入最優或產生梯度分散等問題。因此,Hinton等人在基于深度置信網(DBNs)的情況下提出非監督貪婪逐層訓練算法,隨后提出了多層次自動編碼器深層結構,這給解決深層網絡結構相關的優化難題帶來了希望。此外Lecun等人提出的卷積神經網絡是第一個多層次結構的學習算法。同時深度學習還出現了許多結構:多層感知機、去噪自動編碼器、稀疏編碼等。

卷積神經網絡是第一個真正采用多層次網絡結構,具有魯棒性的深度學習算法,通過探究數據在空間上的相關性,減少訓練參數的數量。而且卷積神經網絡(CNN)適應性強,善于發現數據的局部特征。它的權重共享結構降低了網絡模型的復雜度,減少了權值的數量,使得卷積神經網絡在模式識別中取得了很好的結果。

自動編碼器的核心關鍵是將原始圖像(視頻)輸入信號進行編碼,使用編碼后的信號來重建原始信號,使得兩者之間的重建誤差最小。通過將原始信號編碼成另一形式,能夠有效地提取信號中的主要信息,能夠簡潔地表達原始圖像(視頻)的特征。

3 深度學習的應用

3.1 語音識別

從2009年開始,微軟研究院語音識別專家通過與Hinton合作,首先將RBM和DBN引入到語音識別聲學模型訓練中,使得語音識別的錯誤率相對減低30%,這徹底改變了語音識別原有的技術框架。在國際上,IBM、google等公司都快速進行了DNN語音識別的研究,并且速度飛快。國內方面,阿里巴巴,科大訊飛、百度、中科院自動化所等公司或研究單位,也在進行深度學習在語音識別上的研究。

3.2 視頻中的動作行為識別

準確迅速識別視頻中人的動作行為對于視頻搜索和視頻監控具有劃時代的意義。最近幾年,深度學習技術被應用于視頻動作行為識別中。如Ji等人[4]提出多層網絡的3D卷積神經網絡來學習視頻中的時空特征,并通過卷積來實現對整個視頻特征的學習,從而代替之前的時空興趣點檢測和特征描述提取。在TRECVID數據庫上進行的實驗取得了不錯效果。

4 結束語

文章對深度學習的主要概念進行了全面闡述,包括其由來、原理、研究進展和相應的應用等。在很多領域中,深度學習都表現了潛在的巨大價值,但深度學習作為淺層學習的延伸,仍處于發展階段,還有很多問題值得我們深入探討:

(1)我們需要了解深度學習的樣本復雜度,需要多少訓練樣本才能學習到足夠的深度模型。

(2)在推進深度學習的學習理論和計算理論的同時,我們是否可以建立一個通用的深度學習網絡模型,作為統一的框架來處理語音、圖像和語言。

(3)神經網絡具有前饋性連接和反饋性連接,可是我們研究的深度網絡中還沒有加入反饋連接,這些都給深度學習的研究帶來了嚴峻的挑戰。

參考文獻

[1]王亮,胡衛明,譚鐵牛.人運動的視覺分析綜述[J].計算機學報,2002,25(3):225-237.

[2]余凱,賈磊,陳雨強.深度學習的昨天、今天和明天[J].計算機研究與發展,2013,50(9):1799-1804.

[3]李海峰,李純果.深度學習結構和算法比較分析[J].河北大學學報:自然科學版,2012,32(5):538-544.

[4]孫志軍,薛磊,許陽明.深度學習研究綜述[J].計算機應用研究,2012,29(8):2806-2810.

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 国产97视频在线| 日本亚洲欧美在线| 日本三区视频| 91精品国产情侣高潮露脸| 欧美a级在线| 午夜啪啪福利| 国内精品九九久久久精品| 天天躁夜夜躁狠狠躁躁88| 国产精品无码作爱| 国产一级毛片yw| 精品丝袜美腿国产一区| 国产a v无码专区亚洲av| 四虎国产精品永久一区| 国产乱子伦手机在线| 色综合中文字幕| 毛片免费在线| 综合久久久久久久综合网 | 国产成人一区二区| 亚洲国产日韩一区| 欧美日韩国产系列在线观看| 欧美性天天| 国产精品久线在线观看| 国外欧美一区另类中文字幕| 欧美区在线播放| 久久这里只有精品23| 国产91高清视频| 精品国产电影久久九九| 奇米影视狠狠精品7777| 熟妇丰满人妻| 午夜综合网| 2024av在线无码中文最新| 乱色熟女综合一区二区| 欧美成人午夜影院| 九月婷婷亚洲综合在线| 欧美A级V片在线观看| 国产丝袜无码精品| 丰满人妻一区二区三区视频| 无码国内精品人妻少妇蜜桃视频| 黄色网站在线观看无码| 国产欧美在线观看一区| 国产一区二区三区在线观看视频| 久久国产亚洲偷自| 日韩免费毛片| 亚洲精品高清视频| 亚洲一区二区日韩欧美gif| 青草精品视频| 国产91蝌蚪窝| 国产成人久视频免费| 香蕉伊思人视频| 欧美久久网| 欧美中文字幕无线码视频| 国产男人天堂| 国产最新无码专区在线| 久久精品无码国产一区二区三区| 制服丝袜一区二区三区在线| 狠狠色丁香婷婷| 国产日韩欧美视频| 亚洲三级a| 久久香蕉国产线| 成人免费午间影院在线观看| 国产内射在线观看| 99热国产在线精品99| 免费欧美一级| 国产精品一区二区在线播放| 波多野结衣中文字幕一区| 精品国产99久久| www.av男人.com| 日韩午夜伦| 国产综合欧美| 无码电影在线观看| 2020精品极品国产色在线观看| 精品一区二区久久久久网站| 国产乱人激情H在线观看| 国产电话自拍伊人| 免费看久久精品99| 亚洲欧美人成电影在线观看| 色窝窝免费一区二区三区| 日韩国产高清无码| 99中文字幕亚洲一区二区| 五月综合色婷婷| 亚卅精品无码久久毛片乌克兰| 国产免费羞羞视频|