999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度學習及其在動作行為識別中的進展

2016-05-14 13:09:56張行健賈振堂李祥
科技創新與應用 2016年6期
關鍵詞:深度學習

張行健 賈振堂 李祥

摘 要:深度學習是近年來備受關注的一個研究領域,是機器學習的一個延伸。通過構建深度學習神經網絡來提取特征是目前應用于動作行為識別中的一個新研究方向。為了引起更多的視覺領域研究者對深度學習的探索和深入,推動在動作行為識別中的研究,文章首先介紹了深度學習的由來、概念和原理,探討深度學習與機器學習(神經網絡)之間的關系;然后介紹近階段利用深度學習在動作行為識別中的進展。最后闡述深度學習目前發展所面臨的問題,以及對未來的展望。

關鍵詞:深度學習;行為識別;神經網絡

1 概述

動作行為識別是計算機視覺領域中的一個研究熱點,已經廣泛應用于智能監控、人機交互、視頻檢索等領域中[1]。動作行為識別技術是通過對視頻或者圖像中人體動作行為做出有意義的判斷。有效表達圖像(視頻)中的實際目標和場景內容是最基本,最核心的問題。因此,對于特征的構建和選擇得到廣泛關注,例如STIP、SIFT、MSER等。但是,能通過無監督方式讓機器自動從樣本中學習到表征樣本的特征,會讓人們更好地利用計算機來實現人的視覺功能。而深度學習作為神經網絡的延伸和發展,是通過逐層構建一個多層網絡來使得機器自動學習到隱含在數據內部的關系,從而讓學習到的特征更加準確性。

文章旨在探討深度學習與機器學習(神經網絡)之間的關系,并且介紹深度學習的由來、概念和原理;同時介紹目前深度學習在計算機視覺中的應用。最后提出深度學習目前發展所面臨的問題,以及對未來的展望。

2 深度學習

2.1 深度學習概述

深度學習源于人工神經網絡的研究,是機器學習的拓展。深度學習是經過組合低層特征來形成更加抽象的屬性類別和特征,從中發現原始數據的特征表征[2]?,F在用于動作行為識別的技術是通過“動作表征”+“動作分類器”的框架來進行行為識別的。其中“動作表征”是人們手動設計特征獲取到的,也就是在目前識別框架內存在一個對動作圖像(視頻)的預處理過程。

深度學習和淺層學習相對。目前許多學習算法是淺層網絡學習方法,具有一定的局限性,例如在樣本有限的狀況下,表示復雜函數的能力有限制,且對復雜分類問題的泛化能力也會受到一定約束[3]。而深度學習通過學習深層非線性網絡結構,達到復雜函數逼近,又能在樣本少的情況下學習原始數據的特征。BP算法作為傳統神經網絡的典型算法,雖然訓練多層網絡,但僅含幾層網絡,訓練方法很不理想[3]。因為其輸入和輸出間非線性映射讓網絡誤差函數形成含多個極小點的非線性空間,因而經常收斂到局部最小,且隨著網絡層數的增加,容易過擬合。而深度學習可以獲得分布式表示,通過逐層學習算法來得到原始輸入數據的主要變量。通過深度學習的非監督訓練完成,同時利用生成性訓練避免因函數表達能力過強而出現過擬合情況。

2.2 深度學習原理

傳統機器學習僅含單層非線性變換的淺層網絡結構,而且淺層模型單一。這對于深度網絡來說易造成陷入最優或產生梯度分散等問題。因此,Hinton等人在基于深度置信網(DBNs)的情況下提出非監督貪婪逐層訓練算法,隨后提出了多層次自動編碼器深層結構,這給解決深層網絡結構相關的優化難題帶來了希望。此外Lecun等人提出的卷積神經網絡是第一個多層次結構的學習算法。同時深度學習還出現了許多結構:多層感知機、去噪自動編碼器、稀疏編碼等。

卷積神經網絡是第一個真正采用多層次網絡結構,具有魯棒性的深度學習算法,通過探究數據在空間上的相關性,減少訓練參數的數量。而且卷積神經網絡(CNN)適應性強,善于發現數據的局部特征。它的權重共享結構降低了網絡模型的復雜度,減少了權值的數量,使得卷積神經網絡在模式識別中取得了很好的結果。

自動編碼器的核心關鍵是將原始圖像(視頻)輸入信號進行編碼,使用編碼后的信號來重建原始信號,使得兩者之間的重建誤差最小。通過將原始信號編碼成另一形式,能夠有效地提取信號中的主要信息,能夠簡潔地表達原始圖像(視頻)的特征。

3 深度學習的應用

3.1 語音識別

從2009年開始,微軟研究院語音識別專家通過與Hinton合作,首先將RBM和DBN引入到語音識別聲學模型訓練中,使得語音識別的錯誤率相對減低30%,這徹底改變了語音識別原有的技術框架。在國際上,IBM、google等公司都快速進行了DNN語音識別的研究,并且速度飛快。國內方面,阿里巴巴,科大訊飛、百度、中科院自動化所等公司或研究單位,也在進行深度學習在語音識別上的研究。

3.2 視頻中的動作行為識別

準確迅速識別視頻中人的動作行為對于視頻搜索和視頻監控具有劃時代的意義。最近幾年,深度學習技術被應用于視頻動作行為識別中。如Ji等人[4]提出多層網絡的3D卷積神經網絡來學習視頻中的時空特征,并通過卷積來實現對整個視頻特征的學習,從而代替之前的時空興趣點檢測和特征描述提取。在TRECVID數據庫上進行的實驗取得了不錯效果。

4 結束語

文章對深度學習的主要概念進行了全面闡述,包括其由來、原理、研究進展和相應的應用等。在很多領域中,深度學習都表現了潛在的巨大價值,但深度學習作為淺層學習的延伸,仍處于發展階段,還有很多問題值得我們深入探討:

(1)我們需要了解深度學習的樣本復雜度,需要多少訓練樣本才能學習到足夠的深度模型。

(2)在推進深度學習的學習理論和計算理論的同時,我們是否可以建立一個通用的深度學習網絡模型,作為統一的框架來處理語音、圖像和語言。

(3)神經網絡具有前饋性連接和反饋性連接,可是我們研究的深度網絡中還沒有加入反饋連接,這些都給深度學習的研究帶來了嚴峻的挑戰。

參考文獻

[1]王亮,胡衛明,譚鐵牛.人運動的視覺分析綜述[J].計算機學報,2002,25(3):225-237.

[2]余凱,賈磊,陳雨強.深度學習的昨天、今天和明天[J].計算機研究與發展,2013,50(9):1799-1804.

[3]李海峰,李純果.深度學習結構和算法比較分析[J].河北大學學報:自然科學版,2012,32(5):538-544.

[4]孫志軍,薛磊,許陽明.深度學習研究綜述[J].計算機應用研究,2012,29(8):2806-2810.

猜你喜歡
深度學習
從合坐走向合學:淺議新學習模式的構建
面向大數據遠程開放實驗平臺構建研究
基于自動智能分類器的圖書館亂架圖書檢測
搭建深度學習的三級階梯
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
利用網絡技術促進學生深度學習的幾大策略
考試周刊(2016年94期)2016-12-12 12:15:04
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
主站蜘蛛池模板: 真实国产乱子伦视频| 制服丝袜一区| 国产产在线精品亚洲aavv| 最新亚洲人成无码网站欣赏网| 国产福利一区视频| 国产乱人乱偷精品视频a人人澡| 亚洲中文字幕精品| 少妇极品熟妇人妻专区视频| 欧美国产三级| 全部免费毛片免费播放| a亚洲视频| 99在线观看视频免费| 亚洲二区视频| 91极品美女高潮叫床在线观看| 美女裸体18禁网站| 国产精品久久久久久久久| 亚洲精品在线91| 极品尤物av美乳在线观看| 国产成人精品优优av| 日本午夜视频在线观看| 91最新精品视频发布页| 永久免费AⅤ无码网站在线观看| 亚洲无限乱码一二三四区| 91精品久久久无码中文字幕vr| 日本不卡在线播放| 免费人成在线观看成人片| 日韩毛片在线视频| 伊人天堂网| AV天堂资源福利在线观看| 激情网址在线观看| 亚洲中文无码av永久伊人| 国产色偷丝袜婷婷无码麻豆制服| 日韩二区三区无| 超薄丝袜足j国产在线视频| 91精品国产麻豆国产自产在线| av尤物免费在线观看| 国产正在播放| 在线视频精品一区| 高清无码不卡视频| 91精品专区国产盗摄| 中文字幕不卡免费高清视频| 大陆国产精品视频| 五月天在线网站| 亚洲欧美激情小说另类| 亚洲成a人片77777在线播放| 欧美一区二区三区不卡免费| 国产成人综合在线观看| 成人在线综合| 国产杨幂丝袜av在线播放| 精品视频免费在线| 国产高清色视频免费看的网址| 伊人天堂网| 超薄丝袜足j国产在线视频| 成人无码一区二区三区视频在线观看 | 69视频国产| 99热这里都是国产精品| 欧美专区在线观看| 久久99国产乱子伦精品免| 91网在线| 国产一区二区网站| 久久网综合| 9999在线视频| 在线欧美日韩| 人与鲁专区| 亚洲日韩高清无码| www中文字幕在线观看| 欧美精品高清| 亚洲国产AV无码综合原创| 日韩av在线直播| 国产人碰人摸人爱免费视频| 欧美一区国产| 亚洲国模精品一区| 国产成人精品视频一区视频二区| 成人午夜亚洲影视在线观看| 99国产精品免费观看视频| 精品久久久久久久久久久| 一级毛片不卡片免费观看| 欧美日韩精品一区二区视频| 亚洲制服中文字幕一区二区| 欧美区一区二区三| 久久综合九九亚洲一区| 亚洲欧美另类专区|