999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度學習理論綜述

2016-06-17 16:22:12韓小虎徐鵬韓森森
計算機時代 2016年6期
關鍵詞:機器學習深度學習

韓小虎 徐鵬 韓森森

摘 要: 深度學習是機器學習研究中的一個新領域,其動機在于建立、模擬人腦進行分析學習的神經網絡,模仿人腦的機制來解釋數據。目前深度學習在智能識別方向具有很強的優越性。文章主要介紹了深度學習的基本理論、常用模型和開發平臺。

關鍵詞: 深度學習; 機器學習; 特征表示; 工具

中圖分類號:TP399 文獻標志碼:A 文章編號:1006-8228(2016)06-107-04

Abstract: Deep learning is a new field in the research of machine learning, whose motivation is to build and simulate the neural network, with which the human brain analyzes and studies, and simulate the mechanism of human brain to interpret the data. At present, deep learning has a strong advantage in the direction of intelligent identification. This paper mainly introduces the basic theory, common models and development platforms of deep learning.

Key words: machine learning; deep learning; feature expression; tool

0 引言

神經網絡的歷史最早可以追溯到上世紀的40年代,在20世紀80年末期,Rumelhart、Hinton和Williams在《自然》(Nature)上發表了用于人工神經網絡的BP(Back-Propagation,反向傳播)算法[1],掀起了一陣機器學習的浪潮,但是由于各種原因,神經網絡被許多學者放棄。

20世紀90年代,更多的學者開始采用淺層機器學習模型,例如SVM(Support Vector Machines,支持向量機),最近鄰等分類器,Boosting等。這些模型都取得了巨大成功,但是同時由于理論分析難度大,訓練方法復雜,這個時期神經網絡陷入了沉寂。

自2006年以來,深度學習領域取得了突破性進展,人工智能的實現,不再是那么遙不可及的事情了。至于技術手段,在依賴云計算對大數據的并行處理能力的基礎上,更加依賴一個算法,這個算法就是深度學習,通過這個方法,人們終于知道如何處理抽象概念這個難題。

深度學習的概念最早由機器學習領域的泰斗、多倫多大學G.E.Hinton教授提出[2],之后在各大領域有了飛速的發展。2012年,由Hinton教授帶領的深度學習團隊在ImageNet圖像分類大賽中取得了優勝,其準確率超過了第二名10%以上,引起了計算機視覺領域的極大震動,再一次掀起了深度學習的浪潮。同年6月,Google被披露出Google Brain計劃,這個項目由斯坦福大學的機器學習教授Andrew Ng和在大規模計算機系統方面的世界頂尖專家JeffDean共同主導,用16000個CPU Core的并行計算平臺訓練一種稱為“深度神經網絡”(DNN,Deep Neural Networks)的機器學習模型,在語音識別和圖像識別等領域獲得了巨大的成功。百度在2013年1月高調宣布成立百度研究院,其中第一個便是深度學習研究所(IDL,Institute of Deep Learning)。

1 深度學習基本理論

人工智能所具有的特征之一就是對信息的學習能力,即網絡的性能是否會隨著數據的增加積累也不斷提高。隨著人類社會信息的高度爆發,大數據時代到來,可用計算能力與數據量的增加,為人工智能的發展提供很好的平臺。在這樣的背景下,深度學習在各大領域所取得的成就絕非偶然。

深度學習基本理論主要包括深度學習的基本概念、深度學習的訓練過程和深度學習的模型三部分。

1.1 深度學習的基本概念與架構

2006年,加拿大多倫多大學教授、機器學習領域泰斗Geoffrey Hinton和他的學生Ruslan SalakHutdinov首次在《科學》上發表論文,提出深度學習的兩個主要觀點。

⑴ 含多隱層的人工神經網絡具有很優秀的特征學習能力,其對學習所得到的特征數據有更深刻的展示,最終得到的網絡數據更有利于分類或可視化。

⑵ 深度神經網絡在訓練其本身網絡參數上的具有一定的難度,但是這些都可以通過“逐層初始化”(layer-wise pre-training)來克服,而逐層初始化則可以通過無監督學習來實現。

深度學習允許那些由多處理層組成的計算模型去學習具有多個等級抽象數據的表達,該方法在許多領域得到了廣泛的應用,例如視覺對象識別,語音識別,對象檢測等,同時對醫藥學的新發現和基因組學的新進展也起到了促進作用。深度學習利用反向傳播算法發現大數據的內在復雜的結構,然后BP算法會指導機器如何在每一層利用從上一層獲得的表達來改變其內部的參數。

深度學習的本質是利用海量的訓練數據(可為無標簽數據),通過構建多隱層的模型,去學習更加有用的特征數據,從而提高數據分類效果,提升預測結果的準確性。“深度學習模型”是手段,“特征學習”是目的。

1.2 深度學習的常用模型

深度學習常用模型主要有:自動編碼器(AutoEncoder)、稀疏自動編碼器(Sparse AutoEncoder)、降噪自動編碼器(Denoising AutoEncoder)、限制玻爾茲曼機(Restricted Boltzmann Machine,RBM)。

⑴ 自動編碼器[3](AutoEncoder)

深度學習中最簡單的一種是利用ANN(即人工神經網絡)的層級結構特點設計的一種網絡。對于一個給定的網絡,我們假設其輸入與輸出是一致的,接下來我們訓練網絡并調整網絡中的參數,得到每一層的權值。由此我們就得到了輸入數據Input的相異表現形式,這些表示就是特征。

AutoEncoder就是一種可以盡可能復現輸入數據的一種神經網絡。自動編碼器基于這樣一個事實:原始的輸入Input經過加權即(w,b)、還有映射(Sigmoid函數)之后得到一個數據y,然后對y進行加權反向映射得到數據z。通過不斷的迭代訓練,使得誤差最小(即盡可能使得z接近或者與input相同)。在這個過程中并沒有使用標簽數據來計算數據之間的誤差從而去更新參數,所以是無監督學習網絡,同時利用了類似神經網絡的雙隱層方式來提取樣本。

自動編碼器一般由兩部分組成:解碼器與編碼器。它們可以被定義為這樣的兩種轉換:

在自動編碼器當中,如果隱含層的結點個數過少,隱含結點就需要對原始輸入數據進行數據壓縮,但當輸入為隨機序列的時候,對輸入提取特征數據將會變得困難。雖然在隱含層結點數目很大的情況下,仍可以用自動編碼算法,但是需要加入稀疏限制,加入限制之后的自動編碼器就是稀疏自動編碼器。稀疏自動編碼器編碼解碼過程如圖2所示。

⑶ 降噪自動編碼器(Denoising AutoEncoder)

2008年,Vincent在他的論文“Extracting and Composing Robust Features”中突出了AutoEncoder的改良的降噪自動編碼器(DA,Denoising AutoEncoder)。DA采取部分損壞的輸入而訓練來恢復原來的不失真的輸入,這就迫使編碼器去學習輸入信號更加robustly的良好表達,一個很好的表達對于恢復相應的清晰輸入是很有效果的,這也是DA的泛化能力比一般編碼器強的原因。其訓練方法如圖3所示。

⑷ 限制玻爾茲曼機[4](Restricted Boltzmann Machine,RBM)

限制玻爾茲曼機(RMB)是一種深度學習模型。在1986年它由Hinton和Sejnowski提出,是一種生成式隨機神經網絡(generative stochastic neural network),整個網絡是一個二部圖,同層次結點之間沒有鏈接,只有可見單元與隱含單元之間才會存在邊。可見單元即輸入數據層,隱含單元即隱含層,它們都是二元變量。與此同時若全概率分布滿足玻爾茲曼分布的話,我們就把這個模型稱為限制玻爾茲曼機(Restricted Boltzmann Machine,RBM)。限制玻爾茲曼機RBM由三個可視層結點和四個隱含結點組成,可以用于降維,學習特征以及深度置信網等。通過隱含層層數增加則可以得到深度玻爾茲曼機(Deep Boltzmannn Machine)。

1.3 非線性激活函數

激活函數是用來為神經網絡加入非線性因素的,因為線性模型的表達分類能力不夠。某些數據是線性可分的,其含義就是,可以用一條直線將數據分開。這時候需要通過一定的機器學習的方法,比如為感知機算法(perceptron learning algorithm)找到一個合適的線性方程。但是,有些數據是線性不可分的,它們沒有辦法畫一條直線將數據區分。這時候有兩個辦法,一個辦法是做線性變換(linear transformation),比如x,y變成x2,y2,這樣可以畫出圓形;另一個辦法是加入非線性因素,即激活函數。總的來說,引入激活函數就是用來解決線性不可分的問題。本節主要講解三個激活函數,sigmoid、tanh以及ReLu。

2001年,Dayan、Abott從生物學角度提出了模擬腦神經元接收信號更清晰的激活模型,這個模型函數就是Relu。傳統激活函數在增加或者減少的時候梯度會消失,而Relu并不會,這對于神經網絡的訓練來說很關鍵。從數學上來看,非線性的sigmoid函數對兩側的信號增益較小,對中央區域增益較大。從神經學上來說,兩側區域類似于抑制區域,中央區域類似于興奮區域,所以可以將重點推向中央區,非重點特征放入兩側區。而對于Relu來說,其主要有三點變化,第一是單側抑制;第二是相對寬廣的興奮邊界;第三是稀疏激活性。其公式為:

同年,Charles Dugas等人也提出了Softplus函數,該函數類似于強制非負校正函數max(0,x)的平滑版本。其公式為:

Relu整流線性單元使用深度神經網絡主要應用在計算機視覺與語音識別等領域中,取得了很好的效果。

2 深度學習開發框架

目前人氣比較高的幾個深度學習的開源框架有三個,分別是Caffe框架,Theano框架和Torch框架。

⑴ Caffe

Caffe源自加州伯克利分校的Caffe被廣泛應用,包括Pinterest這樣的Web大戶。與TensorFlow一樣,Caffe也是由C++開發,Caffe也是Google今年早些時候發布的DeepDream項目(可以識別“喵星人”的人工智能神經網絡)的基礎。

⑵ Theano

2008年Theano誕生于蒙特利爾理工學院,Theano派生出了大量深度學習Python軟件包,最著名的包括Blocks和Keras,近幾年還有Lasagne。

相對于Keras的傻瓜式操作,Lasagne有更復雜的參數設置系統,若繼續深入學習神經網絡結構及其流程,Lasagne是更好的選擇。

⑶ Torch

Torch誕生已經有十年之久,但是真正起勢得益于14年Facebook開源了大量Torch的深度學習模塊和擴展。Torch另外一個特殊之處是采用了不怎么流行的編程語言Lua(該語言曾被用來開發視頻游戲)。

3 結束語

深度學習的概念自06年被提出以來不斷發展,受益于大數據時代的到來,深度學習受到了越來越多的重視,其在圖像、語音、語文識別領域,以及人工智能領域都有不小的突破。目前深度學習領域還有很多有待解決和發現的問題,在深度學習的拓展方面,如何充分利用深度學習的方式來增強傳統算法的性能是目前深度學習研究的重點。

參考文獻(References):

[1] D.E.Rumelhart, G.E.Hinton, and R.J.Williams.Learning

internal representations by error propagation. Nature,1986.323(99):533-536

[2] HINTON G E,OSINDERO S,TEH Y W.A fast learning

algorithm for deep belief nets[J].Neural Computation,2006.18(7):1527-1554

[3] Bengio, Yoshua (2009)."Learning Deep Archi-tectures

for AI".Foundations and Trends in Machine Learning2(1):1-127

[4] Larochelle, Hugo; Salakhutdinov, Ruslan (2010). "Efficient

Learning of Deep Boltzmann Machines":693-700

[5] Han, Jun; Morag, Claudio (1995). "The influence of the

sigmoid function parameters on the speed of backpropagation learning". In Mira, José; Sandoval, Francisco. From Natural to Artificial Neural Computation. pp:195-201

[6] Robert E. Bradley, Lawrence A. D'Antonio, Charles

Edward Sandifer.Euler at 300: an appreciation. Mathematical Association of America,2007:100

[7] Xavier Glorot, Antoine Bordes and Yoshua Bengio(2011).

Deep sparse rectifier neural networks. AISTATS.

猜你喜歡
機器學習深度學習
基于詞典與機器學習的中文微博情感分析
有體驗的學習才是有意義的學習
電子商務中基于深度學習的虛假交易識別研究
現代情報(2016年10期)2016-12-15 11:50:53
MOOC與翻轉課堂融合的深度學習場域建構
大數據技術在反恐怖主義中的應用展望
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
深度學習算法應用于巖石圖像處理的可行性研究
軟件導刊(2016年9期)2016-11-07 22:20:49
基于深度卷積網絡的人臉年齡分析算法與實現
軟件工程(2016年8期)2016-10-25 15:47:34
基于支持向量機的金融數據分析研究
主站蜘蛛池模板: 国产乱人伦精品一区二区| AⅤ色综合久久天堂AV色综合| 国产欧美日韩免费| a天堂视频| 国产午夜无码片在线观看网站| 日韩欧美国产综合| 亚洲高清无在码在线无弹窗| 久久香蕉国产线看精品| 国产女同自拍视频| 欧美性久久久久| 欧美a在线视频| 一本大道视频精品人妻| 日韩视频福利| 美女一级免费毛片| 91亚洲国产视频| 国产欧美成人不卡视频| 国产成人久视频免费| 亚洲国产成人精品一二区| 欧美精品成人| 999精品免费视频| 亚洲中文字幕在线一区播放| 亚洲色图另类| 无码久看视频| 国产亚洲成AⅤ人片在线观看| 久久国产热| 亚洲无码日韩一区| 亚洲天堂网站在线| 国产在线观看99| 亚洲精品无码久久毛片波多野吉| 看你懂的巨臀中文字幕一区二区| 欧美色视频在线| 国产精品无码AV中文| 国产一区免费在线观看| 亚洲一级毛片免费观看| 中文字幕人妻av一区二区| 精品国产免费观看一区| 国产尤物在线播放| 日日噜噜夜夜狠狠视频| 久久精品日日躁夜夜躁欧美| 日本高清成本人视频一区| 久草网视频在线| 97se亚洲综合在线天天| 成人在线综合| 人妻一区二区三区无码精品一区 | 国产精品真实对白精彩久久| 日韩经典精品无码一区二区| a级毛片免费看| 亚洲中文制服丝袜欧美精品| 麻豆精品在线播放| 免费在线播放毛片| 国产精品久久自在自线观看| 亚洲无线国产观看| 无码国产偷倩在线播放老年人| 国产欧美日韩综合一区在线播放| 萌白酱国产一区二区| 欧美日本一区二区三区免费| 亚洲欧美日韩色图| 亚洲综合专区| 欧美日韩第三页| 91国语视频| 婷婷在线网站| 中文字幕亚洲精品2页| 亚洲日本在线免费观看| 亚洲天堂精品视频| 99视频在线精品免费观看6| 女人毛片a级大学毛片免费| 色婷婷色丁香| 午夜福利视频一区| 高潮毛片无遮挡高清视频播放| a毛片免费在线观看| 九色在线视频导航91| 欧美精品另类| 色香蕉影院| 97色婷婷成人综合在线观看| 国产在线麻豆波多野结衣| 亚洲中文久久精品无玛| 丝袜国产一区| 无码精油按摩潮喷在线播放| 久久久久久久97| 国产精品19p| 少妇精品网站| 亚洲午夜久久久精品电影院|