999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

深度學習技術在信息系統數據分析中的應用

2017-08-08 02:04:22林偉聲
電腦與電信 2017年6期
關鍵詞:深度模型

林偉聲

(廣州市城市規劃自動化中心,廣東 廣州 510000)

深度學習技術在信息系統數據分析中的應用

林偉聲

(廣州市城市規劃自動化中心,廣東 廣州 510000)

深度學習是近年來機器學習領域的一個熱點研究方向,其主要方法是通過增加學習器的層數,增大其通道數和參數的規模,借助大數據學習時代的超強計算能力,發現原始數據集中的高層抽象概念,為應用領域的決策支持服務。探討了在信息系統的數據分析任務中深度學習技術的應用方法,著重闡述了卷積神經網絡和堆疊自動編碼器的主要原理和實現方法,及其在信息系統的數據分析中的應用案例,并對其應用價值進行了分析。

深度學習;信息系統數據分析;卷積神經網絡;堆疊自動編碼器

1 背景和研究現狀

深度學習是近年來機器學習領域的一個熱點研究方向,相對于淺層次學習而言,深度學習的主要特征是大大增加了學習器模型的層次,也即數據從輸入端到輸出端所需要經過的運算子個數,在這種情況下,學習器也同時增大了通道數和參數的規模,借助大數據學習時代的超強計算能力,使其具備表達復雜函數的能力,同時也使其能夠發現原始數據集中的高層抽象概念,為應用領域的決策支持服務。

隨著計算機軟硬件技術的發展,信息系統與各個具體的業務領域的結合越來越緊密,在把各種業務過程進行信息化處理的過程中,收集了大量的結構化/非結構化數據,而對這些數據的分析、理解和知識發現是對傳統信息系統技術的挑戰。例如,在一個超市的銷售數據中,通過大數據挖掘技術,發現商品購買習慣與消費者的個人信息之間的關系,為商品的進貨、擺架、促銷活動的設計等進行服務;在一個醫學圖像診斷系統中,通過對圖像和診斷結果進行深度學習,可以對醫生的診斷經驗進行建模,從而實現醫學圖像的計算機輔助診斷。以上目標的實現,有兩個先決條件,一是需要收集海量的數據;二是需要強有力的算法從海量數據中獲取知識,而這類算法均需要強大的計算能力作為支持。

在當前,深度學習技術吸引著大批機器學習研究者和應用領域研究者的興趣,無論是理論研究還是應用研究都出現了大量有價值的成果。Hinton等人[1]于2006年在Science中發表文章,提出了一個訓練深度神經網絡的有效方法,被認為是近年來深度學習研究開始走向成熟的標志。卷積神經網絡(Convolutional NeuralNetwork,CNN)[2]在圖像理解上的成功,大大鼓舞了機器學習和人工智能界,其中主要的代表為Krizhevsky等人[3]在2012年提出的AlexNet架構,在ImageNet數據集[4]的圖像理解問題上,大幅提升了機器學習模型的正確率。在隨后幾年的ImageNet大賽中,卷積神經網絡在圖像理解中的正確率不斷創出新高,其中Google的GoogleNet[5]和百度的ResNet[6]均有很好的表現,同時訓練這些模型所需要的計算代價也是巨大的。最近,采用深度學習技術的人工智能圍棋程序A lphaGo[7]在與人類頂尖棋手的對戰過程中大獲全勝,是對深度學習算法強大能力的一個很好的說明。

本文探討深度學習技術在信息系統的數據分析和知識發現中的應用,闡述兩個常用的深度學習模型的基本原理,即卷積神經網絡和堆疊自動編碼器,給出它們在信息系統的深度學習中的使用案例,并對結果進行分析。

2 深度學習模型

2.1 卷積神經網絡

卷積神經網絡(Convolutional Neural Network)在圖像理解問題中有良好的表現,它的主要原理是采用一系列的卷積層、池化層、非線性激活層和隨機屏蔽層等對原始的輸入信號進行非線性化變換,在此過程中逐步抽取原始輸入信號的本質特征,通過對誤差的反向傳播,使用一種有監督的方式對網絡中的權值進行調整,使其在訓練和評估數據集上的誤差達到最小。其中最重要的操作為卷積操作,在每一卷積層中,通過一個固定大小的卷積核,對輸入的信號進行連續掃描并進行卷積運算,可以有效獲取輸入信號中的局部性特征,適用于圖像分類、標注相關的問題求解。

對于激活層,一般采用Sigmoid函數和Relu函數,其形式公式(1)和公式(2)所示:

圖1展示了一個卷積神經網絡的基本結構。

圖1 卷積神經網絡的基本結構

在圖1中,卷積神經網絡通過多個塊(Block)的疊加,逐層進行特征的抽象化,每個塊由卷積層、非線性激活層和池化層構成,其中池化層一個鄰域內的特征通過平均或求最大值的方式對特征進行歸納,提取關鍵特征并減少特征維數。隨機屏蔽層以一定的百分比屏蔽輸出單元,使輸出不能重度依賴于少數幾個單元,提升了模型的泛化能力。SoftMax輸出層是一個多分類函數,得到一個1-of-k編碼的輸出,對于多分類問題,應使Multi-class SVM或BP網絡[8]。

2.2 堆疊自動編碼器

堆疊自動編碼器是一種無監督(Unsupervised)的特征變換器,其中每一個自動編碼器是一個三層結構的網絡,包括輸入層、中間層和輸出層,中間層執行一個非線性變換函數,訓練的目標為要求輸出的向量能盡可能地還原為輸入向量。通過多個自動編碼器的堆疊,原始輸入特征被層層變換,但每一層都盡可能保持與原始輸入等價的信息量。圖2展示了單一一個自動編碼器的基本結構。

圖2 自動編碼器的基本結構

3 應用實例

在UCI數據集[9]上進行上述深度學習模型的測試,選取其中兩個來自于信息系統的數據庫,分別是Nursery和Census Income,兩個數據集均有明顯的信息系統應用背景。主要屬性見表1。

表1 數據集的基本屬性

為了測試模型的有效性,把兩個數據集按如下方式劃分為訓練集、驗證集和測試集,其大小比例為8:1:1,其中訓練集用于訓練模型,驗證集用于在模型的訓練過程中評估模型的訓練效果,測試集用于測試完成訓練的模型的性能,在本文的設定中,測試集在訓練過程中不可見。

本應用案例中,需要實現兩個深度學習模型和一個支持向量機分類器。對于深度學習模型,采用的是MatConvNet深度學習框架[10],該框架是基于Matlab實現的,其核心是用C語言編寫的,具有良好的用戶界面和優秀的運行效率。對于支持向量機分類器,使用當前性能最佳的LibSVM。

設計了兩個實驗用于展示深度學習模型的效果。第一個是采用卷積神經網絡對兩個數據集的分類標簽進行預測,具體的做法為把兩個數據集通過MatConvNet的API函數轉換為其內置對象imdb,對其中的數據屬性進行min-max歸一化,然后編寫網絡配置腳本進行網絡設計,參考著名的A lexNet進行設計,采用5個塊相互連接,卷積核的大小固定在5*1,池化層采用max-pooling,最后增加三個全連接層,每一個全連接層后面附有一個20%的隨機屏蔽層。訓練共進行30輪,學習率采用0.01*15、0.001*10、0.0005*5,記錄每一輪的top1err。表2展示了在這個實驗中模型對兩個數據集分類的正確率和方差。

表2 卷積神經網絡的分類正確率和方差

第二個是用堆疊自動編碼器對數據集進行編碼,然后再訓練一個支持向量機分類器,采用7層的堆疊自動編碼器,最終的輸出維數Nursery為10,Census Income為12,支持向量機采用LibSVM實現,核函數使用參數為缺省值的徑向基函數,不設置懲罰項,同時把不經過自動編碼器的原始屬性直接輸入支持向量機模型進行對比。表3展示本部分實驗的結果。

表3 卷積神經網絡的分類正確率和方差

從表3中可以看了,經過堆疊自動編碼器編碼后的數據集在SVM上的表現更好,說明了深度學習模型在信息系統的數據分析中的作用十分顯著。

4 結論和展望

本文闡述了深度學習技術在信息系統的數據分析中的應用,并給出了具體的技術路線。通過在兩個數據集上對兩個深度學習模型的應用實踐,展示了深度學習模型在數據分析中的顯著作用。在今后的研究中,將進一步把深度學習技術與大數據分析技術結合,同時引入更多信息系統所承載的業務內容,建立面向行業應用的深度學習大數據分析平臺,為企業的決策支持提供更有效的保障。

[1]Hinton,G.E.&Salakhutdinov,R.R.Reducing the dimensionality of dataw ith neuralnetworks[J].Science,2006,313,504-507.

[2]Bengio,Y.Learning Deep Architectures for AI[J].Foundation TrendsofMachine Learning,Now Publishers Inc.,2009,2,1-127.

[3]Krizhevsky,A.,Sutskever,I.,Hinton,G.E.ImageNetClassification w ith Deep Convolutional Neural Networks[C].Advances in Neural Information Processing Systems,2012,25,2012.

[4]Olga Russakovsky,Jia Deng,Hao Su,Jonathan Krause,Sanjeev Satheesh,Sean Ma,Zhiheng Huang,Andrej Karpathy,Aditya Khosla,M ichael Bernstein,Alexander C.Berg and Li Fei-Fei[C].ImageNet Large Scale VisualRecognition Challenge,IJCV,2015.

[5]Szegedy,C.;Liu,W.;Jia,Y.;Sermanet,P.;Reed,S.;Anguelov,D.;Erhan,D.;Vanhoucke,V.&Rabinovich,A.Going deeperw ith convolutions[C].2015 IEEEConference on Computer Vision and Pattern Recognition(CVPR),2015,1-9.

[6]Kaim ing He;Xiangyu Zhang;Shaoqing Ren;Jian Sun;undefined;undefined;undefined&undefined Deep Residual Learning for Image Recognition 2016 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),IEEEComputer Society,2016,00,770-778.

[7]Silver,D.;Huang,A.;Maddison,C.J.;Guez,A.;Sifre,L.;Van,d.D.G.;Schrittw ieser,J.;Antonoglou,I.;Panneershelvam,V.& Lanctot,M.Mastering the game of Go w ith deep neural networks and tree search[J].Nature,2016,529,484.

[8]Bishop,C.M.Pattern Recognition and Machine Learning(Information Scienceand Statistics)[B].Springer-Verlag New York,Inc.,2006.

[9]Bache,K.&Lichman,M.UCIMachine Learning Repository [EB/OL].University of California,Irvine,Schoolof Information and Computer Sciences,University of California,Irvine,School of Information and Computer Sciences,2013.

[10]Vedaldi,A.&Lenc,K.MatConvNet--Convolutional Neural Networks forMATLAB[C].Proceeding of theACM Int.Conf.on Multimedia,2015.

The Application of Deep Learning Technologies in Data Analysisof Information System

LinWeisheng
(Guangzhou City Planning Automation Center,Guangzhou 510000,Guangdong)

Deep learing isan active research area inmachine learning community.Itsmain idea is to discoverhigh-levelAbstractconcepts in original datasetsw ith huge computational power of the age of big data,by increasing the number of layers of the learners,so as to increase the sizeof channelsand thequantity of parameters.Itbecomesa significantinformation source for decision supportof application domains.We explore themethodsof applying deep learning technologies in the data analysis tasksof information systems by presenting themain principles and implemetation details of two deep learningmodels,convolutionan neuralnetwork and stacked auto-encoders in emphasis,their application cases in the data analysis of information system,aswellas the analysis on their application value.

deep learning;dataanalysisof information system;convolutionalneuralnetwork;stacked auto-encoder

TP391.4

A

1008-6609(2017)06-0051-03

林偉聲(1980-),男,廣東揭陽人,助理工程師,研究方向為信息系統數據分析、卷積神經網絡、堆疊自動編碼器。

猜你喜歡
深度模型
一半模型
深度理解一元一次方程
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
深度觀察
深度觀察
深度觀察
深度觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 国产福利一区二区在线观看| 亚洲精品中文字幕午夜| 欧美区一区| 四虎影视国产精品| 国产精品视频白浆免费视频| 玩两个丰满老熟女久久网| 成年片色大黄全免费网站久久| 久无码久无码av无码| 真实国产乱子伦高清| 亚洲综合久久成人AV| 国产91在线|日本| 国产欧美亚洲精品第3页在线| 91精品国产一区| 69av在线| 中文字幕无码制服中字| 日韩精品少妇无码受不了| 91啪在线| 欧美中文字幕无线码视频| 亚洲国产成人综合精品2020| 欧美精品亚洲精品日韩专区va| 国产H片无码不卡在线视频| 亚洲精品无码av中文字幕| 中文字幕亚洲乱码熟女1区2区| 美女一区二区在线观看| 国产一区亚洲一区| 曰韩免费无码AV一区二区| 欧美人在线一区二区三区| 亚洲第一在线播放| 亚洲日韩精品伊甸| 久久夜夜视频| 欧洲在线免费视频| 99视频精品在线观看| 国产欧美视频综合二区| 亚洲视频在线青青| 国产粉嫩粉嫩的18在线播放91 | 中文字幕欧美日韩高清| 亚洲第一成人在线| 国产精品一线天| 国产麻豆91网在线看| 国产91在线免费视频| 亚洲五月激情网| 日韩精品专区免费无码aⅴ| 国产香蕉97碰碰视频VA碰碰看| 国产乱人激情H在线观看| 97国产精品视频自在拍| 国产麻豆va精品视频| 久久久久亚洲AV成人网站软件| 在线a网站| 色欲色欲久久综合网| 91在线无码精品秘九色APP | 天天综合色天天综合网| 亚洲bt欧美bt精品| 国产喷水视频| 中文字幕色站| 国产成人无码AV在线播放动漫| 色老头综合网| 97色伦色在线综合视频| 亚洲av片在线免费观看| 久久精品视频亚洲| 色婷婷在线播放| 久久久久久久久久国产精品| 黄色福利在线| 国产第二十一页| 国产精品密蕾丝视频| 国产福利在线观看精品| 中文字幕日韩视频欧美一区| 国产欧美日韩在线一区| 伊人无码视屏| 欧美一级爱操视频| 国产激爽大片高清在线观看| 国产精品开放后亚洲| 老熟妇喷水一区二区三区| 国产69精品久久久久孕妇大杂乱| 国产毛片高清一级国语 | 国产女主播一区| 欧美区一区| 97人人做人人爽香蕉精品| 2019国产在线| 欧美午夜视频| 久久国产香蕉| 中文字幕在线播放不卡| 呦女精品网站|