陳思哲
摘 要 作為機器學習算法當中具有極高復雜程度的算法之一,深度學習算法具有強大的分析和學習能力,帶有強烈的智能化色彩。而通過將其與卷積神經網絡進行充分融合,可以有效增強多層感知器的數據分析、圖像處理等能力,對人們分析處理各種數據具有十分重要的幫助作用。因此,本文將在簡單介紹卷積神經網絡下的深度學習算法基礎之上,對其實際應用進行簡要分析研究。
關鍵詞 卷積神經網絡;深度學習算法;模式識別
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2017)195-0059-02
經過長期的發展,機器學習已經拓展至了深度學習這一全新的領域。深度學習通過堆疊眾多層,并將每一層的輸出作為下一層的輸入,可以有效實現分級表達輸入信息的目的,進而大大方便人們對信息數據的識別和分析處理。而在卷積神經網絡基礎下,深度學習算法可以使得卷積層對輸入的圖像進行卷積的基礎之上完成特征信息的分級表達,從而使得模式識別更加簡易、
精確。
基于此,本文將著重圍繞卷積神經網絡基礎下的深度學習算法及應用進行探究。
1 卷積神經網絡下的深度學習算法
1.1 卷積神經網絡
卷積神經網絡雖然歸屬于神經網絡范疇,但其具有多層監督學習的特性,并且主要由特征采樣層和特征提取層,也就是卷積層共同組合
而成。
其中每一層都由若干二維平面構成,而每一個二維平面都由若干獨立神經元組成。特征采樣層在完成樣本局部特征提取之后,明確局部特征的具體位置以及彼此之間的關系,此后由卷積層采用梯度下降法控制損失函數,使之降至最小,而后通過利用網絡權重參數,對卷積神經網絡當中的每一層進行反向調節。在反復迭代訓練之下,有效保障卷積神經網絡的高精
確度[1]。
1.2 深度學習算法
假設在L系統當中總共擁有n層,第一層為L1、第二層為L2,以此類推直至第n層Ln。輸入和輸出分別為I與O,則。在輸出與輸入即I和O相等的條件下,系統L在輸入L的整個過程中信息完好無損,則表示在系統L中的任何一層當中,輸入I都存在另一種表示,則此時我們將自動獲得與輸入I相對應的各種層次特征。簡單來說,深度學習就是通過借鑒機器學習的算法,利用多層堆疊的方式使得這一層輸出可以作為下一層的輸入,從而分級表達輸入的
信息。
1.3 稀疏連接
與其他神經網絡不同的是,在卷積神經網絡當中相鄰兩層之間的所有神經元節點并非相互連接。在充分利用卷積層之間的局部空間之后,層與層之間的神經元節點將形成局部連接的情況。而此時如果將m-1層設置為輸入層,則在卷積神經網絡當中,m層神經元節點和與之相鄰的其他節點(通常為3個)之間可以形成有效連接,此時神經網絡架構的參數規模將得到有效
控制。
1.4 權重共享
處于卷積神經網絡當中的每一種卷積濾波器,都會在卷積層當中重復作用與感受,也就是實時卷積輸入的圖像和數據信息,并由此自動生成卷積結果,得到與輸入圖像相對應的特征圖。此時卷積神經網絡中的特征提取層將逐一提取特征,而相同的參數則會通過卷積濾波器進行共享。一般在m層特征圖像當中國會有3個神經元,負責共享各連接線間的權重
參數[2]。
2 卷積神經網絡基礎下深度學習算法的實際應用
2.1 處理自然語言
卷積神經網絡基礎下的深度學習算法目前已經被廣泛運用在處理自然語言方面。在該算法尚未出現之前,處理自然語言一直使用的是統計模型,該模型雖然能夠基本完成自然語言的處理,但其處理效率和處理精確性一直處于較低的水準。隨著人們對神經網絡研究的不斷深入,在卷積神經網絡出現后,人們發現其在處理自然語言方面具有較大的優勢作用。美國的NEC研究院作為世界上最早研究卷積神經網絡下的深度學習算法的機構,在十年前首次嘗試運用深度學習算法處理自然語言。其通過利用卷積神經網絡的多層一維卷積結構,在一維矢量空間當中實現詞匯的一一映射,能夠有效完成包括標注詞性和語義角色等在內的眾多自然語言問題,同時在算法的運用之下,原本一長串的字符字串被分成若干短小的詞匯,從而有效提高的自然語言的處理精
確性。
2.2 圖像識別
卷積神經網絡作為深度神經網絡模型的一種,其通過不斷訓練下形成的兩個非線性卷積層和牢牢固定的兩個子采樣層構成的卷積神經網絡架構,模擬出位于動物視覺皮層當中或復雜或簡單的細胞,從而完成圖像識別的讀取。但由于自然圖像往往存在像素較大的情況,因此卷積神經網絡很難在短時間內充分理解自然圖像的內容,進而影響導致最終的圖像識別
效果。
隨后研究人員通過改變卷積神經網絡的算法,在網絡架構的基礎之上運用深度學習算法并建立起深度神經網絡,并將權重衰減的理念運用在網絡訓練中,以有效減小權重幅度。配合現代化的電子計算機,使得樣本的擬合速度得到明顯提升,圖像特征數據的提取和識別也變得越來越
高效。
目前在支付寶當中推出的人臉識別付款功能便是運用了卷積神經網絡下的深度學習算法,此外該算法還在車輛監控等方面得到廣泛運用,工作人員通過運用算法識別不同圖像中的車輛特征如位置、狀態等可以有效監控車輛
行蹤[3]。
2.3 語音識別
現階段百度公司已經成功將卷積神經網絡下的深度學習算法運用在了語音識別當中。該公司搭建起的九層深度神經網絡架構,在深度學習算法下可以分級描述出每一層特征狀態空間的分布,工作人員通過調整輸入和輸出使之保持相等,即可有效明確特征的具體位置,以此相互之間的相關性。在輸入原始的語音樣本之后,直接運用卷積神經網絡基礎下的深度學習算法,構建起深度神經網絡架構,將反復對語音樣本進行網絡訓練,此時其將根據提取的語音樣本特征對目標語音進行識別判斷,這對于從大量的語料數據中迅速、精準地提取有效信息具有十分重要的幫助
作用。
3 結論
總而言之,深度學習算法通過對機器學習進行進一步發展,使得計算機可以在海量的信息數據中深度學習具有潛在特征與規律的信息,進而有效完成模式和樣本的智能
識別。
在卷積神經網絡基礎下,深度學習算法目前已經被廣泛應用在了自然語言的處理以及圖像、語音的識別等眾多領域當中,且已經取得了一定的應用效果。相信隨著人們對深度學習算法研究的不斷深入,未來其應用范圍還將得到進一步拓寬,可以被靈活運用至各個領域當中,更好地幫助人們完成信息數據的識別和分析處理
工作。
參考文獻
[1]盧宏濤,張秦川.深度卷積神經網絡在計算機視覺中的應用研究綜述[J].數據采集與處理,2016,31(1):1-17.
[2]騫宇澄,劉昭策.深度學習的實現與發展——從神經網絡到機器學習[J].電子技術與軟件工程,2017(11):
30-31.
[3]何克磊,史穎歡,高陽,等.一種基于原型學習的多示例卷積神經網絡[J].計算機學報,2017,40(6):1265-1274.endprint