王志宇
摘要:隨著計算機硬件的快速發展,計算機的計算能力得到了極大的提高,需要大量計算的深度學習算法得以發展,并大規模地應用到各個領域之中。本文介紹了深度學習及其衍生出的遷移學習的原理及其各自試用的場景,以望為之后的研究者提供一定的參考。
關鍵詞:深度學習;遷移學習;神經網絡;特征提取
中圖分類號:TP181文獻標識碼:A文章編號:1672-9129(2020)14-0099-01
隨著信息時代的到來,深度學習的應用領域正在逐步增加。深度學習是學習尋找數據之間存在的潛在關系。在學習過程中獲得的信息對于解釋諸如文本,圖像和聲音之類的數據非常有利。它的最終目標是使機器能夠像人類一樣進行分析事務和學習其特點,并進行文本識別、圖像識別和語音識別等。
1深度學習的原理
機器學習的工作原理,是找到將輸入數據映射到目標結果的規則,而深度學習,是通過一系列的數據變換,來實現輸入數據到目標結果的映射。在深度學習中,每層的變換由一組權重來實現,因此,深度學習的本質是為神經網絡的所有層找到一組權重值,使得該網絡能夠將每個輸入與目標準確對應。深度學習通常使用損失函數來衡量輸出值與預期值之間的距離,然后將這個距離值的大小作為神經網絡反饋的信號,對目標的權重值大小進行相應的微調,從而可以得到最佳的權重值。卷積神經網絡是深度學習的一類表現比較優秀的算法,卷積神經雖然結構比較復雜,但其實質就是特征提取以及決策推斷,要使特征提取盡量準確,就需要將這些網絡層結構進行巧妙的組合。
因此,深度學習的基本步驟如下:
(1)對神經網絡的權重隨機賦值,由于是對輸入數據進行隨機的變換,因此跟預期值可能差距很大,相應地,損失值也很高。
(2)根據損失值,利用梯度下降法調整每一層網絡的參數,以達到減小損失值的目的。
(3)根據預測值,對比其與真實值存在的差距,即損失值。
(4)重復步驟上訴步驟,直至網絡的損失值最小,此時說明模型已經收斂。
2遷移學習的原理及特點
遷移學習主要有兩種被廣泛使用的方法,第一種便是通常意義上的 finetune,即微調,簡而言之就是在他人訓練好的網絡基礎上進行一定的修改用于目標學習任務。遷移學習訓練數據量需求量更小,當在一個新任務中重復使用訓練好的模型時,該訓練模型已經可以很好地獲取圖像的特征了,這意味著不需要再使用很多的圖片來訓練新任務了。減少訓練數據可以在數據少,數據更多的成本太高且無法獲取更多數據時訓練模型 同時,為了可以在擁有性能較低的硬件配置的情況下更快地訓練模型,遷移學習的訓練模型由于其泛化性較強逐漸受到研究者們的青睞,它可以提高對非訓練數據的準確進行分類的能力,這是因為在訓練模型時,有目的地讓模型學習對手頭任務有用的一般特征是有目的。當模型遷移到一個新任務時,它需要重新學習,且很難過擬合新的訓練數據。如何構建一個泛化能力強的模型,是圖像分類的一個重要研究方向。訓練一個帶有數百萬參數的復雜模型,需要消耗大量的計算資源且結果非常不穩定。如果從一個預訓練的模型開始,則可以避免這種情況。遷移學習可以大量度減少訓練參數,使得訓練更穩定且更容易調試。基于GoogLeNet的Inception_V3預訓練模型的遷移學習算法可以有效地減少對硬件配置性能的要并減少訓練集數量的要求。
3遷移學習的應用場景
當擁有充足的數據資源和計算資源時,通常使用傳統的深度學習,當不具備此類條件時,可以采用遷移學習。訓練成本是實際應用中需要考慮的重要因素,即所依賴的計算資源和耗費的訓練時間,成本較低的算法往往更能滿足實際的需要。通常情況下,很少會有研究者從頭開始訓練整個深度網絡,一方面是受限于數據量不足的問題,另一方面是受限于時間成本和計算資源的問題,對于一個實驗性極強的研究領域而言,花費數天乃至數周的時間和大量精力去訓練一個結果未知且復雜的深度神經網絡通常是不可取的。
因此,遷移學習的使用場景如下:假設有兩個任務系統 X和Y任務,X 擁有海量的數據資源且已訓練好,但并不是目標任務,任務Y是目標任務,但Y的數據量很少且難以獲取,這種場景便是典型的遷移學習的應用場景。所以,要判斷一個遷移學習應用是否有效,必須遵守遷移學習最基本的原則,即任務X和任務Y在輸入上有一定的相似性,即兩個任務的輸入屬于同一性質,如同是圖像或者同是語音等。
4深度學習與遷移學習的關系
只有當從第一個任務中學習到的模型特征易于推廣時,遷移學習才能在深度學習中發揮作用。如今,深度學習在包括自然語言、圖像分類等各種各樣的任務中表現突出。然而,盡管深度學習具有如此高的性能,但在一些特定的情形下,使用經典的機器學習算法要優于大型深度網絡算法。目前深度學習在人工智能領域有著優秀表現,但選擇卷積神經網絡也面臨著各種難題。首先,所有的卷積神經網絡都需要大量的數據集,而大量數據集的計算則需要非常高的計算資源,當在數據樣本較少和計算資源有限的情形下,選擇一種少量數據集下依舊表現優秀的卷積神經網絡,就成為了研究的關鍵點。
5總結
隨著科學技術的快速發展,深度學習及其衍生的相關算法已經應用在生活中的各個領域,如何將不同的深度學習算法應用到相應條件下的應用場景中從而提高效率。本文介紹了部分淺談深度學習與遷移學習的原理與應用,其包含范圍遠不如此,深度學習領域還需要研究者進一步的探索。
參考文獻:
[1] 淺談深度學習[J]. 李開菊,鄭波盡.軟件.2016(05)
[2] 基于遷移學習的類別級物體識別與檢測研究與進展[J]. 張雪松,莊嚴,閆飛,王偉.自動化學報. 2019(07)
[3] 基于深度學習的語音識別技術現狀與展望[J]. 戴禮榮,張仕良,黃智穎.數據采集與處理.2017(02)