999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于深度學習的少樣本研究綜述*

2021-02-26 01:43:12盧依宏蔡堅勇曾遠強
電訊技術 2021年1期
關鍵詞:方法模型

盧依宏,蔡堅勇,鄭 華,曾遠強

(福建師范大學 光電與信息工程學院,福州 350007)

0 引 言

由于基于深度學習的神經網絡在目標特征的提取上具有無可比擬的優勢,因此神經網絡在圖像處理領域中被廣泛應用[1-3]。然而實驗過程中發現,當訓練數據非常少時,神經網絡中的每個單元不得不考慮到每個樣本中物體的定位和分類特征,整個神經網絡會變得過擬合。因此少樣本問題一直以來是深度學習研究中的一個難點[4]。

本文針對深度學習領域中少樣本學習的問題,總結并分析經典及最新的方法,最后展望其未來的研究方向。

1 少樣本問題的定義

在訓練一個高效、精確的神經網絡時,通常需要大量帶有標簽的數據,而在許多情況下每個類別只有一個或幾個訓練樣本,如視頻監控、衛星圖像、異常檢測等。同時,在如生物醫療圖像識別任務中,往往會遇到特殊病例下患病樣本與正常樣本數極度不平衡的情況,這時正常樣本數越多越影響網絡性能。因此,將這種由于樣本數不足或樣本質量有嚴重偏差從而導致神經網絡的性能嚴重下降的情況稱為少樣本問題。

與普通的只訓練一類數據的神經網絡不同,少樣本學習訓練集(支持集)有許多不同的類,每類又包含許多不同的樣本,因此少樣本學習又稱為N-way、K-shot問題,其中N表示數據集共有N個類,K表示每個類中有K個樣本。因為是少樣本,所以K一般在1~20之間,實驗中K往往取5、10、15。

2 基于深度神經網絡的少樣本學習方法

2.1 數據增強

數據增強是一種常用的數據處理方法。早期主要通過對數據進行空間變換,如旋轉、平移、縮放、剪裁、顏色變化等[5],來生成更大數據集。隨著深度神經網絡的發展,也出現了許多利用如對抗生成網絡(Generative Adversarial Nets,GAN)等其他網絡來擴展數據的方法。

2.1.1 空間變化

Salehinejad等人[6]提出對醫學圖像采用徑向變化方法,將笛卡爾坐標映射到極坐標來展開圖像,得到一張圖像很多個不同的徑向變化圖,不僅保留了原始圖像的信息還提高了訓練數據集的多樣性,從而改善了神經網絡的泛化性能。對現有數據集進行簡單的空間變化操作生成更大的數據集,是早期在基于深度學習的神經網絡中最基本的數據操作。

2.1.2 基于幻覺模型的數據增強

由于樣本數很少,當訓練樣本中的物體發生變形時,神經網絡無法準確識別。因此,許多研究人員思考如何讓神經網絡學會“幻覺化” 訓練樣本中的物體。

在Goodfellow等人[7]提出的對抗生成網絡中,生成網絡和判別網絡的動態“博弈過程”可以生成非常接近真實圖像的虛假圖像。Antoniou等人[8]提出了基于生成對抗網絡的數據增強方法(Data Augmentation Generative Adversarial Networks,DAGAN),利用編碼器將輸入圖像的向量和隨機向量結合,生成虛假圖像。這一將GAN網絡和數據增強結合在一起的方法,在實際應用上取得了很大的進展。

對于與基類完全不同的數據,Zhang等人[9]提出了一個新的網絡結構Salient網絡(SalNet),通過顯著性數據幻覺模型來增強數據。這是第一篇將顯著性圖用于少樣本學習的數據增強方法的論文,顯著性網絡很好地將圖像的前景背景分割開,也是該文的一個亮點。

上述“幻覺化”[10]數據增強方法為基類數據幻化出新的樣本,生成的“幻覺”樣本豐富了訓練數據的多樣性,從而提高了神經網絡識別新類別的性能。

2.1.3 基于合成多標簽樣本的數據增強

將多個單類別圖像的標簽融合來增加樣本標簽多樣性是常見的一種數據增強方法,但目前的融合標簽方法都是針對一張圖片只有一個標簽的情況,而自然圖像往往包含多個標簽。Alfassy[11]等人提出的一種新的合成樣本標簽的方法,成功將圖像的特征與標簽分離,生成訓練期間未出現過的標簽。該文提出的方法將訓練集標簽范圍擴充到已給標簽的交集、并集和去集中,大大提高了網絡分類圖像的泛化能力。

2.1.4 不同數據增強方法的比較

本節詳細介紹三種最新且效果顯著的數據增強方法,給出了相應的模型結構和實驗中取得的準確度。其中徑向變化在實驗中將MNIST數據集由原本的每類20張圖像擴充成每類2 000張,DAGAN中每類有5個樣本,LaSO實驗中的數據集包括64類已知樣本和16類未知樣本。

三種基于數據增強的少樣本學習方法對比如表1所示。

表1 基于數據增強的少樣本方法總結

不同數據增強方法各有優勢。通過空間變換來增加樣本數的方法簡單快速易操作,卻未增加樣本種類。利用幻覺模型來增加樣本數和通過集合運算擴充數據標簽的方法在測試樣本和訓練樣本種類一致時,可以取得很好的結果。因此,數據增強方法主要面臨樣本數非常少的情況下效果并不好的問題,以及測試樣本和訓練樣本類型完全不一樣的問題。

2.2 基于度量學習的優化設計

在少樣本研究中有很多利用非參數化估計(如最近鄰算法、K-近鄰算法、K均值聚類算法)的度量學習,對樣本間距離分布進行建模,使得同類樣本靠近異類樣本遠離。一般通過構造支持集和測試集的距離來分類,重點在距離的構造上,如要分類四張不同的動物圖像,并分辨出一張新圖像屬于前面四張圖像中的哪一個動物,這時可以比較新圖像和之前四張圖像的特征向量距離,距離越近代表特征越像,屬于同一類的概率就越大。

2.2.1 基于固定距離的度量學習

孿生網絡[12]是雙路神經網絡,網絡有兩個輸入,通過學習樣本的特征距離來判斷兩個樣本是否屬于同一個類,輸出圖像相似度的概率排名。

匹配網絡[13](Match Network)和原型網絡[14](Protoype network)的網絡結構類似。匹配網絡為支撐集構建靈活的編碼器,最終分類器的輸出是支持集樣本和詢問集樣本之間預測值的加權求和。原型網絡提出每個類都存在一個原型表達,該類的原型是支持集在嵌入空間中的均值。

上述三個網絡在最終的距離度量上都使用了固定的度量方式,如余弦距離、歐式距離等,這種模型結構下所有的學習過程都發生在樣本的嵌入階段。

2.2.2 基于可學習距離的度量學習

一些研究人員提出,在度量學習中,度量方式也是網絡中非常重要的一環,人為規定的度量方式在學習過程中會限制網絡的性能。因此,文獻[15]提出訓練一個相關網絡來學習度量距離,最終網絡輸出一個0~1的值,表示支持集和詢問集的相似程度。同時,網絡的損失也應該針對不同的任務而改變,在相關網絡中解決的是回歸問題,而非分類問題,所以使用均方誤差(Mean Square Error,MSE)代替交叉熵(Cross Entropy)[16]。

圖1 相關網絡結構圖[15]

2.2.3 度量學習方法總結

本節介紹兩種基于度量學習的少樣本方法,下面對比了每種方法使用的網絡模型,給出每一個網絡所使用的數據集,以及在Mini-ImageNet數據集上部分網絡取得的準確度。其中原型網絡和匹配網絡是由4個卷積塊組成,相關網絡由6個卷積塊加2個全連接層組成。

兩種基于度量學習的少樣本學習方法對比如表2所示。與其他方法相比,第一種使用歐式距離或余弦距離等固定距離的度量方法在單樣本學習(one-shot learning)中可以取得非常好的結果,但這種人為設計的度量方式存在一定局限性。因此,研究人員提出使用深度神經網絡來學習樣本之間的特征距離的方法,同時也使用了不同的損失函數來訓練網絡。從實驗結果可知,可學習的度量方式優于固定距離的度量方式。

表2 基于度量學習的少樣本方法總結

2.3 元學習

元學習是一種利用以往經驗來處理新任務,讓網絡學會如何學習的方法。元學習的目標是讓網絡在每個任務中快速學習這個任務最優解,在不同任務之間學習跨任務的學習能力。文獻[17]對元學習進行簡單定義,指出元學習是通過選擇參數來降低網絡在整個數據集的損失函數。

2.3.1 基于優化方式的元學習

基于優化方式的元學習使網絡不再從樣本中學習而是從任務中學習,最大化網絡的泛化能力[18]。Andrychowicz等人[19]提出一種讓網絡學習如何學習的方法,利用長短時記憶(Long Short-Term Memory)優化器實現元學習過程。同樣,在Rav等人[20]提出的方法中也使用了LSTM結構。Rav等人發現,在少量數據下,使用的一般梯度算法,如momentum、adagrad、adadelta、Adam[21]等,需要經過多次迭代才能完成優化,無法應用于需要快速學習不同任務的元學習中[22-23]。因此需要一個通用的初始化參數,可以讓模型從一個很好的初始參數開始訓練,在面對不同的任務時模型能實現快速學習[24]。

Finn等人[25]提出與模型無關的元學習方法(Model-agnostic Meta Learning,MAML),既與模型結構無關也不增加新的參數,且可以和任何使用梯度下降訓練的模型兼容。同時,MAML不僅可以用于圖像分類問題,在回歸和強化學習上也取得了很好的結果,因此MAML在元學習領域被廣泛應用。

Nichol等人[26]提出把MAML中對參數求二次導改為求一階導可簡化計算,從而提高網絡速度。同時,作者還對MAML算法中初始化參數的更新規則進行修改,提出了Reptile算法。

基于優化方式的各種元學習方法將深度學習的研究從網絡結構的優化變為參數優化,未來應進一步探索如何取得更有利的參數。

2.3.2 基于參數的跨任務元學習

文獻[27]提出一種與任務無關的元學習(Tast-agnostic Meta Learning,TAML)算法,通過加入正則化項提高網絡的通用性。具體而言,作者提出兩種新穎的TAML算法范式,一種使用基于熵的TAML度量,防止模型預測過程中偏向某一具體任務;另一種使用基于不平等最小化的TAML度量,對初始模型進行元訓練,使模型在面對不同任務時的差異更小。

2.3.3 基于模型權值的元學習

Sun等人[28]提出了一種元遷移學習方法,針對目前的元學習進行改進,將遷移學習和元學習結合,得到更優的性能,證明MAML具有很強的適用性,也為下一階段如何將元學習算法和遷移學習等其他方法結合提供了可能。

2.3.4 對比

本節歸納三種元學習方法的不同,并給出在Mini-ImageNet數據集上的準確度,其中數據集設置為1-shot 5-way。

三種基于元學習的少樣本學習方法對比結果如表3所示。基于優化方式的元學習適用性很強,可以和許多神經網絡模型結合使用,但是這種方法計算量大,因此要求網絡結構不能太復雜,否則會出現梯度爆炸或梯度消失的情況。從實驗結果可看出,Reptile算法在圖像分類任務的準確度上略差于MAML算法。基于參數的跨任務元學習效果雖好,但考慮到基于熵的方法的輸出取決于模型的輸出函數,因此它更適合特定的分類或回歸任務。

表3 基于元學習的少樣本方法總結

在未來的研究中,可以思考能否將元學習與數據增強或度量學習等方法相結合。并且元學習還面臨一個重要問題,即如何在保證計算量的同時提高模型復雜性。

3 少樣本學習的未來研究方向

隨著深度學習的應用越來越廣泛,少樣本學習問題也引起了重視,現有的少樣本學習方法雖然已經取得了很大的進展,但仍有很大的進步空間,在此提出幾點未來的研究方向:

(1)提高訓練樣本的復雜度

少樣本學習最終目的是能廣泛應用于實際生活中,然而在上述方法的實驗中,目前大部分少樣本學習模型訓練使用的數據集為Omniglot 和 ImageNet,這兩個數據集樣本的種類與復雜的現實生活相比過于簡單,雖在實驗中可以取得不錯的準確率,卻無法反映模型在實際應用中的效果,在未來的研究中應著重研究困難樣本的少樣本學習。

(2)無監督學習

監督學習是目前深度學習中最熱門的領域,但是許多情況下無標簽的數據集遠比有標簽數據更容易獲得。例如,在通過特征向量的距離來分類的度量學習中,是否可以使用無標簽的數據來訓練。借助大量無標簽的數據來幫助少量有標簽的數據進行學習,是未來研究的一個方向。

(3)神經網絡的深入

少樣本學習面臨的最大問題之一是過擬合現象,神經網絡中成千上萬的神經元會因為樣本數太少而過于偏向訓練樣本。許多元學習方法往往受限于過于簡單的網絡結構,因此優化神經網絡內部的神經元,使其具有更強的泛化性能,將對少樣本學習有更大的提升。

(4)其他領域的少樣本學習

現階段少樣本學習主要解決的是分類問題,然而如何利用元學習跨任務學習的能力,將少樣本學習擴展到目標檢測任務和圖像分割任務中也是非常重要的。

4 結 論

本文通過對比少樣本學習在圖像處理領域的最新研究,從不同角度總結并分析了當前少樣本學習的最新成果。三種典型的數據增強方法能成功擴充樣本數據量,雖行之有效,卻未從根本上解決少樣本問題。度量學習的少樣本學習,當樣本數過于少時,度量學習往往會發生過擬合現象,具有一定局限性。經典的元學習方法,優點在于可以快速處理訓練集中從未出現過的新樣本,但是元學習復雜的訓練過程和過于簡單的網絡結構使其無法達到更高的精度。

猜你喜歡
方法模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
學習方法
可能是方法不對
3D打印中的模型分割與打包
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
主站蜘蛛池模板: 亚洲美女视频一区| 日本爱爱精品一区二区| 欧美日韩专区| 久久久精品无码一区二区三区| 一级毛片在线免费视频| 99久久精品国产综合婷婷| 亚洲码在线中文在线观看| 日韩午夜福利在线观看| 国产成人亚洲综合A∨在线播放| 综合色亚洲| 无码日韩精品91超碰| 免费激情网址| 國產尤物AV尤物在線觀看| 在线不卡免费视频| 日本成人精品视频| 欧美日一级片| 无码丝袜人妻| 中文字幕资源站| 欧美另类图片视频无弹跳第一页| 免费在线a视频| 刘亦菲一区二区在线观看| 免费一看一级毛片| 国产日韩丝袜一二三区| 一级成人a做片免费| 伊人网址在线| 免费看美女毛片| 国产精品yjizz视频网一二区| 性色一区| 欧美色99| 国产91无码福利在线| 欧美午夜网| 亚洲全网成人资源在线观看| 99在线视频网站| 青青草综合网| 人妻一本久道久久综合久久鬼色| 日韩精品资源| 亚洲成人在线免费观看| 免费观看精品视频999| 一级毛片免费播放视频| 精品伊人久久大香线蕉网站| 喷潮白浆直流在线播放| 欧美a在线看| 麻豆精品视频在线原创| 国产精品自在在线午夜区app| 久久免费成人| 国产SUV精品一区二区6| 91九色最新地址| 一级做a爰片久久免费| 成人在线综合| 国产成人精品2021欧美日韩| 99在线观看免费视频| av大片在线无码免费| 日韩无码白| 国产成人无码综合亚洲日韩不卡| 日韩国产 在线| 久久久久久国产精品mv| 久久男人资源站| 亚洲综合色在线| 伊人久久久大香线蕉综合直播| 国产毛片不卡| 成年A级毛片| 亚洲一区二区无码视频| 国产91麻豆免费观看| 精品无码专区亚洲| 国产粉嫩粉嫩的18在线播放91| 国产精品网拍在线| 在线高清亚洲精品二区| 国产在线观看精品| 久无码久无码av无码| 国产91无码福利在线| 乱人伦99久久| 精品国产免费第一区二区三区日韩| 日韩毛片免费视频| 久久精品国产电影| 亚洲第一视频免费在线| 亚洲视频四区| 日本午夜视频在线观看| 朝桐光一区二区| 一级毛片免费的| 永久免费AⅤ无码网站在线观看| 人与鲁专区| 亚洲精品片911|