嚴家金
(1.安徽理工大學 計算機科學與工程學院,安徽 淮南 232001;2.安徽理工大學 環境友好材料與職業健康研究院(蕪湖),安徽 蕪湖 241003)
目前,深度學習已得到了廣泛的研究和應用,深度學習的引入使圖像數據集上的分類準確率得到了極大的提高,而這些模型大部分是基于卷積神經網絡并且需要大規模的數據集,但在實際應用中存在著很大的局限性,例如在疾病診斷、害蟲分辨、工業故障檢測等方面都沒有足夠數量的樣本去訓練,這就是所謂的小樣本學習。
小樣本學習是從人類能夠運用少量數據快速學習中得到的啟發。當訓練數據不足時,如何實現以及怎樣獲得一個具有良好性能和泛化能力的學習模型,是小樣本學習的最終目的。小樣本圖像分類的學習模型基于卷積神經網絡模型,一般分為兩種:元學習和度量學習。基于元學習的小樣本學習有兩種:基于數據增強的小樣本學習,基于模型優化的小樣本學習。
對于小樣本問題,多采用對抗生成網絡(Generative Adversarial Nets, GAN)進行數據增強。雖然GAN能使用現有數據來緩解數據量不足的問題,但是標準數據擴充只能產生有限的替代數據。基于GAN改進的DAGAN模型可以從數據集中獲取數據,并推衍生成同類數據項,是一種有效的數據增強模型。卷積神經網絡VGG是牛津大學計算機視覺組和Google DeepMind公司一起研發的,不僅在ILSVRC分類和定位任務上取得極高的準確性,而且還適用于其他類型的圖像識別。但在訓練樣本較少的情況下,單純的VGG模型很難取得理想的分類結果。……