









關鍵詞:小樣本目標識別分類;數據增強;遷移學習;度量學習
中圖分類號:TP18 文獻標志碼:A 開放科學(資源服務)標識碼(OSID):
文章編號:1003-3106(2024)11-2594-08
0引言
快速準確實現目標識別分類是信息化戰爭背景下的迫切需求,直接影響到效能。迄今為止,目標識別領域主要基于傳統的人工特征設計、提取,基于自動化提取目標特征的深度學習算法成為目前目標識別分類商業化應用發展階段中被期望克服數據專業性壁壘、數據處理耗時長等困難的一種方式[1]。隨著大數據技術的發展,以深度學習算法為主實現的機器學習技術在目標識別分類領域取得了革命性的飛躍,檢測的精度和性能均得到了明顯的提升,廣泛應用于實際場景中。但是深度學習目標檢測模型的建立對樣本數量和數據質量的依賴性較高,由于領域和任務的特殊性,能夠獲取到的數據量往往不充足[2],在沒有大量高質量數據的支持下,如何獲得較好的檢測效果并更好地應用于相關領域,基于小樣本的深度學習算法的研究與應用成為人工智能領域的研究熱點。
小樣本學習[3]旨在利用先驗知識克服海量數據缺失帶來的模型過擬合問題,提高模型在新類別上的泛化能力,極大程度降低數據集獲取建立的成本和難度[4]。本文以小樣本學習為主要研究內容,簡述了小樣本學習的基本理論,探討了基于數據增強、遷移學習及度量學習3 種常用方法在目標分類識別領域的應用場景和現狀,分析了目前小樣本目標分類識別方案在該領域仍舊存在的問題,給出了未來研究、應用的展望,以期為小樣本學習在目標識別分類領域的探索與發展提供更多有益的參考。
當具有標注信息的樣本數量足夠時,模型訓練誤差就會變小,如圖1(a)和圖1(b)所示。但在小樣本目標識別分類應用中,模型訓練誤差往往都較大。因此,在樣本數量較少時,采用傳統的訓練模型算法是很難獲得滿意的精度的,需要探索新的解決方案。人類的一個突出特征是通過一定的知識學習與積累,只學習少量乃至單個實例即可實現對新物體的識別與分類。受此啟發,在深度學習發展基礎之上,提出了利用之前學習的先驗知識輔助模型訓練學習降低模型訓練誤差的小樣本學習的概念,如圖1(c)所示,小樣本學習的核心就是在小樣本條件下降低模型的訓練誤差。
小樣本學習的定義是從某個類的包含有限信息的樣本集中學習出該概念類。基于小樣本的深度學習通常將數據集劃分為訓練集(Training Set)、支持集(Support Set)和查詢集(Query Set)三部分。其中,訓練集是用于預訓練學習模型的源數據集,一般包含了大量的標記信息;支持集是用于選出具有優良分類性能模型的目標域訓練數據集,包含了少量的標記信息;查詢集是用于驗證訓練模型準確率的目標域測試數據集。但有別于傳統的分類算法,在小樣本學習中,這3 個數據集包含的類別是完全不同的。在每個給定的元任務中,支持集與查詢集包含相同的標簽集,但二者隨機選取不重復數據樣本。支持集是由具有標記信息的樣本組成,與傳統目標識別分類模型建立的“訓練集”類似,使模型學習不同任務之間的共性部分;查詢集是由無標記信息的樣本組成,與傳統目標識別分類模型建立的“測試集”類似,用于測試學習模型的準確率。
2深度學習中小樣本建模機制的應用
目前,小樣本學習領域有幾種常用處理各類應用場景的建模方法,分別為基于數據增強的方法、基于遷移學習的方法以及基于度量學習的方法等。對傳統目標識別分類算法與小樣本學習的幾種方法進行了簡要的對比分析,如表1所示。接下來就小樣本學習的3種方法在雷達目標識別、遙感目標檢測和實體識別等領域的研究現狀進行詳細介紹。
2.1基于數據增強的小樣本目標識別分類
數據增強,也可稱為數據擴充,是一種通過算法基于已有數據自動生成等價新數據的技術,能達到擴充訓練集的目的。該方法能夠不增加人工標注數據的工作,自動生成大量數據集,增強數據集的體量與多樣性,從而避免學習模型過度擬合的問題。數據增強的方法分為數據合成和特征增強法。在傳統的圖像分類領域,常見的數據增強方法是使用旋轉、幾何變換和隨機擦除等操作在原有圖像基礎上進行數學變換以實現數據擴充,而特征增強法則可借助一些輔助信息進行增強操作。隨著對數據增強的深入研究,生成對抗網絡(Generative" Adversarial Net-work,GAN)[20]模型被提出,該模型是數據增強算法框架中較有代表性的一種,由生成器和判別器兩部分組成,生成器的目標是不斷生成變化的以假亂真的新樣本,而判別器的目標則是判斷生成的新樣本的真假,通過二者的不斷迭代和博弈學習,將目標識別分類任務轉化為多個單目標函數優化組合問題,生成擬合真實數據分布的有變化的模擬數據,算法偽代碼如算法1所示。
在GAN 的發展基礎之上,陳龍等[21]設計了一種基于GAN 優化樣本數據質量與深度森林學習模型[22]相結合的方法實現圖像中目標的智能識別,該方法采用了多粒度特征提取,無需人工耗時干預特征選擇。分別采用GAN 和傳統模型增強方法對初始目標樣本和優化后的目標樣本進行了擴展,最大程度上生成與真實樣本相似的數據,通過增加高質量數據樣本量解決模型在小樣本條件下的收斂問題,構建了具有強魯棒性的網絡模型,提升了目標識別的準確率,優于其他許多算法。Jiang 等[23]針對小樣本條件下深度學習網絡模型產生的過擬合影響遙感圖像目標檢測精度的問題,提出了基于風格遷移的數據增強方法,利用基于特征提取、激活函數以及損失函數改進的循環GAN(Cycle GAN)[24]獲取新數據,改進的模型采用了在不同層級的網絡之間添加特征擾動,將風格損失加入了損失函數表征不同自然季節、環境等方法,相較于原Cycle GAN 加強了數據集之間的一致性控制,模型訓練結果表明,將擴充的數據集加入原始數據集后,目標檢測和識別的準確性得到了提高。王亦倩[25]采用了深度GAN與艦船三維模型電磁仿真信息結合的方法生成樣本進行擴充,擴充的艦船雷達圖像比傳統方法擴充的樣本質量和多樣性均得到了明顯的提升,建立基于回歸的端到端的目標檢測識別模型,提高了小樣本條件下模型的檢測識別準確度和泛化能力。
在自然語言處理領域中,由于其離散抽象的特點,微小的差異即可影響最終的語意表達。而由于領域本身的獨特性,對專屬于小樣本命名實體識別的研究十分缺少。劉興麗等[26]提出一種基于簡單數據增強(Easy Data Augmentation,EDA)算法[27]面向小樣本命名實體識別的數據增強多維改進策略,即基于人工標注的小樣本數據集、半自動化構建的實體以及開源的武器信息實體集構成的領域詞典進行實體替換、詞性替換等,從根本上解決了樣本稀疏問題,最終驗證單策略EDA 改進的提升效果顯著。
總而言之,數據集的真實分布通常情況下都是不可知的,數據增強的解決方案也只是對原始數據集的絕對近似,受限于模型實現的效果及樣本數據中的錯誤標注信息等,有可能造成數據的負向偏移。但數據增強仍舊是小樣本條件下有效提升目標識別分類效果的有效手段。
2.2基于遷移學習的小樣本目標識別分類
遷移學習旨在將與新的領域(目標域)具有相似規律可循的現有領域(源域)知識遷移至目標域,同時輔助目標域的學習任務。通常情況下,為了獲取性能優異的學習模型,往往需要根據樣本標簽數據的變化,重新建立模型、訓練超參數,而基于小樣本的遷移學習思想恰好可以用來解決此類問題,如圖2所示。
胡安林[28]基于特征遷移學習方法引入了一種采用競爭策略的自適應微調網絡模塊,改進了卷積神經網絡VGG-16[29]和GoogLeNet[30]并進行預訓練。隨后將預訓練模型遷移到訓練艦船目標樣本數據的Faster R-CNN[31]和YOLO[32]網絡,解決了小樣本下艦船目標檢測的過擬合和性能過低等問題,并通過實驗驗證了提出方法的有效性。郭繼光等[33]提出了一種基于不同深度的神經網絡模型和特征遷移學習的跨域小樣本目標識別方法,基于成熟的深度學習模型獲取泛化能力較強的特征表達,通過提取真實樣本與擬合樣本的特征對源域和目標域之間的關系進行了描述,綜合了2 種學習方法,利用CATIA 建模實驗對模型進行驗證分析,對比了不同網絡結構、數據特征,最終獲取了雙向長短記憶神經網絡在小樣本彈道導彈目標識別過程中具有較好的識別準確率。王美玉等[34]探索了一種基于遷移學習的小樣本條件下進行電磁目標精確識別的方法,其中包括同類目標遷移和異類目標遷移,在同類源樣本減少4/5的情況下,相較于非遷移模型識別率得到了有效提升;在異類源極少樣本的情況下,在保證識別率的同時提高了模型性能。領域業務數據爆炸式增長,文本大量存在并被使用,從其中自動化提取系統相關的關鍵信息并加以歸類成為一個亟待解決的問題。徐建等[35]提出了一種基于領域遷移和任務遷移相結合的小樣本文本命名實體識別方法,且采用了基于實體替換和偽標簽等數據增強方法,有效地提升了小樣本情況下模型對命名實體識別的準確率。
遷移學習可以較好地提升網絡模型的泛化能力,實現訓練過程中的參數和特征遷移,但極易丟失積累的經驗信息,造成嚴重的過擬合問題。同時,遷移學習受數據集復雜度的影響較大,普適性不足。
劉旗等[37]提出了一種基于門控多尺度匹配網絡的小樣本合成孔徑雷達(Synthetic ApertureRadar,SAR)目標識別方法,解決領域探測SAR 圖像數量不足條件下準確識別的問題,引入多尺度特征提取模塊以提取匹配網絡不同卷積層的多尺度特征,根據不同的識別任務,權重門控單元能夠賦予不同卷積層特征不同的權重,以任務為主導選擇最具代表性的目標特征完成識別任務,識別準確度和穩定性都得到了提升。金璐等[38]提出了一種基于關系網絡模型、多尺度特征融合方法及元學習訓練策略結合的小樣本紅外空中目標分類方法,利用構造的多尺度特征提取模塊提取輸入樣本的特征信息,通過關系模塊計算支撐樣本集和預測樣本集的關系值,根據關系值輸出預測樣本的類別標簽,該方法具有較好的分類效果,為小樣本空中目標分類在電子偵察領域的應用提供了一種途徑。孟浩等[39]為解決船舶目標樣本數量不均衡導致的過擬合問題提出了一種跨目標通用全局注意力機制(GlobalAttention Mechanism,GAM)[40]與關系度量網絡結合的目標識別算法,通過關系網絡提取到樣本集的原始特征信息,利用全局注意力機制在支持集、查詢集的特征提取過程中減輕不均衡類別、樣本及特征的過擬合現象,隨后與原始特征信息融合進行特征距離度量。該方法提升了目標樣本特征分布比例,有利于減少假正樣本特征信息,提升了小樣本小標簽情況下的船舶目標識別精度。
度量學習原理簡單、訓練開銷小,更容易實現增量式學習,即模型完成訓練后無需從頭訓練模型參數就可直接用于小樣本的新類別目標檢測。雖然度量學習在小樣本目標識別分類領域取得了一定的成果,但還存在著一些缺陷:① 對采集的樣本集的依賴性較高,受限于樣本集的復雜度,可能產生過擬合或不會學習對目標識別分類有用的信息;② 未將噪聲干擾對小樣本目標分類結果的影響考慮在內;③ 采用全局特征度量樣本間的差異,對目標類別分布表達不充分。
2.4數據集與實驗
目標識別領域中,常用基于標準數據集Omiglot、Mini-ImageNet 及Tiered-ImageNet 等獲得的實驗結果作為評估訓練模型性能的指標。
本文選取了一些應用于目標分類識別領域的典型模型在Omiglot 和Mini-ImageNet 數據集上的實驗結果進行對比參考,如表3 所示,此處采用了5-way1-shot 和5-way 5-shot 的實驗結果(以準確率百分比表示)。可以看出,2 個數據集中5-shot 的識別精度均明顯高于1-shot,在Omiglot 數據集上,模型準確率都較高,而在Mini-ImageNet 數據集上,模型最高準確率僅可提升到70% ~ 80% ,因此可與其他網絡模型組合進一步提高在該數據集上的分類識別準確率。
3主要挑戰與未來發展
信息化的重要性是不可忽視的。現代信息技術的發展,能夠提供多元化的監視、探測和信息跟蹤,能夠有效獲取地方戰場情報,洞察地方配置和戰略部署,為戰爭指揮者提供重要的信息參考,打破地方戰場盲區,運用新型方式,以更小的戰爭成本取得勝利。
人工智能技術正在加速發展,快速準確進行目標識別分類可能會深刻影響未來戰爭的制勝機理和方式。自二十世紀中期,國外目標識別技術就已經開始發展,相比于國外,我國開展相關技術研究的時間較晚,二十世紀八九十年代以后,隨著硬件條件的大跨步提升,國內許多研究單位進行了深入探索,深度學習被廣泛應用于領域。但由于樣本數量少、識別模型精度高,基于小樣本的深度學習技術得到了迅速發展,主要應用于高分辨雷達一維距離像、SAR圖像目標識別以及圖像處理等方面,對目標識別準確度與穩定性帶來的提升進行了有效驗證。
但由于應用場景的復雜性,目前仍處于算法仿真測試階段,還未與武器裝備、指揮控制系統等融合,所以仍舊面臨著許多挑戰:① 泛化能力相較于海量樣本集目標識別分類性能有較大差距,目前還難以滿足實際應用需求,不便于領域不同場景、分支的遷移應用;② 現有的小樣本識別分類算法主要解決同域不同類或同類不同域的問題,目前還沒有解決不同類不同域的合適策略,海、陸、空三大類目標識別分類各有獨特的技術難點,遷移成熟的模型解決復雜問題十分困難;③ 小樣本深度學習算法可解釋性較弱,在基于遷移學習的小樣本目標識別分類模型中,特征、參數遷移的保留很難確定,尤其是復雜戰場環境下信息的高模糊性與欺騙性,導致識別分類過程難以理解;④ 基于小樣本的目標識別分類算法的應用目前還集中于艦船等遙感圖像目標檢測識別方向。
通過對當前基于小樣本深度學習的目標識別分類應用與研究進展的梳理,可在以下方面展望:① 通過改善學習模型、研究輕量化的網絡模型,減少模型訓練時間,降低對計算、存儲資源的消耗,進一步提高模型的泛化能力和識別精度,盡可能滿足領域應用高實時性的要求;② 為了更好地理解模型適合被遷移的特征和參數,探索提高模型在領域應用可解釋性的方法;③ 聚焦于降低對樣本數據量的依賴實現高性能高精度的大規模小樣本算法,大規模小樣本學習任務主要解決海量類別的圖像分類,但每個類別僅包含極少量的樣本標記數據;④ 可進一步擴展算法在領域內命名實體分類、電磁目標識別的應用。
4結束語
本文主要對基于小樣本深度學習的目標識別分類領域的應用研究現狀做了詳細介紹,即基于數據增強、遷移學習和度量學習3 種常用的提升小樣本目標識別分類性能的算法,并闡述了3種算法的優缺點。最后,提出了小樣本目標識別分類在領域應用仍舊面臨的一些挑戰和對未來研究方向的展望。本文指出了小樣本學習目前還未部署于系統、未與實際緊密結合,針對領域的特殊性,需要研究實時性更高的輕量化模型,為小樣本學習在領域的創新發展和實戰融合應用提供了參考。雖然目前小樣本目標識別分類算法的發展還處于初步階段,還未得到廣泛應用,但隨著目標識別分類的發展及小樣本應用需求的日益增長,必然會廣泛推動學術成果的產生。
作者簡介
高靜 女,(1997—),碩士,助理工程師。
馮金順 男,(1981—),碩士,高級工程師。
董少然 男,(1985—),碩士,高級工程師。
郭新蒼 男,(1975—),碩士,高級工程師。
范爍晨 男,(1997—),碩士,助理工程師。
趙乾宏 男,(1976—),碩士,高級工程師。主要研究方向:通信及信號處理。
朱光耀 男,(1997—),碩士,助理工程師。
陳家良 男,(1991—),碩士,助理工程師。
馬胤篧 男,(1996—),碩士,助理工程師。