999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Mask R-CNN改進的遙感圖像艦船檢測

2020-04-24 18:33:52顧振輝姜文剛
計算機工程與應用 2020年8期
關鍵詞:特征檢測

顧振輝,姜文剛

江蘇科技大學 電子信息學院,江蘇 鎮江212003

1 引言

艦船是重要的海上目標,遙感圖像的船舶檢測在民用領域和國防安全中具有廣泛的應用。在民用領域,利用遙感圖像進行船舶檢測可以為船舶導航和海上搜救提供實時位置信息,對專屬經濟區管理等提供重要保障[1];在軍事上,獲取目標艦船的海上位置信息能夠讓我軍對敵方艦隊的配置和活動范圍有很好的了解,給指揮層布置對戰策略提供強有力的信息支援。

光學遙感圖像提供了豐富的形狀、輪廓顏色和紋理信息,并且在遙感圖像中使用2D 物體檢測算法的船舶檢測已經被廣泛研究[2-4]。經典方法的船舶檢測方法有基于閾值分割[5],這需要有個相對穩定的海面環境,受光照、海況的影響比較大;還有一種方法是使用支持向量機(SVM)、AdaBoost、決策樹等[6],這些要依賴于手工制作的特征如局部二進制模式(LBP)、直方圖定向梯度(HOG)[7]才能檢測艦船。然而,這些經典方法受手動標記的圖像特征和模板的限制[8-11],當船舶的大小和朝向和預設的模板不同時,檢測的性能會有很大的降低。

自卷積神經網絡(Convolutional Neural Networks,CNN)在ImageNet大規模視覺識別挑戰(ILSVRC)上的圖像分類[12]取得了巨大成功[13-14],CNN 可以提取對圖像噪聲和形態變化具有魯棒性的語義級圖像特征[15-18]。基于深度學習的目標檢測算法已被用于光學遙感圖像中的目標檢測[19-20]。CNN 在目標檢測方面仍存在一些主要挑戰,如物體旋轉、類內散度過大和類間散度過小,這些挑戰通常會降低物體檢測性能。就艦船檢測來說由于遙感圖像是由衛星從高空俯拍得到的,艦船的朝向有著不確定性;受艦船長寬比的影響,不同種類的艦船有著不同的邊緣特征,在港口密集停放或靠著很近的艦船會產生較高的噪聲干擾,影響回歸框位置的確定。

為了解決上述挑戰,本文在現有Mask R-CNN目標檢測模型框架的基礎上嵌入一種學習旋轉不變和Fisher判別層,通過加入旋轉不變正則化器和Fisher判別正則化器來優化目標函數,提升艦船檢測性能。第一個正則化器將樣本旋轉之前和之后的特征緊密地對應起來強化艦船特征的旋轉不變性,第二個正則化器處理不同長寬比的艦船之間的特征聯系,減少艦船的類內散度,提高艦船與海面和港口其他物體之間的類外散度。

2 改進的Mask R-CNN目標檢測模型

2.1 模型體系結構

Mask R-CNN是一個兩階段目標檢測框架,第一個階段掃描圖像并生成候選區域(Region Proposal Network,RPN),第二階段分類候選并生成邊界框和掩碼。Mask R-CNN 擴展自Faster R-CNN 由何凱明博士提出[21],使用ROI Align代替ROI Pooling,解決ROI Pooling在進行池化的過程中對ROI 區域進行拉伸使ROI 區域產生形變,導致定位不準。Mask R-CNN添加了一個實例分割框架(將屬于同一類的不同實例用不同的顏色分割),在進行目標檢測的同時完成像素級實例分割任務,將目標從背景中分割出來。

如圖1所示將旋轉不變正則化器和Fisher判別正則化器嵌入到現有的Mask R-CNN對象檢測框架,不改變原有的神經網絡架構。

選用ResNet50 作為特征提取的卷積神經網絡,網絡結構如表1所示。

2.2 目標函數優化

將用于目標檢測的旋轉不變和Fisher 判別融合到現有的Mask R-CNN檢測框架中,解決遙感圖像艦船檢測中由物體旋轉、類內多樣性和類間相似性導致的檢測性能下降問題。

圖1 改進的Mask R-CNN框架圖

表1 ResNet50殘差神經網絡結構圖

對于Mask R-CNN模塊采用的ResNet[22],兩個正則化器嵌入在2 048維ROI池層中。第一個正則化器將旋轉之前和之后圖像的特征強制地共享以增強旋轉不變性,第二個正則化器約束卷積神經網絡特征使檢測模塊具有小的類內散度和大的類間散度。

給定一組初始樣本X={X+,X-} ,首先使用簡單的旋轉操作生成一組訓練樣本xRI={ X ,TφX },其中X+表示初始正樣本,X-表示初始樣本負例表示一系列K 旋轉變換,TφK表示訓練樣本的旋轉操作,角度為φk∈φ,k=1,2,…,K 。

為了加速訓練同時避免過度擬合,模型參數基于ImageNet數據集[13]進行預先訓練,然后通過微調方法轉移到優化的檢測模型中。給定訓練樣本X 及其對應的標簽,其中yxi表示樣本xi的背景標簽向量,其值為1 或0。對于訓練樣本xi∈X,Os( )xi是softmax 分類層的輸出,并且Or( )xi是最后全連接層(FC)的輸出。為了最小化訓練樣本上softmax 分類誤差,在本文設計的艦船檢測模型中,還要求得到的艦船特征應該對任何一組訓練樣本{ }xi,Tφxi保持旋轉不變能力,且具有強大的判別能力,能有很小的類內散度和適當的類間散度。為此,提出以下新的目標函數:

其中,λ1,λ2,λ3,λ4和λ5是控制這五項相對重要性的五個權衡參數。

式(1)中J0( x,y )是分類損失函數,通過使用( c +1)類多項負對數似然準則來定義,它的目的是最小化給定訓練樣本的分類誤差,并通過下式計算,

式中,yxi,lg Os( xi)表示yxi和lg Os( xi)的內積,N 是X 中初始訓練樣本的總數,K 表示每個xi∈X 旋轉變換的次數。

式(1)中J1( X,TφX )表示是旋轉不變正則化器,其在旋轉之前和之后施加在訓練樣本上,即強制旋轉前和旋轉后的樣本共享相似特征。將正則化約束項定義為:

其中,Or( )xi是訓練樣本xi的卷積神經網絡特征,表示從訓練樣本xi中所有旋轉樣本中提取的平均卷積神經網絡特征,定義如下:

式(4)表示使每個訓練樣本的平均卷積神經網絡特征接近從所有旋轉版本中提取特征。如果該項輸出小值,則認為特征表示對于任何旋轉變換保持不變。

式(1)中J2( )X+表示對所有正訓練樣本的卷積神經網絡特征上的正則化器。基于Fisher判別標準,它需要最小化正樣本X+類內的分散,可表示為最大化正樣本X+的類間散布,可以表示為。的定義分別如下:

其中,C 表示目標的種類,nc表示第c 類樣本總的數量,mc表示樣本X+c的均值特征,m 表示總樣本X+的均值特征,定義如下:

式(1)中的第四項是權重衰減項,使用L2正則化減小W 的權重。

式(1)中的第五項是邊界框回歸損失,定義如下:

式(1)中最后一項表示實例分割損失,ROI 的輸出維度為cm2,表示c 個分辨率為m2的二進制mask,c 表示二進制數量。本文方法為每一個像素值應用sigmoid激活函數,定義J5為平均二進制交叉熵損失函數。

3 實驗

3.1 軟硬件環境

本文采用PyTorch作為深度學習的框架,PyTorch是一個基于火炬(Torch)的Python開源機器學習庫,用于計算機視覺和自然語言處理等應用程序。它是由Facebook里面的人工智能研究小組開發的。PyTorch 本質上是Numpy 的替代者,對GPU 有很好的支持、帶有高級功能,是一個用來快速搭建和訓練深度神經網絡的理想選擇。實驗中用OpenCV對基本圖像進行處理,使用可視化工具matplotlib對訓練過程中的損失函數進行了可視化。實驗采用的電腦配置是CPU 為I7-9700K,內存RAM有32 GB,GPU為技嘉GTX 1080Ti 11g。

3.2 數據集

使用Kaggle 艦船識別比賽提供的圖像作為模型的訓練集,這個圖像包含192 556張圖片,圖像的尺寸為長768,寬768(單位:像素),其中不包含艦船目標的圖有150 000張,占總數的77.9%,含艦船目標的圖有42 556張(22.1%),其中包含的艦船種類有集裝箱貨輪、散貨輪、驅逐艦等,它們的長寬比在7∶1到4.5∶1之間,為了加速數據集的制作和提升模型訓練速度,將圖像中不包含艦船目標的圖像舍去。

使用LableMe標注有船樣本中船的位置,生成每張樣本對應的.json文件,使用腳本程序批量將json轉化為數據集。

3.3 參數設置

在改進的Mask R-CNN 框架中實現遙感圖像中艦船檢測,將殘差神經網絡ResNet50 和FPN 作為特征提取的骨干網絡,利用在ImageNet 數據集上預先訓練好的模型初始化檢測網絡,利用Kaggle船只檢測數據集進行參數微調。

式(1)中的λ1,λ2,λ3,λ4和λ5是用于控制目標函數中5個函數相對重要性的5個參數,λ1控制旋轉變換正則化器,λ2控制卷積神經網絡特征正則化器及類內散度和類間散度,λ3控制權重衰減,λ4控制回歸框損失,λ5控制分割損失。由于是在Mask R-CNN 基礎上更新的目標函數,所以將λ4和λ5設置為1,這和式(1)中第一項分類損失函數的參數一樣,使模型在進行微調時不破壞在ImageNet 數據集下初始化結果,權重衰減的參數λ3根據文獻[13]中的經驗設置為0.000 5。使用窮舉搜索的方式測試λ1和λ2的參數敏感性,實驗得出以下結論:(1)較小的λ2,增大了類間散度的同時也增大了類內散度;(2)旋轉不變特征的加入,增強了艦船特征聯系,減少了類內散度,避免了模型的過擬合。當λ1=0.01,λ2=0.005 時,對艦船這類大長寬比和方向不定的目標進行檢測時有很好的實時性和準確度。所以將式(1)中的參數分別設置為λ1=0.01,λ2=0.005,λ3=0.000 5,λ4=1,λ5=1,使用雙向softmax 分類器(一類表示背景,另一類表示艦船)訓練旋轉不變卷積神經網絡模型,將生成的所有區域提案與實際標注的圖像計算交并比IOU,將IOU 大于0.5 的艦船檢測回歸框作為初始正樣本,其余提案作為初始負樣本。分類器的學習率設置為0.01,整個網絡設置為0.001 以允許微調進行而不破壞初始化,并且讓學習率每10 000次迭代減少10倍,勢頭設定為0.9。使用三個旋轉,φ=對每個訓練圖像進行旋轉操作以獲得4X 訓練樣本。旋轉變換是一種常見的數據增強方法,讓有效的數據產生更多的等價數據,通過對圖像進行90°、180°和270°三次旋轉,使訓練樣本擴充到了原來的4倍,使用數據增強過后的樣本訓練網絡可以減少網絡的過擬合。通過這三次旋轉增加的數據量,可以解決海上艦船朝向不確定的問題,讓網絡學習到的特征具有一般性,而不是只能檢測出某一具體角度的艦船。

在實際中,很難將整個訓練集中所有類的特征考慮在內,這會導致需要極大的計算資源,減緩模型訓練的速度。做了兩個必要的修改:(1)不是使用整個訓練集來更新Fisher 判別項,而是根據每個小批量執行Fisher判別正則化器的更新。(2)將每批次分成若干子批次,以同時更新式(3)中引入的旋轉不變正則化器。具體的步驟如下:在每次迭代中,隨機抽樣16個圖像并從每個圖像中選擇16個正樣本的ROI盡可能保證檢測物體的特征能很好地包含其中,以構建一個用于更新Fisher判別項的256 個ROI 的小批量樣本。將上述樣本集再分成四個子集合,在每個子集合中,隨機抽樣四個圖像并從每個圖像中選擇16個ROI(8個正樣本和8個負樣本)以及它們的4個旋轉角度以構建具有256個ROI大小的子集更新旋轉不變項。

使用matplotlib 可視化訓練過程中損失函數的變化,操作過程如圖2。選取5次訓練結果在表2中具體展示,由圖3 可見,在進行過40 000 次迭代后模型的分類損失(loss)和實例分割損失(loss_mask)趨于穩定。

圖2 損失函數可視化操作

表2 權重衰減和損失函數變化

圖3 損失函數變化

最小化類內散度,必須減少同一類卷積神經網絡特征與它們中心及均值特征之間的距離,最大化類間散度,就是擴大卷積神經網絡特征與它不同類的中心的距離。圖4 是傳統方法和改進方法訓練完成后散度變化圖,用不同顏色表示不同類的特征分布。改進方法的類間散度更小(特征分布更緊湊),類間散度更大(不同類之間的空隙更大)。

圖4 散度變化

3.4 實驗結果

圖5 是Mask R-CNN 兩階段目標檢測展示圖,圖6表示訓練完基于Mask R-CNN 改進的艦船檢測模型后在測試集上的部分結果,圖7表示使用相同訓練集訓練的Mask R-CNN(主干網絡也是ResNet 50+FPN)模型在測試集上的部分結果,圖8是云霧遮擋情況下艦船檢測結果對比,表3表示兩種方法在相同測試集條件下進行艦船檢測性能表現。

圖5 Mask R-CNN兩階段目標檢測

圖6 改進Mask R-CNN艦船檢測結果

圖7 Mask R-CNN艦船檢測結果

圖8 云霧遮擋情況下船檢測結果

表3 模型性能對比

與Mask R-CNN方法相比,本文改進方法對遙感圖像中的艦船有更好的檢測效果。如圖6(a)中3 點鐘位置的兩艘船由于靠得太近,小船的邊緣特征和大船的邊緣特征產生的重疊,使得大小船不能很好地識別和分割出來,只檢測到大游輪而漏檢了和它相鄰的小窗,而本文改進的Mask R-CNN 算法在一定程度上克服了這個缺陷,如圖6(a)所示在把兩艘船都檢測出來的同時,通過不同顏色的掩碼將它們和海洋背景區分開實現了實例分割。由于增強了旋轉前后艦船特征的聯系,在訓練集樣本不是特別豐富的情況下盡可能多地提取描述性強的艦船特征,一定程度上克服了不同艦船由于具有不同外形導致的長寬比不同帶來的檢測效率的下降。如圖6(b)中,改進的Mask R-CNN 方法將和碼頭形狀相似的登陸艦檢測出來,而沒有漏檢。

以往的艦船檢測算法對于理想條件下的圖像可以取得較好的結果。然而實際成像復雜多樣,特別是天氣狀況、氣候條件、太陽角度、海面狀況等因素影響光學遙感成像質量,導致檢測失敗。如圖8(a)在雨霧遮擋情況下,傳統Mask R-CNN 檢測失敗,改進的方法檢測出了兩艘靠岸艦船如圖8(b)所示。對比兩幅圖片可以看出,改進方法的適應能力更強。

準確率(precision)、召回率(recall)和平均精度(AP)是衡量模型性能的重要指標,計算公式如下:

其中,TP 表示正樣本被識別為正樣本,FP 表示負樣本被識別為正樣本,FN 表示正樣本被識別為負樣本。

如表3 所示提出的方法在檢測時間幾乎不增加的基礎上,實現了準確率由73%上升到了81%,說明艦船檢測準確度有所升高,召回率從86%降低到了74%,表示在準確度提高的同時錯檢測也下降,平均精度AP 從80%上升到85%,表示提出方法的精度和魯棒性有提升。

4 結論

針對遙感圖像中艦船朝向不確定性和海上及港口復雜環境造成艦船檢測性能下降的問題。本文研究了基于旋轉不變和Fisher 判別的目標檢測算法,在Mask R-CNN 目標檢測模型的基礎上嵌入顯著特征判別層,優化了新的目標函數,用旋轉判別正則化器和Fisher判別正則化器解決艦船旋轉和艦船類內多樣性導致的檢測性能下降問題,通過在Kaggle艦船檢測比賽數據集上的實驗證明,改進的方法較Mask R-CNN模型對遙感圖像中艦船檢測的精度更高,有魯棒性,同時不增加檢測時間。

猜你喜歡
特征檢測
抓住特征巧觀察
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
“幾何圖形”檢測題
“角”檢測題
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
主站蜘蛛池模板: 久久青青草原亚洲av无码| 极品私人尤物在线精品首页| 欧美一区精品| 欧美成一级| 亚洲天堂网在线观看视频| 91福利片| 中国一级特黄大片在线观看| 91成人试看福利体验区| 人妻丰满熟妇αv无码| a天堂视频| 国产一区二区三区免费| 亚洲无线国产观看| 国产菊爆视频在线观看| 亚洲日韩日本中文在线| 日韩 欧美 小说 综合网 另类| AV老司机AV天堂| 国产特级毛片aaaaaa| 尤物午夜福利视频| 久久黄色视频影| 91精品国产无线乱码在线| 亚洲一级色| 欧美国产在线看| 91精品专区国产盗摄| 岛国精品一区免费视频在线观看| 99久久精品久久久久久婷婷| 久久久久久久久18禁秘 | 精品91在线| 欧美国产日韩在线| 亚洲日产2021三区在线| 国产综合精品日本亚洲777| 91系列在线观看| 又污又黄又无遮挡网站| 亚洲视频免费在线| 久久婷婷色综合老司机| 永久在线精品免费视频观看| 色综合久久综合网| 午夜少妇精品视频小电影| 亚洲人成在线免费观看| 美女国产在线| 不卡视频国产| 国产农村妇女精品一二区| 激情乱人伦| 人妻丰满熟妇AV无码区| 91青青草视频在线观看的| 99国产精品一区二区| 国产三区二区| 国产欧美日韩免费| 亚洲综合片| 18禁不卡免费网站| 国禁国产you女视频网站| 中文字幕伦视频| 91久久偷偷做嫩草影院精品| 色综合网址| 日本精品视频一区二区 | 日本人妻一区二区三区不卡影院| 无码内射中文字幕岛国片 | 欧美日韩导航| 久久无码高潮喷水| 88国产经典欧美一区二区三区| 欧美不卡在线视频| 欧美视频在线不卡| 国产午夜人做人免费视频中文 | 97成人在线视频| 精品撒尿视频一区二区三区| 亚洲精品另类| 国产视频一区二区在线观看| 国产v精品成人免费视频71pao | 99福利视频导航| 噜噜噜久久| 秋霞国产在线| 91在线视频福利| 久久久久久国产精品mv| 国产精品美女网站| a级高清毛片| 久久国产精品影院| 制服丝袜国产精品| 福利国产微拍广场一区视频在线| 亚洲中文久久精品无玛| 日本AⅤ精品一区二区三区日| 超碰aⅴ人人做人人爽欧美 | 青青青国产精品国产精品美女| 青青青亚洲精品国产|