999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

改進SSD 算法對鳥類目標檢測研究

2022-05-06 03:25:20唐鑫鑫陸安江彭熙瞬高海韜
智能計算機與應用 2022年3期
關鍵詞:分類檢測模型

唐鑫鑫, 陸安江, 彭熙瞬, 高海韜

(貴州大學 大數據與信息工程學院, 貴陽 550025)

0 引 言

社會經濟的快速發展,對生態環境資源索取使用過度,自然環境被嚴重破壞。 鳥類是自然生態中重要的一員,據國際鳥類聯盟最新調查研究顯示,全球八分之一的鳥類面臨滅絕的危險,生存狀況日益惡化,數量下降呈現恐怖趨勢,保護鳥類刻不容緩。目前,鳥類的識別工作仍主要依靠人工先驗知識,時間成本過大。 通過人工智能技術構建一個智能鳥類識別分類系統,能夠節約人力成本,為鳥類保護貢獻一份力量。 鳥類識別算法主要分為兩類:基于部件的多級分類算法和基于端到端的分類算法。 基于部件的多級分類算法代表有Wah最先提出的基于傳統特征的詞包分類模型;Donahue 等人提出的基于CNN 的DeCAF 特征;Zhang 等人提出的自局部檢測到特征提取均采用CNN 架構的Partbased R-CNN 等。 基于端到端的分類算法有Fu 等人提出的RA-CNN 模型,基于遞歸神經網絡增強局部注意力及特征表達;Li 等人提出冪歸一化協方差矩陣MPN-COV;魏秀參提出的基于FCN 學習分割模型的Mask-CNN 算法等等。

本文使用改進過的Resnet50 網絡(稱作DLResnet50)替換SSD 的前置網絡VGG,對自制的鳥類數據集進行目標識別檢測分類。

1 SSD 模型的基本原理及結構

Wei Liu 在ECCV 2016 上提出了SSD 模型。 該模型全稱Single Shot MultiBox Detector,意思為單鏡頭多盒檢測器。 SSD 基于深度學習,是人工智能下的一種目標檢測模型,其前置網絡為VGG-16,是目前流行的目標檢測框架之一。 該算法會在圖片上均勻地產生若干個不同大小的候選框,且其長寬比均不相同,使用卷積層將圖像的特征提取出來,再進行回歸和分類。 SSD 模型網絡結構如圖1 所示。

圖1 SSD 模型網絡結構圖Fig. 1 Network structure diagram of SSD model

SSD 采用VGG-16 為前置網絡,將VGG-16 的2 個全連接層FC6 和FC7 替換為3×3 卷積Conv6 和1×1 卷積Conv7,將池化層Pool_5 由2×2 池化修改為3×3 池化,移除Dropout 層和全連接層FC8,并添加4 個新的卷積層:Conv8、Conv9、Conv10、Conv1l 。其處理過程中如激活函數全部采用ReLU,且均在卷積操作結束后使用,池化操作不使用激活函數,做卷積與池化交替計算,假設輸入的圖像尺寸為224×224×3,則每一步的計算與圖像尺寸見表1。

表1 VGG16 計算過程圖像變化Tab. 1 Image changes during VGG16 calculation process

最后的輸出圖像與兩層1×1×4 096,一層1×1×1 000進行全連接,即共有3 層全連接層,最后再通過ReLU激勵函數激活,輸出的預測結果可以有1 000 個。

不同特征圖的每個特征點上都有一組默認先驗框與之對應,因此SSD 模型預測的時候計算默認先驗框的位置偏移和置信度。

SSD 的損失函數值包含兩個部分: 置信度(L) 和定位(L), 而損失函數就是這兩者的加權和。 置信度損失L的計算公式(1)如下:

SSD 算法需要計算兩部分,即相應的先驗框與目標類別的置信度和相應的位置回歸。

其中,參數∈(0,1),表示默認框和實際檢測框的匹配是否成功;參數作用類似于權重,用來平衡置信損失和位置損失;是分類置信度;代表預測框;代表真實標簽框;是與該類別的校準框匹配的默認框數量,當0 時,說明損失為0。

2 SSD 模型改進

2.1 SSD 模型存在的問題

SSD 的優點在于采取多尺度特征融合策略,利用多個卷積層的輸出參與預測,提升了檢測精度;直接使用默認框進行檢測,沒有候選區域生成的過程,提升了檢測速度。 但對小目標的魯棒性差,會有識別不出來的問題。 根據VGG 網絡的特性,增加網絡層數后提升的效果并不明顯,因為出現了網絡退化的問題,退化問題阻礙了網絡收斂,不僅增加了訓練誤差,也增加了測試誤差,降低了網絡精度。

為了提升網絡訓練的識別準確率,最簡單直接的方式是增加網絡層數,以增加對目標特征的學習次數。 但若只是盲目增加網絡層數,問題并沒有得到解決;相反地,還會導致錯誤率的突然上升,產生此問題的原因是發生了梯度消失。

2.2 改進ResNet50 網絡結構

ResNet50 網絡中提出的殘差結構(Residual Block) 主要目的是解決網絡退化問題,ResNet50的殘差網絡學習單元如圖2(a)所示。

ResNet50 網絡由多個殘差模塊構建而成,其函數表達式為式(4):

其中,為輸入;() 表示殘差映射;() 表示殘差網絡的特征輸出。

當()0 時,表示該卷積層做恒等映射;當()0,表示該卷積層學習到新的特征信息,從而保證反向傳播時的梯度傳遞,有效解決了網絡訓練過程中存在的梯度消失和網絡退化問題。

本文對ResNet50 網絡的改進結構如圖2(b)所示,將改進后ResNet50 的網絡稱為DL-ResNet50。

圖2 兩個殘差學習單元對比Fig. 2 Comparison of two residual learning units

由于ResNet50 網絡訓練過程中易出現過擬合,為了進一步提高該網絡的識別精度,本文在原網絡最后一個卷積層后加入Dropout 層和3 層全連接層,用Leaky-relu 函數取代原網絡的ReLU 函數。

加入Dropout 層和3 層全連接層后,可以讓ResNet50 網絡過擬合的機率有效下降,改善增強模型泛化能力。 當網絡輸入0 時,ReLU 函數無法更新,從而模型不能訓練學習特征。 而Leaky-relu函數在輸入0 時輸出持續變化,更新權重繼續學習。 改進的SSD 模型工作流程如圖3 所示。

3 實驗結果分析

圖3 改進SSD 模型工作流程Fig. 3 Improved SSD model workflow

3.1 數據預處理

本次數據集從文獻[12]所記錄的鳥類中隨機選取10 種,分別是黑頸鶴、灰鶴、斑頭雁、黃眉柳鶯、白鷺、大斑啄木鳥、山斑鳩、喜鵲、赤麻鴨以及烏鴉,共計4 830 張圖片,為了保證模型識別效果,防止模型過擬合,對數據圖像進行鏡像翻轉處理,增加數據集數量,將數據集按照模型比例6 ∶4 ∶1 分配劃分為訓練集、驗證集、測試集。

為了更好的訓練模型,對收集的圖像數據灰度化、均衡化以及歸一化處理,如圖4 所示,其中(a)為原圖,(b)表示經過加權均值灰度化的圖,(c)表示經過直方圖均衡化后的灰度圖。 對比(b)和(c)可以明顯看出圖中的目標與背景的差異變大。 再利用labelImg-master 工具在圖中框出目標位置及類型,即可獲取目標的像素信息。

圖4 圖片處理對比Fig. 4 Comparison of image processing

3.2 實驗結果對比

本文實驗平臺選取 tensorflow 開源框架,Windows10 系 統,python3. 6 編 程 語 言,cuda9. 0,cudnn7.0, NVIDIIA GTX2060 顯卡。

本文實驗以模型損失值曲線變化、平均交并比(Average Intersection Over Union, Avg IOU)以及AP曲線來作為評估依據,分別在SSD、SSD+ResNet50以及SSD+DL-ResNet50 3 個模型下做實驗對比。 3個模型實驗訓練參數一致,訓練批次大小為8,迭代300 次,初始學習率為0.001,權值衰減系數為0.000 5。損失值曲線變化如圖5 所示。

圖5 3 種模型的損失值曲線Fig. 5 Loss value curves of the three models

本文所提算法SSD+DL-ResNet50(紅色線)收斂速度最快且最終損失值最小,穩定在1.3 左右。 SSD+ResNet50(綠色線)次之,原SSD 模型最慢損失值也最高,約2.1,本文算法在損失值這一項上降低了約0.8。

在目標檢測中常表示預測框和真實框相交面積與相并面積的比值,比值越接近1 效果越好,公式(5)。

其中,A表示目標預測框面積,表示目標真實檢測框的面積。

通過實驗結果可得3 個模型的交并比變化曲線,如圖6 所示。 由圖6 可知,隨著迭代次數的增加,3 種模型的交并比值都逐漸增加,但是由紅色線可知本文改進模型DL-ResNet50 SSD 的值均高于綠色線ResNet50 SSD 模型和藍色線原SSD 模型。

圖6 3 種模型交并比變化曲線Fig. 6 Intersection ratio change curves of the three models

本文選擇準確率和召回率來作為目標檢測的性能評估標準,準確率就是測試檢測正確的目標在所有樣本中所占的比例,計算表達如式(6)。 召回率則表示在所有真實目標中被正確檢測出來的占比,計算表達如式(7)。

其中,表示準確率;表示召回率;表示模型正確檢測的目標個數;表示模型錯誤檢測的目標個數;表示模型漏檢的正確目標個數。

實際上, 準確率和召回率往往是此消彼長,難以兼得,因此將計算得到的、值繪制成曲線圖,綜合考慮曲線下的面積值大小來評估各類別檢測性能,值越大表示模型檢測精度越高,即性能越好,計算公式(8)。

針對多個類別,使用平均值評估模型整體性能,公式(9)。

斑頭雁和灰鶴兩種類別的鳥在原SSD 模型、用ResNet50 替換VGG 網絡的SSD 模型還有本文提出的改進ResNet50 取代VGG 的SSD 模型下的變化值如圖7 所示。 對比分析,本文所提算法的值更大,模型精確度更高。

SSD、SSD 中已有的VGG 網絡替換為ResNet50以及改進ResNet50 取代VGG 的SSD 模型下的檢測精度對比見表2,可知本文的改進算法在總體的檢測精度上比原SSD 提升5 個點

表2 3 種模型檢測精度Tab. 2 Detection accuracy of the three models

檢測結果如圖8 所示,其中(a)是原SSD 模型的檢測結果,可以看到有些被遮擋的目標沒有被檢測到,(b)圖是改進后的SSD 模型檢測結果,雖然有的被遮擋目標也沒有被檢測出,但是增加了2 個目標檢測框。

圖7 3 種網絡的AP 曲線Fig. 7 AP curves of the three networks

圖8 檢測結果Fig. 8 Detection results

4 結束語

本文提出一種用改進ResNet50 網絡,取代SSD模型的基準網絡VGG 的SSD 模型算法對鳥類目標進行檢測研究。 通過實驗對比可知,本文提出的算法在模型收斂速度、檢測精度以及多目標檢測方面都有改善提升。 本文數據集種類只有10 類,因此下一步的研究工作是增加數據集種類以及數量,將算法融合進系統之中,實現一個完整的鳥類識別分類系統。

猜你喜歡
分類檢測模型
一半模型
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
分類算一算
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
主站蜘蛛池模板: 亚洲天堂视频在线播放| 韩日无码在线不卡| 欧美国产三级| 亚洲v日韩v欧美在线观看| 久热中文字幕在线| 欧美全免费aaaaaa特黄在线| 伊人激情久久综合中文字幕| 九色视频最新网址| 国产人人射| 国产亚洲精久久久久久久91| 国产精品久久久久无码网站| 国产成人精品一区二区| 亚洲久悠悠色悠在线播放| 亚洲欧美日韩成人在线| 亚洲日韩Av中文字幕无码| 自偷自拍三级全三级视频| 欧美亚洲激情| 久久国产精品电影| 欧洲高清无码在线| 亚洲第一色视频| 欧美综合在线观看| 国产91视频免费观看| 欧美午夜在线视频| 国产国语一级毛片在线视频| 国产成本人片免费a∨短片| 一本综合久久| 国产手机在线ΑⅤ片无码观看| 自拍偷拍欧美日韩| 成年午夜精品久久精品| 在线播放真实国产乱子伦| 成人在线观看不卡| 91国内视频在线观看| 成人精品区| 国产高清无码麻豆精品| 中文字幕在线播放不卡| 欧美一级大片在线观看| 日韩欧美国产综合| 91人人妻人人做人人爽男同| 伊人久久久久久久| 尤物视频一区| 9cao视频精品| 日本一区二区不卡视频| 亚洲第一成年网| 99热这里只有精品免费国产| 国产中文在线亚洲精品官网| 国产在线观看第二页| 精品超清无码视频在线观看| 欧美日韩资源| 亚洲视频欧美不卡| 国产草草影院18成年视频| 亚洲欧洲天堂色AV| 日韩精品亚洲人旧成在线| 亚洲欧美日韩天堂| 专干老肥熟女视频网站| 在线观看国产精品日本不卡网| 在线观看国产一区二区三区99| 欧洲高清无码在线| 国产在线一区视频| 国产高清精品在线91| 国产一级二级三级毛片| 先锋资源久久| 欧美性精品| 六月婷婷激情综合| 亚洲人成网站18禁动漫无码| 欧美五月婷婷| 欧美一区福利| 干中文字幕| 日韩大乳视频中文字幕| 狠狠操夜夜爽| 激情六月丁香婷婷| 五月天香蕉视频国产亚| 很黄的网站在线观看| 97国产成人无码精品久久久| 欧美午夜网站| 欧美视频在线观看第一页| 无码电影在线观看| 无码中字出轨中文人妻中文中| www精品久久| 国产天天射| 亚洲成人高清在线观看| 国产又色又刺激高潮免费看| 香蕉eeww99国产精选播放|