999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種改進YOLOv5 的小目標檢測算法

2023-10-05 08:10:26韓鎮洋王先蘭
電子設計工程 2023年19期
關鍵詞:特征實驗檢測

韓鎮洋,王先蘭

(1.武漢郵電科學研究院,湖北武漢 430074;2.武漢郵電科學研究院研究生部,湖北武漢 430074)

目標檢測的核心任務在于分類、定位、檢測和分割,其基于深度學習的算法主要分為Two stage 和One stage 兩類[1],而YOLO 系列就是One stage 的代表性算法,其包 括v1、v2、v3[2]、v4[3]、v5,其中YOLOv5 作為最新代的YOLO 算法,其對目標的檢測精度及速度相比YOLOv4 均有所提升。但是隨著無人機[4]及自動駕駛[5]技術的發展與普及,在某些小目標檢測場景下YOLOv5 仍滿足不了相應的需求。

1 YOLOv5網絡

YOLOv5 結構分為輸入端、Backbone、Neck、Prediction 四部分,其中輸入端包括Mosaic 數據增強、自適應錨框計算、自適應圖片縮放;Backbone 包括Focus[6]結構和CSP[7]結構;Neck 包括FPN 和PAN 結構;Prediction 包括GIoU Loss[8]。

其中在自適應錨框計算部分,YOLOv5 將此功能嵌入到模型代碼中,每次訓練時模型會自動計算不同訓練集中的最佳錨框參數。

而在自適應圖片縮放部分,YOLOv5 對代碼進行了修改,對輸入圖像自適應地添加最少的黑邊。填充后的圖像兩端的黑邊變少了,在推算時計算量也相應減少了,從而提升了目標檢測速度。

除上述幾個方面的改進之外,YOLOv5 還有一些細節方面也存在差異。

2 改進后的YOLOv5-Sobj算法

YOLOv5 具有檢測性能好、速度快、靈活性強的優點,但是在需要小目標檢測的場景中仍存在識別精度不足[9]的問題,因此考慮從以下三方面進行算法改進:

1)改變Backbone 結構;

2)改變Neck 結構;

3)其他方面。

將改進后的算法命名為“YOLOv5-Sobj”,即YOLOv5-Smallobject。

2.1 Backbone

模型中的Backbone 部分即主干部分。該主干網絡常認為提取特征的網絡,其作用是提取圖片中的信息,以供后面的網絡使用。

嘗試用兩個Backbone 替代YOLOv5 中原有的一個Backbone,下面對這兩個替換的Backbone 進行簡單介紹。

深度殘差網絡(Deep Residual Network,ResNet)的提出是CNN 圖像發展史上的一件重要事件,其原理是通過引入殘差連接將輸入數據直接傳遞到輸出端,從而跨越了多個神經網絡層。

不同于ResNet 解決了深層神經網絡的梯度消失問題,密集卷積網絡(Dense Convolutional Network,DenseNet)則是從特征入手,通過對特征的充分利用實現了以更少的參數達到更好的效果。DenseNet 使用類似的連接,在網絡中盡可能多地保存信息。實現這些功能需要確保特征圖尺寸正確,因此必要時需要修改模型的深度縮放系數和寬度縮放系數。

在這兩種情況下,為了保持結構本身的復雜性,要避免修改后的層數與原始的層數相差過大。因此,最終選擇了ResNet 中的ResNet50,并且成比例縮小了DenseNet 來確保其核心功能不變。此外,在原有模型中還利用了Backbone 和Neck 之間的空間金字塔池化層(Spatial Pyramid Pooling,SPP),但在實際實驗中沒有對該部分進行修改。

2.2 Neck

模型中的Neck 部分是位于Backbone 和Head 之間的結構,其作用是將Backbone 中提取到的信息反饋到Head 之前盡可能多地聚合這些信息。Neck 部分能夠有效提高特征圖的分辨率,可以聚合從Backbone 傳遞來的不同層特征,從而提升整體模型的檢測性能[10]。

嘗試將原有模型中的PAN-Net替換為bi-FPN[11]。雖然兩者具有的特征相似,但兩者的復雜性不同,因此所需的層數和連接數也就不同。

2.3 其他方面

Head 部分主要負責特征的捕獲,并通過從Neck捕獲的聚合特征來預測邊界框和類。Head 部分對小目標檢測影響不大,因此實驗中無需修改該結構。

除了上述三個方面,還有其他一些因素會影響小目標檢測的性能。可從輸入圖像的大小,還可以修改模型的深度和寬度,從而改變推算的主要方向。此外,為了檢測特定的特征圖也可以通過手動改變Neck 和Head 的層連接方式來實現。

對于層連接方式的改變,可利用高分辨率特征的重定向將特征直接反饋到Neck 和Head。要達到該效果可以通過以下兩種方法來實現:

1)擴充Neck 部分以適應額外的特征圖;

2)替換最低分辨率特征圖以適應新的特征圖。

如圖1 展現了這兩個可能的方向以及原有布局的對比示例圖。

圖1 兩種可能方向和原有布局對比示例圖

3 模型的訓練及評估

3.1 實驗環境

研究中的所有實驗均在如表1 所示的硬件環境中完成:

表1 實驗電腦的配置

3.2 數據集和實驗設置

為了訓練改進后的模型并為實驗提供信息,實驗選取了一個以自動駕駛車輛視角拍攝的路障數據集[12]。該數據集原本的目的是利用路障的不同顏色來指導自動駕駛車輛選擇行車路徑。如圖2所示,該數據集中包括四種不同顏色的路障,總計接近4 000張圖片。

圖2 數據集中各顏色實例數

數據集中包括數據增強圖像和惡劣天氣條件下的圖片,因此可以更好地模擬自動駕駛汽車在真實行駛環境中遇到的復雜情況。此外,也可以用包含交通標志[13]的小目標數據集替代路障數據集。

盡管數據集中包含路障的圖片并不多,但路障的目標密度[14]卻非常高,總共有超過10 000 個標記目標,因此并不存在目標數不足的問題。

與自動駕駛場景中的其他物體(如行人和車輛)相比,路障很小。實驗得到的關系圖3 顯示了數據集中路障目標邊界框的位置、高度和寬度,由圖可見該數據集具有高度集中的較小目標框,這種高密度的小目標數據集給研究小目標檢測帶來了諸多好處[15],同時也克服了網絡上許多流行數據集在小目標檢測[16]上的問題(如MS COCO)。

將數據集按7∶1∶2 的比例分為訓練集、驗證集和測試集,并取模型的多次測試的平均性能作為代表。

圖3 實例的中心點位置(橫坐標x、縱坐標y)、高度和寬度關系圖

3.3 評價標準

YOLOv5 的原始模型在目標的邊界框區域和聯合交集(Intersection over Unions,IoU)提供了與COCO的兼容性,因此按COCO 數據集來定義小目標的尺寸大小。

由于這些指標默認只與COCO 數據集兼容,因此在測試代碼中重新嘗試實現,以便在使用任何數據集時為研究獲得更有價值的數據。測試模塊將會計算大、中、小目標的值以及整體性能。目標大小的判定為:小目標(目標面積小于32 平方像素)、大目標(目標面積大于96 平方像素)、中目標(目標面積介于大、小目標之間)。

3.4 實驗結果

由圖2 可知橙色和綠色路障數據更為集中,因此僅選擇兩者展示性能。

表2 對四種YOLOv5-Sobj模型的改進

3.4.1 改進效果分析

圖4(a)所示為以50% IoU 得到的所有目標mAP(mean Average Precision),圖4(b)是以50% IoU 得到的小目標mAP,圖4(c)是以每秒幀數為單位的推算速度。橫坐標中lr02 代表將學習率更改為0.02,lr005則為0.005;用ResNet50替換Backbone,DenseNet表示將Backbone 更改為DenseNet;3anch 指每個尺度自動生成3 個錨框,5anch 指生成自動生成5 個。fpn是將Neck 更改為fpn 的Neck,bifpn 則是將Neck 更改為bifpn 的Neck;deep 指增加模型深度,wide 則指增加模型寬度;XS_inc 指擴充Neck 部分以適應額外的特征圖,XS_ex 指替換最低分辨率特征圖以適應新的特征圖。此外,圖中每個橫坐標對應的四條柱狀線從左至右依次為S、M、L、X 模型下的實驗結果。

表3 YOLOv5-Sobj與YOLOv5性能參數對比

分析改變Backbone 結構帶來的影響,可以發現隨著模型的逐漸增大,DenseNet 的推算時間也在小幅固定增加(大約3 ms),但其檢測性能也得到了顯著的改進。對比之下,ResNet 在大多數情況下性能會下降,而且推算時間也明顯更長。

分析改變Neck 結構帶來的影響,fpn 僅在S 模型中性能優于bifpn,而bifpn 的推算時間和YOLOv5 原有模型近似。這表明保持特征圖相對不變對于簡單的模型來說可能更有益,但對于相對復雜些的模型就需要對特征圖額外處理。

在特征圖方面,研究發現,重定向被送到Head和Neck 的特征圖對性能有著明顯的影響。用更高分辨率的特征圖替換最低分辨率的特征圖在性能上帶來的成效顯著。

在錨框數量方面,根據數據集生成錨框在性能上確實是有效的,并且其推算時間和原有模型近似。然而,性能提升的大小似乎受到模型大小的影響。

在其他方面,研究發現,更大的學習率確實可以更好地利用模型,但這可能會隨小學習率訓練模型的epoch數量變化而變化。此外,與更深的模型相比,更寬的模型對小尺度目標檢測效果更好。這些類型的改進對推算速度有著明顯的負面影響,因此不考慮使用。

圖4 單獨結構更改對模型性能的影響

3.4.2 實驗總結

對于上述提出的改進進行技術組合之后,就得到了一種基于YOLOv5 優化針對小目標檢測的算法并將其命名為YOLOv5-Sobj。實驗證明,YOLOv5-Sobj 在以50% IoU 得到的所有目標絕對mAP 上實現了平均2.4%的性能提升,在以50% IoU 得到的小目標絕對mAP 上實現了5.3%的提升,同時付出了推算時間平均增加大約3 ms 的代價,但這是可以接受的。

4 結束語

在對YOLOv5 小目標檢測算法的改進中提出了幾種架構修改,與原有模型相比,以相對較低的成本實現了較大的性能改進,而且保證了推算速度與原有模型基本近似。雖然實驗提出的架構有著不錯的改進效果,但實驗結論的普遍性還應進一步研究。最后,還有很多的方向和技術在文章中沒有提及,這也是需要進一步研究的地方。

猜你喜歡
特征實驗檢測
記一次有趣的實驗
“不等式”檢測題
“一元一次不等式”檢測題
“一元一次不等式組”檢測題
如何表達“特征”
做個怪怪長實驗
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
NO與NO2相互轉化實驗的改進
實踐十號上的19項實驗
太空探索(2016年5期)2016-07-12 15:17:55
主站蜘蛛池模板: 国产男女XX00免费观看| 国产资源免费观看| 成人午夜网址| 男人天堂伊人网| 亚洲全网成人资源在线观看| 亚洲av无码片一区二区三区| 91探花在线观看国产最新| 欧美成人精品在线| 极品性荡少妇一区二区色欲| 亚洲系列无码专区偷窥无码| 玖玖免费视频在线观看| 日本高清免费不卡视频| 91九色最新地址| 激情六月丁香婷婷四房播| 欧美在线黄| 四虎成人精品| 四虎精品免费久久| 国产性精品| 欧美中文字幕无线码视频| 国产精品视频第一专区| 国产97公开成人免费视频| 欧美日韩福利| 免费无码AV片在线观看国产| 伊人久久大香线蕉综合影视| 国内丰满少妇猛烈精品播 | 一级香蕉人体视频| 亚洲日韩图片专区第1页| 啊嗯不日本网站| 国产女人水多毛片18| 91丝袜美腿高跟国产极品老师| 欧美日韩国产在线观看一区二区三区| 精品国产网站| 秋霞一区二区三区| 色婷婷成人网| 国产69囗曝护士吞精在线视频| 欧美精品v日韩精品v国产精品| 一本大道在线一本久道| www亚洲天堂| 国产女人喷水视频| 亚洲综合久久成人AV| 五月激情婷婷综合| 天天躁夜夜躁狠狠躁图片| 日韩高清成人| 成人中文在线| 99热6这里只有精品| 色婷婷综合激情视频免费看| 2020国产免费久久精品99| 国产青青操| 国产原创第一页在线观看| 免费看美女自慰的网站| 国产一区二区三区精品久久呦| 久久免费视频播放| 日韩精品亚洲人旧成在线| 亚洲天堂久久| av大片在线无码免费| 精品国产自| 在线观看国产精品日本不卡网| 99久久国产综合精品2023| 国产精品九九视频| 国产理论一区| 日本亚洲成高清一区二区三区| 国产乱子精品一区二区在线观看| 亚洲最大福利网站| 亚洲人成影院午夜网站| 无码精油按摩潮喷在线播放| 狼友视频国产精品首页| 亚洲国产天堂在线观看| 久久久久人妻一区精品| 国产精品私拍在线爆乳| 亚洲精品国产日韩无码AV永久免费网 | 国产欧美日韩资源在线观看| 5555国产在线观看| 亚洲国产欧洲精品路线久久| 亚洲成人手机在线| 精品久久久久成人码免费动漫| 日韩亚洲高清一区二区| 无码又爽又刺激的高潮视频| 久久亚洲精少妇毛片午夜无码| 亚洲国产精品VA在线看黑人| 永久免费AⅤ无码网站在线观看| 国产精品 欧美激情 在线播放 | 99视频在线精品免费观看6|