李世偉
(上海建橋?qū)W院 上海市 201306)
YOLOv5 目標(biāo)檢測算法是將物體的定位和分類在一起完成,在一個輸出層回歸bounding box 的位置和所屬類別,在場景復(fù)雜的地方,誤檢會相對較多,而LPRNet[1]由輕量級的卷積神經(jīng)網(wǎng)絡(luò)組成,它采用端到端[2]的方法來進行訓(xùn)練,并且創(chuàng)建嵌入式部署的解決方案,以此來提高車牌識別的準(zhǔn)確率和運算效率。
在車輛目標(biāo)檢測與車牌識別過程中,通過使用構(gòu)成YOLOv5 模型的骨干網(wǎng)絡(luò)CSPDarknet5 與LPRNet 的Backbone 來提取車輛圖片信息的特征。然后,利用這些特征對LPRNET 和YOLOv5 的Neck 與Head 部分進行訓(xùn)練,最后,利用訓(xùn)練好的模型對車輛與車牌進行目標(biāo)檢測。圖1顯示了使用YOLOv5 模型進行車輛目標(biāo)檢測與LPRNET 模型進行車牌識別的框架。一般來說,該方法分為模型訓(xùn)練過程和模型推理兩部分。在訓(xùn)練過程中,利用標(biāo)注好的數(shù)據(jù)進行提取特征,支持目標(biāo)檢測與車牌識別任務(wù)的訓(xùn)練。在識別過程中,將車輛圖片信息輸入給訓(xùn)練好的混合模型進行識別。

圖1:Yolov5 模型車輛目標(biāo)檢測與LPRNET 模型車牌識別框架
2.1.1 輸入端
YOLOv5 模型的輸入端采用了和YOLOv4[3]模型一樣的數(shù)據(jù)增強的方式,即Mosaic 數(shù)據(jù)增強,利用隨機縮放、隨機裁剪、隨機排布的方式進行拼接,對于小目標(biāo)的檢測效果具有明顯提升。YOLOv5 算法針對不同的數(shù)據(jù)集,都會有初始設(shè)定長寬的錨框。在網(wǎng)絡(luò)訓(xùn)練中,網(wǎng)絡(luò)在初始錨框的基礎(chǔ)上輸出預(yù)測框,進而和真實框Ground Truth 進行比對,計算兩者差距,再反向更新,迭代網(wǎng)絡(luò)參數(shù)。在常用的目標(biāo)檢測算法中,不同的圖片長寬都不相同,因此常用的方式是將原始圖片統(tǒng)一縮放到一個標(biāo)準(zhǔn)尺寸,再送入檢測網(wǎng)絡(luò)中。……