樓哲航,羅素云
基于YOLOX和Swin Transformer的車載紅外目標(biāo)檢測
樓哲航,羅素云
(上海工程技術(shù)大學(xué) 機(jī)械與汽車工程學(xué)院,上海 201620)
紅外圖像因?yàn)榇嬖谠肼暣蟆Ρ榷炔患训葐栴},容易導(dǎo)致目標(biāo)檢測時(shí)的精度降低,本文結(jié)合YOLOX和Swin Transformer,提出了一種改進(jìn)的YOLOX的模型。改進(jìn)的模型采用Swin Transformer替換YOLOX中的CSPDarknet主干提取網(wǎng)絡(luò),減少YOLOX中Neck和Head部分的激活函數(shù)以及標(biāo)準(zhǔn)化層,以提高特征的提取能力,優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。對改進(jìn)的模型在艾瑞光電數(shù)據(jù)集和FILR數(shù)據(jù)集上均進(jìn)行了測試,實(shí)驗(yàn)結(jié)果顯示,改進(jìn)后的YOLOX網(wǎng)絡(luò),在兩個數(shù)據(jù)集上的平均檢測精度都有明顯提升,更加適合紅外圖像的目標(biāo)檢測。
目標(biāo)檢測;紅外圖像;YOLOX;Swin Transformer
伴隨紅外技術(shù)的不斷發(fā)展以及其“軍轉(zhuǎn)民”技術(shù)的不斷成熟,紅外技術(shù)在各個領(lǐng)域都有越來越多的應(yīng)用。在無人駕駛領(lǐng)域,紅外技術(shù)主要用于生命體的檢測以及對車輛的可駕駛區(qū)域的檢測。物體間無時(shí)無刻不在交換紅外輻射,加之紅外成像設(shè)備的性能限制,導(dǎo)致了紅外圖像具有分辨率低、噪聲大、邊緣模糊、對比度不佳等特點(diǎn),上述物理特性也給基于紅外圖像的目標(biāo)檢測算法的設(shè)計(jì)與實(shí)現(xiàn)帶來了更多的挑戰(zhàn)[1]。
紅外目標(biāo)檢測的方法主要分為傳統(tǒng)方法和基于機(jī)器學(xué)習(xí)的方法。傳統(tǒng)方法主要有基于形狀的目標(biāo)檢測和基于運(yùn)動的目標(biāo)檢測。
基于形狀的紅外目標(biāo)檢測方法通過預(yù)先建立目標(biāo)模板,依據(jù)特定的搜索策略采用模板匹配的思想來實(shí)現(xiàn)目標(biāo)檢測。任章[2]等人依據(jù)行人目標(biāo)的特點(diǎn),重新構(gòu)建模板特征,并融入Kalman預(yù)測器來預(yù)測目標(biāo)的運(yùn)動軌跡,使得虛警率降低。……