(1.School of Electrical and Control Engineering,Shaanxi University of Science 8. Technology,Xi'an 710021, China;2.School of Electronic Information and Artificial Intelligence,Shaanxi University of Science 8. Technology,Xi'an 710o21,China;3.Computer and Information Science,University of Strathclyde,Glasgow Scotland G11XQ,UK)
Abstract: Aiming at the problems of existing pavement disease detection models such as weak feature extraction ability,low detection accuracy and insufficient feature fusion,as well as the inability to effectively balance detection accuracy with light weighting,based on YOLOv8, combined with channel prior convolution attention (CPCA) mechanism and bidirectional feature pyramid network (BiFPN),this paper proposed a pavement disease detection model YOLOv8n-CB.The CPCA mechanism is introduced into the backbone of YOLOv8n ,which can dynamically adjust the attention weights of channels and spatial dimensions,enhance the feature extraction capability of the network for small targets,and thus improve the detection accuracy of the model.In addition,the neck of YOLOv8n is replaced with a weighted BiFPN.
By adding bidirectional connection and weighted feature fusion mechanism,the presented model not only realized the lightweight model,but also improved the feature fusion capability for small targets.The experimental results on the China_Mix pavement defect dataset demonstrate that,compared to the original model,the improved model
0.9] may reach 1% and 2.90% increase respectively, 2% increase in Fl-score,and 29.33% (204 reduction in parameters,as well as 9.88% reduction in floating-point operations.By comparing experiments with other YOLO models,the effectiveness and superiority of this model are further verified.The presented model provides a technical support for the intelligent prevention and control of comprehensive transportation on highways.
Key words:pavement disease; YOLO; attention mechanism; bidirectional feature pyramid
0 引言
21世紀(jì)以來,隨著國內(nèi)生產(chǎn)總值(GDP)的快速增長,中國高速公路建設(shè)里程和民用汽車保有量呈現(xiàn)出增長的趨勢[1].截至2024年,中國高速公路總里程已超18.3萬公里,汽車保有量約3.45億輛.隨著養(yǎng)護(hù)工作量的增加,由于人力資源和財(cái)力的限制,路面養(yǎng)護(hù)存在一定的滯后性,導(dǎo)致車輛在破損路面上行駛的情況普遍存在.因此,考慮路面損壞對高速公路交通安全的影響顯得十分必要.
路面病害檢測是評估道路維護(hù)狀況的關(guān)鍵環(huán)節(jié).路面病害的存在不僅會破壞路面結(jié)構(gòu),導(dǎo)致車輛行駛速度下降,減少道路使用壽命,還可能降低路基的承載力,引發(fā)路面坍塌,對交通安全構(gòu)成威脅,同時也會造成經(jīng)濟(jì)損失[].傳統(tǒng)的路面病害檢測主要以人工實(shí)地勘測為主,然而,傳統(tǒng)的人工檢測方法在效率、精度和覆蓋范圍方面存在明顯局限性[3],因而難以滿足中國高速公路較大規(guī)模的檢測需求.
深度學(xué)習(xí)技術(shù)推動了路面病害自動檢測技術(shù)的發(fā)展.其中,語義分割和目標(biāo)檢測等方法在路面病害檢測中得到了廣泛應(yīng)用.以U-Net、FCN(FullyConvolutionNetworks)為代表的語義分割網(wǎng)絡(luò),通過對每個像素進(jìn)行分類,實(shí)現(xiàn)對病害區(qū)域的分割.Zhang等4提出了一種改進(jìn)的U-Net網(wǎng)絡(luò)路面裂縫分割方法,引入VGG16和Up_Conv(UpsampledConvolution)模塊分別作為主干網(wǎng)絡(luò)和特征增強(qiáng)網(wǎng)絡(luò),提高路面窄裂縫的識別精度.Su等5采用多樣化的裂縫圖像數(shù)據(jù)集,對以HR-NetV2-W18-Small為骨干的全卷積網(wǎng)絡(luò)(FCN)進(jìn)行了訓(xùn)練,發(fā)現(xiàn)CNN模型在計(jì)算機(jī)和移動的設(shè)備上具有較好的性能.
目標(biāo)檢測算法主要分為單階段和兩階段兩類,在單階段檢測算法中,以YOLO(YouOnlyLookOnce)和 SSD(Single Shot MultiBox Detector)系列算法為典型代表.Kartik等6使用YOLOv3進(jìn)行目標(biāo)檢測,對建筑物裂縫的檢測具有較高的精度.Liu等提出了一種基于街道全景圖像的路面病害檢測方法,通過引人ShuffleAttention和SwinTransformer模塊改進(jìn)YOLOv5模型,并利用遷移學(xué)習(xí)優(yōu)化其骨干網(wǎng)絡(luò).實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的YOLO-SST模型在檢測性能上優(yōu)于YOLOv5等單階段檢測算法.Ye等[8提出了一種基于改進(jìn)YOLOv7的混凝土結(jié)構(gòu)表面裂縫檢測模型,通過集成Aatten、Myswin和FEEM模塊,提高了裂縫檢測精度.王雪秋等提出了一種基于YOLOv8的道路檢測算法,通過引人MPCA機(jī)制和C2f-MPDC模塊,提升模型檢測精度與效率,適合資源受限場景.
兩階段目標(biāo)檢測的經(jīng)典算法包括R-CNN及其衍生算法FastR-CNN、FasterR-CNN和MaskR-CNN等.Liu等[1o]改進(jìn)的分割R-CNN模型在16幅瀝青路面圖像上對裂縫、坑洼和補(bǔ)丁進(jìn)行檢測,通過新增分支實(shí)現(xiàn)了對路面病害的像素級分割和分類,有效提高了檢測精度.Song等1利用區(qū)域提議網(wǎng)絡(luò)對FasterR-CNN模型進(jìn)行了優(yōu)化,能準(zhǔn)確檢測裂紋、坑洼、滲油和點(diǎn)狀表面等路面病害.Liu等[12]提出了一種結(jié)合GPR技術(shù)和改進(jìn)的MaskR-CNN模型的像素級裂縫檢測方法,該方法能夠在不影響路面結(jié)構(gòu)的情況下,準(zhǔn)確地檢測并定位瀝青路面下的垂直裂縫.
然而,現(xiàn)有方法在處理路面病害檢測任務(wù)上還存在一些缺陷,例如:裂縫可能與路面標(biāo)線、紋理等混淆,像人行橫道與縱向裂縫在視覺特征上存在一定相似性,以及橫向、縱向、龜裂等裂縫類別之間的干擾,檢測過程容易出現(xiàn)誤檢、漏檢情況.為應(yīng)對這些挑戰(zhàn),本文提出了一種改進(jìn)的路面病害檢測模型——YOLOv8n-CB 模型.該模型計(jì)算量較小,可以降低對高性能計(jì)算設(shè)備的依賴,提高檢測系統(tǒng)的魯棒性.該模型成功應(yīng)用于某省交通運(yùn)輸廳科研項(xiàng)目“XX公路基礎(chǔ)設(shè)施數(shù)字化管理關(guān)鍵技術(shù)與裝備研究”中,極大地提升了公路交通基礎(chǔ)設(shè)施的智能化水平.
1YOLOv8n-CB路面病害檢測模型
1. 1 YOLOv8網(wǎng)絡(luò)模型
YOLOv8網(wǎng)絡(luò)由主干(Backbone)、頸部(Neck)、頭(Head)和損失函數(shù)(Loss)四大部分組成2],其結(jié)構(gòu)如圖1所示.

相較于YOLOv5的C3模塊,YOLOv8引入了C2f模塊,通過替換C3模塊中的串聯(lián)Bottle-Neck模塊為梯度分流(GradientShortcut)連接,有效地在模型保持輕量化的同時,增強(qiáng)了梯度流的豐富性.
相較傳統(tǒng)目標(biāo)檢測算法,YOLOv8引人了無錨框(Anchor-free)的網(wǎng)絡(luò)結(jié)構(gòu),它舍棄了預(yù)設(shè)固定錨框的限制.這種改進(jìn)使其在遇到尺寸差異顯著的目標(biāo)時,網(wǎng)絡(luò)不受預(yù)設(shè)錨框大小的影響,能夠直接且更加準(zhǔn)確地預(yù)測物體的位置和尺寸,從而提高了檢測精度.
為了更精確地回歸目標(biāo)框的邊界,該模型結(jié)合了分布式焦點(diǎn)損失(DistributionalFocalLoss,DFL)函數(shù)和CIoU損失函數(shù),作為回歸損失的關(guān)鍵部分.此外,改進(jìn)了樣本匹配策略,YOLOv8摒棄了傳統(tǒng)的IoU匹配和單尺度樣本分配方法,而是引人了一種創(chuàng)新的任務(wù)對齊分配器(Task-A-lignedAssigner).這種新的分配策略為損失函數(shù)的計(jì)算提供了更精確和任務(wù)目標(biāo)對齊的樣本選擇,從而優(yōu)化了樣本匹配效果.
1.2 CPCA注意力機(jī)制
通道先驗(yàn)卷積注意力(ChannelPriorConvo-lutionalAttention,CPCA)[13]機(jī)制通過使用深度卷積14模塊構(gòu)建空間注意力,并單獨(dú)計(jì)算每個通道的空間注意力圖,進(jìn)而實(shí)現(xiàn)空間注意力權(quán)重在通道上的動態(tài)分配.CPCA注意力機(jī)制能夠動態(tài)調(diào)整通道和空間維度上的注意力權(quán)重,在面對部分遮擋、雨水覆蓋和異物干擾時,該機(jī)制可以幫助模型聚焦于病害特征區(qū)域,減少無關(guān)干擾因素的影響.
CPCA主要由通道注意力模塊(ChannelAt-tentionModule,CA)和空間注意力模塊(SpatialAttentionModule,SA)組成,如圖2所示為CPCA的網(wǎng)絡(luò)結(jié)構(gòu)圖.CPCA的執(zhí)行過程如下:首先,對于輸人特征圖 F∈Rc×H×W (C:Channels,特征圖的通道數(shù);H:Height,特征圖的高度;W:Width,特征圖的寬度),經(jīng)過通道注意力模塊CA的處理,會生成通道注意力圖 Mc∈Rc×1×1 .緊接著, Mc 與輸入特征圖 F 逐元素相乘,將通道注意力權(quán)重沿著空間維度進(jìn)行傳播,進(jìn)而得到融合了通道注意力的特征圖 Fc∈Rc×H×W .然后,SA 模塊對 Fc 進(jìn)行處理以生成空間注意力特征圖 Ms∈Rc×H×W .最后, Ms 與 Fc 逐元素相乘,可獲得輸出特征圖
(2 Rc×H×W .上述執(zhí)行過程可以分別使用公式(1)、(2)加以描述.


式(1)、(2)中:“ ⑧ ”表示逐元素乘法.
1.2.1 通道注意力模塊CA
CA模塊是利用通道之間的依賴關(guān)系來生成通道注意力特征圖.在生成通道注意力特征圖的過程中,CPCA執(zhí)行與CBAM[15]一致的操作步驟.首先,通過平均池化(AveragePooling,AvgPool)和最大池化(MaxPooling,MaxPool)融合空間信息,形成了兩個獨(dú)立的空間上下文描述符.緊接著,這些描述符被送人一個共享的多層感知器(SharedMulti-LayerPerceptron,MLP)中進(jìn)行處理,以計(jì)算每個通道的注意力權(quán)重值.最后,使用Sigmoid函數(shù)對權(quán)重進(jìn)行歸一化處理.通道注意力的計(jì)算過程可用公式(3)加以描述.
CA(F)=σ(MLP(AvgPool(F))+
MLP(MaxPool(F)))
式(3)中: σ 表示Sigmoid函數(shù).
1.2.2 空間注意力模塊SA
空間注意力特征圖是通過提取空間映射關(guān)系所生成的.SA模塊在利用深度卷積來捕獲特征之間的空間關(guān)系的同時,保留了各個通道間的依賴關(guān)系.
深度卷積提取空間依賴關(guān)系的具體過程如下:首先,對于輸入到深度卷積模塊當(dāng)中的通道先驗(yàn),使用為 5×5 大小的卷積核提取特征.隨后,利用多分支深度卷積捕獲不同尺度的上下文信息,從而產(chǎn)生各通道的空間注意力特征圖.在每個分支內(nèi),使用兩個深度帶狀卷積來模擬大型卷積核的標(biāo)準(zhǔn)深度卷積的作用效果.這種設(shè)計(jì)既減輕了網(wǎng)絡(luò)的計(jì)算負(fù)擔(dān),又有利于特征的提取.本文將卷積核設(shè)計(jì)為四個尺度,大小分別為5、7、11、21,主要用于捕獲不同尺度的信息. D,5×5 卷積核大小適中,利于捕捉局部特征,能精準(zhǔn)描述裂縫、坑槽等細(xì)節(jié),適用于提取路面病害局部特征; D,7×1 卷積核其形狀在空間上延伸,能捕捉長范圍特征,增強(qiáng)對方向性病害感知; D,11×1 卷積核可獲取廣泛上下文,融合龜裂周邊信息,助于判斷坑槽等復(fù)雜病害與環(huán)境關(guān)系; D,21×1 卷積核尺寸最大,獲取宏觀上下文,整合遠(yuǎn)處特征,用于評估大面積病害,形成多尺度特征提取.最后,為了進(jìn)一步增強(qiáng)特征表示,采用 1× 1的卷積對不同通道的空間注意力圖進(jìn)行通道混合.上述過程可用公式(4)加以描述.

式(4)中: Conv1×1 表示 1×1 卷積,DwConv表示深度卷積,Branchi表示第i個分支運(yùn)算,其中
:
1.3加權(quán)雙向特征金字塔
在路面病害檢測中,縱向裂縫、橫向裂縫和坑槽因尺寸差異會呈現(xiàn)不同的分辨率特征.YOLOv8的PAN特征融合網(wǎng)絡(luò)采用簡單線性疊加,未考慮不同尺度特征對融合結(jié)果的貢獻(xiàn)差異.這可能導(dǎo)致大目標(biāo)特征掩蓋小目標(biāo)特征信息,引發(fā)小目標(biāo)(坑槽等)漏檢問題.因此,需要設(shè)計(jì)更精細(xì)的特征融合策略以優(yōu)化檢測效果.
此外,隨著特征提取網(wǎng)絡(luò)層次的不斷加深,特征圖的分辨率會逐漸降低,這對檢測較小目標(biāo)的定位任務(wù)而言是個巨大挑戰(zhàn).造成這一問題的根本原因在于,過多的卷積操作使得小目標(biāo)的輪廓和邊緣信息在特征提取過程中逐漸丟失,從而影響了定位的精度.
為了克服以上挑戰(zhàn),本文借鑒BiFPN[16]的設(shè)計(jì)理念,并對YOLOv8網(wǎng)絡(luò)中的特征融合網(wǎng)絡(luò)進(jìn)行了優(yōu)化.具體來說,通過在同一尺度的輸人節(jié)點(diǎn)至輸出節(jié)點(diǎn)之間增加加權(quán)跳躍連接,在不明顯增加計(jì)算成本的前提下,以特征加權(quán)的方式融合更多的原始特征信息,特征加權(quán)時的加權(quán)值按照快速歸一化特征融合的方式來確定,在保證數(shù)值穩(wěn)定和訓(xùn)練速度的同時,能根據(jù)特征的重要性進(jìn)行合理加權(quán).在存在干擾的情況下,加權(quán)BiFPN結(jié)構(gòu)可以根據(jù)特征圖對融合結(jié)果的貢獻(xiàn)度動態(tài)分配權(quán)重,更好地整合不同尺度的特征信息.優(yōu)化后的網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示,其中兩條紅色虛線為新增的兩條加權(quán)跳躍連接.

1. 4 改進(jìn)后的YOLOv8n-CB模型
為提升YOLOv8對于路面病害檢測的性能,分別對其主干、頸部提出了以下兩種改進(jìn)方法:主干引入CPCA機(jī)制、頸部替換為BiFPN結(jié)構(gòu).本文將改進(jìn)后的網(wǎng)絡(luò)模型命名為YOLOv8n-CB,其網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示.

2路面病害數(shù)據(jù)集及實(shí)驗(yàn)環(huán)境配置
2.1China_Mix數(shù)據(jù)集構(gòu)建
本文所采用的數(shù)據(jù)集包含部分公開道路損壞數(shù)據(jù) 集 RDD2022(Road Damage Dataset,RDD)[17]以及自建數(shù)據(jù)集.在本研究中,使用了開源數(shù)據(jù)集RDD2022.該數(shù)據(jù)集包含印度、日本、捷克、美國、挪威和中國等六個國家的路面圖像,主要包含四種路面病害:縱向裂縫(D0O)、橫向裂縫(D10)、龜裂(D20)和坑槽(D40).
優(yōu)質(zhì)的數(shù)據(jù)源是構(gòu)建高性能路面病害檢測器的關(guān)鍵.為增強(qiáng)模型的魯棒性,自行在校園多個路段收集了900張瀝青路面病害、車道標(biāo)識線與縱向裂縫等多種場景下的路面圖像.為確保圖像質(zhì)量,這些圖像嚴(yán)格遵循RDD2022中國區(qū)數(shù)據(jù)集的拍攝風(fēng)格,特別是在手持設(shè)備自由角度的拍攝方式上.
本文將RDD2022中的China_Drone和China_MotorBike兩部分?jǐn)?shù)據(jù)集,與自行采集的數(shù)據(jù)集進(jìn)行整合,形成了一個新的數(shù)據(jù)集,并命名為Chi-na_Mix.該數(shù)據(jù)集包含5278張圖片,按照 8:1:1 的比例將China_Mix數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集以及測試集.
2.1. 1 數(shù)據(jù)增強(qiáng)
在China_Mix的訓(xùn)練集中,四種路面病害實(shí)例的占比情況如圖5所示.由圖可知,縱向裂縫(DOO)類別的樣本在訓(xùn)練集中占比為 52.7% ,而坑槽(D40)實(shí)例的占比為 6.2% ,龜裂實(shí)例的占比約為 11.3% .縱向裂縫類別的樣本數(shù)量遠(yuǎn)多于坑槽以及龜裂的樣本數(shù)量,這三類樣本數(shù)量的占比差異較大,存在明顯的類別數(shù)量不均衡的問題

因此,引入數(shù)據(jù)增強(qiáng)技術(shù),對China_Mix訓(xùn)練集中的龜裂和坑槽兩類實(shí)例樣本數(shù)量進(jìn)行擴(kuò)充.本文采用了幾何變換、添加高斯噪聲、亮度調(diào)節(jié)、Cutout、Mixup、Mosaic等圖像增強(qiáng)方法.
2.1.2 數(shù)據(jù)集標(biāo)注
在數(shù)據(jù)集的準(zhǔn)備階段,標(biāo)注圖像中含有的不同病害實(shí)例是一個至關(guān)重要的步驟.RDD2022中國區(qū)數(shù)據(jù)在發(fā)布時已帶有PASCALVOC格式的標(biāo)注文件,因此僅需對自行采集及擴(kuò)充后的數(shù)據(jù)集進(jìn)行相應(yīng)的標(biāo)注處理.
本文運(yùn)用了計(jì)算機(jī)視覺標(biāo)注工具LabelImg來標(biāo)記圖像數(shù)據(jù),涉及的標(biāo)注類別如表1所示,且所有標(biāo)注信息均遵循PASCALVOC格式.

2.2 實(shí)驗(yàn)環(huán)境配置
本文后續(xù)的實(shí)驗(yàn)與評估工作均在基于Py-torch深度學(xué)習(xí)框架中完成,詳細(xì)的實(shí)驗(yàn)環(huán)境配置信息如表2所示.

3實(shí)驗(yàn)結(jié)果與分析
3.1 評價(jià)指標(biāo)
為驗(yàn)證本文方法的有效性,實(shí)驗(yàn)使用平均精度均值(mean Average Precision,mAP)、Fl-score、十億次浮點(diǎn)運(yùn)算每秒(GFLOPs)、參數(shù)量(Params)等作為評價(jià)指標(biāo).其中,GFLOPs用于度量模型或算法的復(fù)雜性,而Params表示模型的大小.通常,Params和GFLOPs越小,表示模型所需的計(jì)算能力就越小,對硬件的性能要求就越低,在低端設(shè)備中構(gòu)建就越容易.相關(guān)公式如下:




式 (5)~(8) 中: TP (真陽性)指的是模型正確地預(yù)測為正類的樣本數(shù)量, FP (假陽性)指的是模型錯誤地將負(fù)類樣本預(yù)測為正類的樣本數(shù)量, FN (假陰性)指的是模型錯誤地將正類樣本預(yù)測為負(fù)類的樣本數(shù)量. mAP 是目標(biāo)檢測中常用的指標(biāo),主要評估預(yù)測框的準(zhǔn)確性, N 表示檢測目標(biāo)的類別數(shù)量, APi 為第 i 個類別的平均精度.F1-score同時考慮了準(zhǔn)確率和召回率,是一個綜合反映網(wǎng)絡(luò)整體性能的綜合指標(biāo).
3.2消融實(shí)驗(yàn)與分析
為了驗(yàn)證本研究所提出各項(xiàng)改進(jìn)措施的有效性,本小節(jié)以YOLOv8n為基線模型,在China_Mix測試集上對CPCA模塊和BiFPN結(jié)構(gòu)進(jìn)行了消融實(shí)驗(yàn),其實(shí)驗(yàn)結(jié)果如表3所示.

在表3中,由實(shí)驗(yàn)1和實(shí)驗(yàn)2可知,當(dāng)在YOLOv8n 模型的基礎(chǔ)上引入CPCA注意力機(jī)制后,其 mAP@0.5 可提升 0.90% ,
0.9]可提升 2.80% ,但是其參數(shù)量增加了 4.33% 、浮點(diǎn)數(shù)運(yùn)算次數(shù)增加了 2.47% .由表3實(shí)驗(yàn)1和實(shí)驗(yàn)3結(jié)果分析可知, YOLOv8n 頸部替換為BiF-PN結(jié)構(gòu)后,相較于 YOLOv8n ,不僅 mAP@0.5 和mAP@[0.5-0.9] 分別提高了 0.10% 和 0.70% ,而且參數(shù)量卻減少了 33.67% ,浮點(diǎn)數(shù)運(yùn)算次數(shù)也降低了 12.35% .這表明引人BiFPN后不僅提高了模型的檢測精度,而且有效地降低了模型的復(fù)雜度,使得模型更加輕量.由實(shí)驗(yàn)2和實(shí)驗(yàn)4結(jié)果可知,將CPCA和BiFPN二者都結(jié)合到Y(jié)OLOv8網(wǎng)絡(luò)后,模型的 mAP@0.5 和 mAP@[0.5-0.9] 均提高了 0.1% ,與此同時,參數(shù)量減少 32.27% ,計(jì)算量也降低了 12.05% .這表明二者的結(jié)合,有效地平衡了檢測精度與模型復(fù)雜度,使得模型在擁有較高檢測精度的同時保證其輕量化的特點(diǎn).由實(shí)驗(yàn)1和實(shí)驗(yàn)4結(jié)果可知,本文改進(jìn)后的模型在提升精確度的同時,減低模型復(fù)雜程度.相較于基線模型,改進(jìn)后的模型 mAP@0. 5 提升 1% , mAP@ [0.5-0.9]提升 2.90% ,F(xiàn)1-score 提升 2% ,并且參數(shù)量降低了 29.33% ,浮點(diǎn)數(shù)運(yùn)算次數(shù)也降低了 9.88% :
3.3不同模型實(shí)驗(yàn)對比與分析
為進(jìn)一步評估本文所提出的 YOLOv8n–CB 模型在路面病害檢測中的性能,將其與當(dāng)前主流的目標(biāo)檢測模型——YOLOv5s、YOLOv6[18]、YOLOv7_tiny[19]和YOLOv8,在China_Mix數(shù)據(jù)集上進(jìn)行了對比實(shí)驗(yàn).實(shí)驗(yàn)結(jié)果如表4所示.

由表4可知,相較于以上其他模型而言,本文所改進(jìn)的 ΥOI.Ov8n–CB 模型在檢測精度、參數(shù)量、計(jì)算量等方面均有較好的性能表現(xiàn),其 mAP@0.5 為92.30% mAP@[0,5-0.95] 為 65.10% ,F(xiàn)l-score 為88% ,并且該模型僅有212萬個參數(shù),計(jì)算量為7.30GFLOPs.與 YOLOv5s相比,YOLOv8n-CB 模型的mAP(ω,5,mAP(ω[0.5-0.95] 以及Fl-score分別提高了 6.70%.5.70% 和 2% ,參數(shù)量減少了 69.80% ,計(jì)算量減少了 53.80% .與 YOLOv6n 和 YOLOv7_tiny相比, YOLOv8n–CB 模型的 mAP@0.5 分別提高了 1.80% 和 2.40% ,參數(shù)量分別減少了 54.21% 和 64.84% ,計(jì)算量分別減少了 35.63% 和 44.70% 通過與YOLOv8系列模型的對比實(shí)驗(yàn)可知,本文改進(jìn)的模型在檢測精度和模型復(fù)雜度方面具有明顯優(yōu)勢.在與YOLOv8m模型相比,雖然YOLOv8n-CB模型與之具有相同的檢測精度(mAP@0.5=92.30%) ,但是YOLOv8n-CB模型參數(shù)量僅為 2.12M ,減少了 91.80% ;計(jì)算量僅為7.30G,減少了 90.72% .綜上所述,本文提出的YOLOv8n-CB模型在檢測精度和輕量化方面達(dá)到平衡,在保持較低模型復(fù)雜度的同時,有著較高的檢測精度.
為了進(jìn)一步評估所提出模型的泛化性能,本文在 China_Mix 測試集上比較了 YOLOv5s、YOLOv6n、 YOLOv7_ tiny、 YOLOv8n和YOLOv8n-CB等模型的實(shí)際檢測效果,部分檢測結(jié)果如圖6所示.

路面病害的連續(xù)空間分布特性對檢測模型的特征提取能力提出了嚴(yán)格的要求.若檢測模型的特征提取能力不足,易導(dǎo)致同一病害的重復(fù)檢測或漏檢現(xiàn)象的發(fā)生.本文所改進(jìn)的YOLOv8n-CB模型通過引入CPCA注意力機(jī)制,通過動態(tài)調(diào)整通道和空間維度上的注意力的權(quán)重,增強(qiáng)了主干網(wǎng)絡(luò)的特征提取能力.這確保了模型能夠更加完整地提取病害特征,進(jìn)而實(shí)現(xiàn)準(zhǔn)確檢測.
在圖6(a)組圖片中,YOLOv6n和YOLOv8n模型對同一路面病害進(jìn)行了重復(fù)檢測,而YOLOv7_tiny模型甚至出現(xiàn)了漏檢的情況.反觀本文所改進(jìn)的模型在保持較高置信度的同時,能夠?qū)ν徊『M(jìn)行完整性檢測
無人機(jī)獲取的圖像通常具有背景復(fù)雜、小目標(biāo)比例高等特點(diǎn),這使得小目標(biāo)的檢測成為一項(xiàng)具有挑戰(zhàn)性的任務(wù)[20].本文提出的YOLOv8n-CB模型,通過引人CPCA注意力機(jī)制,能夠有效抑制背景干擾,增強(qiáng)網(wǎng)絡(luò)特征提取能力.同時,采用BiF-PN網(wǎng)絡(luò)的加權(quán)特征融合機(jī)制與雙向連接設(shè)計(jì),根據(jù)特征圖對融合結(jié)果的貢獻(xiàn)度動態(tài)分配權(quán)重,并且通過雙向連接設(shè)計(jì)融入更多的小自標(biāo)原始特征,從而顯著提高了網(wǎng)絡(luò)的特征融合能力.通過強(qiáng)化網(wǎng)絡(luò)的特征提取與特征融合能力,顯著提升了模型對于小目標(biāo)檢測效果.
從圖6(b)組圖片中可見,當(dāng)模型對病害紋理 特征的識別不夠清晰,尤其是面對小目標(biāo)對象時, 會出現(xiàn)誤報(bào)和漏檢問題.對于圖中摩托車右側(cè)的橫 向裂縫,YOLOv6n和YOLOv7_tiny模型均出現(xiàn) 了漏檢現(xiàn)象.
在圖6(c)組圖片中,YOLOv5s和YOLOv6n模型錯誤地將人行橫道識別為縱向裂縫.然而,本文提出的YOLOv8n-CB模型不僅避免了這一識別錯誤,還成功捕捉到了斑馬線中間微小的裂縫,這凸顯了其較強(qiáng)的特征提取和特征融合能力.在第四組圖片中,與其他模型相比,YOLOv8n-CB模型以更高的檢測置信度準(zhǔn)確識別了路面病害.
實(shí)驗(yàn)結(jié)果充分表明,本文提出的YOLOv8nCB模型在復(fù)雜背景下的小目標(biāo)病害檢測中表現(xiàn)出色.該模型憑借較強(qiáng)的特征提取和特征融合能力,能夠準(zhǔn)確識別并定位各種小目標(biāo)病害,并展現(xiàn)出良好的檢測效果.同時,其輕量特性能夠有效降低了模型的復(fù)雜度和計(jì)算負(fù)擔(dān),降低了檢測對部署邊緣設(shè)備計(jì)算的資源要求.該模型在某省交通運(yùn)輸廳科研項(xiàng)目中試運(yùn)行結(jié)果表明,本文方法能夠?qū)崿F(xiàn)路面病害的自動化、高精度檢測,從而極大地促進(jìn)道路科學(xué)養(yǎng)護(hù)與安全管理水平的提升.
4結(jié)論
針對當(dāng)前路面病害檢測模型普遍存在的特征提取效率低下、特征融合能力不足,以及在檢測精度與模型輕量化之間難以有效平衡的問題,本研究提出了一種YOLOv8n-CB路面病害檢測模型.該模型結(jié)合通道先驗(yàn)卷積注意力機(jī)制與雙向特征金字塔網(wǎng)絡(luò)對YOLOv8進(jìn)行改進(jìn).在主干網(wǎng)絡(luò)中融入了CPCA機(jī)制,動態(tài)調(diào)整通道與空間維度上的注意力權(quán)重,顯著增強(qiáng)了模型對小目標(biāo)特征的提取能力,進(jìn)而提升了檢測精度.此外,采用了加權(quán)的BiFPN替換原有的頸部網(wǎng)絡(luò),并引入了新的加權(quán)跳躍連接機(jī)制.這一改進(jìn)不僅實(shí)現(xiàn)了模型的輕量化,還顯著提高了對小目標(biāo)的特征融合效率.
實(shí)驗(yàn)結(jié)果表明:與原始YOLOv8模型相比,改進(jìn)后的YOLOv8n-CB模型在 mAP@0.5.mAP@ [0.5-0.9]和F1-score等指標(biāo)上均有明顯提升.同時,該模型的參數(shù)量也顯著地減少,有利于模型在路面病害輕量化檢測終端的部署與實(shí)施.通過與其他YOLO系列模型的實(shí)驗(yàn)對比,進(jìn)一步驗(yàn)證了YOLOv8n-CB模型的有效性和優(yōu)越性,為公路綜合運(yùn)輸安全風(fēng)險(xiǎn)防控的智能化提供了有力的技術(shù)支持,有望在未來的智能交通系統(tǒng)中發(fā)揮重要作用.
在未來研究工作中,一方面,將收集涵蓋更多類型的路面病害以及各種復(fù)雜環(huán)境條件下的數(shù)據(jù)集進(jìn)行測試,進(jìn)一步驗(yàn)證本文方法的有效性.另一方面,將持續(xù)對檢測模型進(jìn)行優(yōu)化,在保證準(zhǔn)確率的前提下提高檢測速度.
參考文獻(xiàn)
[1]冉文文,張會欣,周文帥,等.基于YOLOv8的高速公路事 件檢測方法研究[J].中國交通信息化,2024(10):104- 107,120.
[2] Li X,Zhang Y. Improved road damage detection algorithm based on YOLOv8n[J].IAENG International Journal of ComputerScience,2024,51(11):1 720-1730.
[3]Lin X,ZhouH,ZhangH,etal.YOLO-based approach for pavement damage detection[J].International Core Journal ofEngineering,2024,10(10):22-32.
[4]ZhangQ,Chen S,WuY,etal.Improved U-netnetwork asphalt pavement crack detection method[J].PloS One, 2024,19(5):e0 300 679-e0 300 679.
[5]SuG,Qin Y,Xu H,etal.Automatic real-time crack detectionusing lightweightdeep learning models[J].EngineeringApplications ofArtificial Intelligence,2024,138(PA): 109 340.
[6]Kartik B,Anusha P.Real-timestructural crack detection in buildings using YOLOv3 and autonomous unmanned aerial systemsJ.International Journal of System Assurance Engineering and Management,2024,15(5):1 874- 1 887.
[7]Liu Y,Liu F,LiuW,etal.Pavementdistressdetection using street view images captured via action camera[J]. IEEE Transactions on Intelligent Transportation Systems,2023,12(15):2 213-2 220.
[8] Ye G,Qu J,Tao J,et al. Autonomous surface crack identification of concrete structures based on the YOLOv7 algorithm[J]. Journal of BuildingEngineering,2O23,73(5): 106 688.
[9]王雪秋,高煥兵,郟澤萌.改進(jìn)YOLOv8的道路缺陷檢測 算法[J].計(jì)算機(jī)工程與應(yīng)用,2024,60(17):179-190.
[10] Liu C,Li J,Gao J,et al. Combination of pixel-wise and region-based deep learning for pavement inspection and segmentation[J]. International Journal of Pavement Engineering,2022,23(9):3 011-3 023.
[11] Song L,Wang X. Faster region convolutional neural network for automated pavement distress detection[J]. Road Materials and Pavement Design,2o21,22(1): 23-41.
[12] Liu Z, Yeoh J K W,Gu X,et al. Automatic pixel-level detection of vertical cracks in as-phalt pavement based on GPR investigation and improved mask R-CNN[J]. Automation in Construction,2023,146(6) :104 689.
[13]Huang H,Chen Z,Zou Y,et al. Channel prior convolutional attention for medical image segmentation[J].Computers in Biology and Medicine,2024,178:108 784.
[14]杜林,李勝忠,李廣年,等.基于深度卷積生成式對抗網(wǎng) 絡(luò)的船型特征認(rèn)知與條件生成方法[J].船舶力學(xué),2024, 28(8):1 162-1 174.
[15] Woo S H,Park J,Lee J Y,et al. Cbam:Convolutional Block Attention Module[C]//Proceedings of the European Conference on Computer Vision(ECCV).Munich, Germany:Springer,2018:3-19.
[16] Reddy M V,Reddy K A,Goud M S S,et al. Efficient det : Scalable and efficient object detection[J]. Neuro Quantology,2022,20(19):5 559.
[17]Arya D,Maeda H,Ghosh S K,et al. Deep learning-based road damage detection and classification for multiple countries[J]. Automation in Construction,2021,132 (12):103 935.
[18] Ling H,Zhao T,Zhang Y,et al. Engineering vehicle detection based on improved YOLOv6[J]. Applied Sciences,2024,14(17) :8 054.
[19] Akhil Kumar,Ambrish Kumar,Dushantha Nalin K. Jayakody.Ambiguous facial expression detection for Autism Screening using enhanced YOLOv7-tiny model[J]. Scientific Reports,2024,14(1) :28 501.
[20]徐光憲,唐桂芳,馬飛.改進(jìn)YOLOv8的無人機(jī)航拍道 路損傷檢測方法[J].測繪科學(xué),2024,49(9):104-114.
【責(zé)任編輯:蔣亞儒】