苗翔宇 劉華軍
(南京理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 南京 210014)
公路的建設(shè)極大地方便了人們的日常出行,行車(chē)安全也越來(lái)越凸顯其重要性,及時(shí)修補(bǔ)破損路面是道路管理部門(mén)的一項(xiàng)重要工作。因此,快速掌握路面狀況,并高效地實(shí)現(xiàn)自動(dòng)化裂縫檢測(cè)是亟待解決的工程實(shí)踐問(wèn)題。傳統(tǒng)的路面檢測(cè)方法是由專(zhuān)業(yè)人員人工排查,根據(jù)損毀嚴(yán)重程度進(jìn)行專(zhuān)業(yè)的評(píng)估,但是這種方式不僅工作量大,而且效率很低,檢測(cè)成本非常高。
為了更加高效地檢測(cè)路面裂紋,基于圖像處理的方法得到了廣泛的應(yīng)用,常用的傳統(tǒng)圖像處理方法主要包括閾值分割[1]、邊緣檢測(cè)[2~4]、小波變換[5~6]以及基于形態(tài)學(xué)[7]的方法。但是由于光照,陰影,背景和紋理這些因素的影響,這些檢測(cè)的結(jié)果往往不盡人意。
近年來(lái),深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一個(gè)分支,在各種視覺(jué)識(shí)別任務(wù)取得了良好的表現(xiàn)。深度學(xué)習(xí)通過(guò)神經(jīng)網(wǎng)絡(luò)自動(dòng)學(xué)習(xí)裂縫圖像的特征,不再需要人為地設(shè)計(jì)特征提取器。隨著全卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,涌現(xiàn)出一批諸如FCN[8]、U-Net[9]、Segnet[10]、FusioNet[11]、DeepCrack[12]等網(wǎng)絡(luò)結(jié)構(gòu),可以實(shí)現(xiàn)像素級(jí)語(yǔ)義分割,能夠進(jìn)行端到端的裂縫檢測(cè)。這種像素級(jí)的分類(lèi)任務(wù)其難點(diǎn)在于如何提升分類(lèi)的精度,減少錯(cuò)誤分類(lèi)的誤差。因此,本文在金字塔特征融合的基礎(chǔ)上加入了多級(jí)注意力機(jī)制,構(gòu)建出一個(gè)新型的網(wǎng)絡(luò)結(jié)構(gòu)(Cascaded attentions Networks,CANet),能夠有效地提升裂縫圖像的識(shí)別精度,具體包含如下設(shè)計(jì)工作:
1)Layer-Attention 模塊:該模塊利用了注意力機(jī)制,可以提升裂縫像素部分的權(quán)重,幫助神經(jīng)網(wǎng)絡(luò)捕捉到裂縫的特征,提升識(shí)別精度。……