俞賢文,郝紅衛,馬永奎
(國網寧夏電力有限公司中衛供電公司,寧夏中衛,755000)
紅外檢測技術已經在電網中得到了大量應用,是當前電力設備狀態檢測的重要手段之一[1]。傳統的紅外檢測技術,主要依賴于人工檢查,對技術人員專業背景和經驗知識要求較高,需要耗費大量人力物力。因此,采用高效的目標檢測方法對紅外電力設備圖像進行快速分類和精準定位具有重要意義。
YOLOv3[2]算法使用深度神經網絡提取深層特征和淺層特征,利用更具鑒別性的深層特征提高檢測的精確度,在兼顧速度的同時具有較高的精度。本文基于YOLOv3算法提出了改進算法。將注意力機制,多尺度檢測層,Involution算子等與YOLOv3結合,實現紅外電力設備圖像的檢測。本文所提方法在自制紅外電力設備數據集上的實驗結果表明,與傳統方法相比,能在精度較高的同時,減少模型參數量,并達到實時檢測的速度。
當前注意力機制在計算機視覺領域中受到了研究者的廣泛關注,常常被應用到圖像分類、檢測和分割等視覺子任務當中。
陳琳琳[3]等人針對傳統的圖像分類方法精度低的問題,在卷積神經網絡的圖像分類模型中加入了注意力機制,給出了一種基于注意力機制的特征提取模塊,利用該模塊可提取不同尺度下圖像的重要特征并對其進行精確分類。王翔[4]等人根據電磁數據的時空特征,通過引入通道注意力機制與空間注意力機制實現對關鍵特征的表示,實現時間序列異常檢測。儲珺[5]等人針對現有目標檢測器特征金字塔無法充分利用不同尺度特征圖的特征信息,不適用于低分辨率圖像的目標和小目標的檢測。將通道注意力機制和殘差學習塊相結合,構造新的目標檢測器。該檢測器通過在不同通道中使用注意力機制學習其通道權重,有效增強了特征的全局表示能力。郭寧[6]等人將注意力機制引入卷及神經網絡的解碼部分,通過增大關鍵信息權重以突出目標區域抑制背景像素干擾,給出了一種融合注意力機制和密集空洞卷積的具有編碼—解碼模式的卷積神經網絡,進行肺部分割。
為了解決當前應用中YOLOv3算法存在的不足之處,使其更適用于自制紅外電力設備目標檢測數據集,本文針對YOLOv3算法進行了以下改進:首先,進行k-means聚類分析重新確定Anchor的尺寸并增加YOLOv3算法檢測層的尺度,提升變電站復雜環境中電力設備小目標的檢測效果;隨后,將YOLOv3的特征提取網絡由Darknet53替換為CSPDarknet53結構,并使用了Involution卷積進行對CSPDarknet53中的卷積操作進行優化在保證性能略有提升的情況下大幅度降低計算復雜度,最后,將一種輕量級局部空間嵌入通道注意力模塊引入到YOLOv3算法中,能夠在僅僅增加少量計算復雜度的情況下,使算法獲得較大的精度提升。
針對紅外電力設備圖像尺度及形態的多樣性導致目標檢測器性能下降的問題,利用YOLOv3算法思想,選擇將低層特征和中層特征進行融合,構成包含多尺度位置信息和語義信息的特征融合層。在原有網絡的基礎上將深層特征通過上采樣操作將其特征圖尺寸放大到與低層特征相同,然后進行Concat操作構建160×160尺度的新檢測層,可以將圖像劃分為更加小的單元格,檢測出更小尺度的物體,提高對小目標的檢測效果。
本文中提出的殘差融合模塊,設計思想是受殘差網絡的啟發而來,殘差模塊實際上可以當作通用函數逼近器,將特征提取網絡的學習目標由擬合普通卷積的恒等映射函數H(x)=x轉換為學習殘差網絡中的殘差函數F(x)=H(x)-x,通過這種結構可以在消除部分冗余特征的同時突出各層中特征的微小變化,并且可以實現不同通道信息的融合。
具體包括:1)本文所提出的殘差融合塊是用于獲取局部空間信息,優化局部通道信息,最后進行多個通道信息的融和。2)為了保存兩組分別沿著兩個空間方向聚合的空間信息嵌入特征,本文調整了殘差融合模塊中各卷積層的通道數,使其輸入通道數和輸出通道數與聚合后的特征相同,對聚合后的輸入特征進行優化。
局部空間嵌入通道注意力模塊中空間嵌入通道注意力的網絡結構中直接使用全局平均池化和全局最大池化獲取通道注意力的全局空間信息,會將所有空間信息壓縮到單一通道當中,導致空間信息的丟失。為了解決這一問題,本文對兩個全局池化操作進行了拆解,變成兩對一維特征編碼操作,實現全局空間信息的嵌入。全局池化的計算方式公式(1)所示:
其中Fgp(xn)為與第n個輸出通道關聯的輸出特征。進行分解后,對于輸入特征,分別對全局平局池化和全局最大池化使用尺寸為(H,1)或(1,W)的池化核沿著水平坐標和垂直坐標對所有通道進行編碼。所以,高度為h的第n通道的輸出可以分別表示為:


寬度為w的第c通道的輸出可以表示為:

上述兩對變換,分別沿著空間中的兩個方向聚合特征,得到兩對嵌入空間信息的特征圖,具體來說,沿著其中一個方向獲取長程依賴關系信息,沿著另一個方向保留精確的空間依賴信息,從而獲取全局感受野并精準的編碼空間位置信息,幫助網絡更精準的定位感興趣的目標區域。
通過嵌入空間位置信息的變換之后,將利用上述特征信息進行空間嵌入通道注意力的生成,這一過程必須滿足以下兩個標準,首先,它能夠充分利用到獲取的精確位置信息,精確地定位感興趣的目標區域。其次,可以有效的進行跨通道的信息融合,精準的捕捉到不同通道之間的關系。
為了驗證本文算法那的檢測效果,在自制紅外電力設備數據集上進行了實驗,并與當前主流檢測算法進行對比實驗。使用平均準確率(mean average precision,mAP)和檢測幀率(frame per second,FPS),作為評價指標。
本文的實驗環境如下:windows 7操作系統,32GB內存,Intel i7-9700K CPU,NVIDA GeForce GTX 2080TI (11GB顯存) GPU,使用pytorch深度學習框架,版本為pytorch 1.7,并配置CUDA10.1+CUDNN7.6實現GPU加速運算。
本文利用收集到的某變電站各類可見光和紅外圖像樣本8475張,使用LabelImg工具按照2種電壓等級(500kV、220kV)、8大類設備(變壓器、斷路器、CT、PT、GIS、高抗、電抗、避雷器)、各類型號、各種部位對搜集到的紅外圖像進行分類、整理、標注,最終篩選出7903張質量較好的紅外圖像并制作成PASCAL VOC格式的紅外電力設備數據集。圖1和圖2分別為紅外電力設備數據集的樣例和檢測結果。

圖1 紅外電力數據集的樣本圖像

圖2 紅外電力數據集的樣本圖像檢測結果
從圖2可以看出,本文給出的算法其檢測框位置與原始標定框位置重合度高,效果好。
表 1為 Faster-RCNN、YOLOv3、Ad-YOLO-SENet、Ad-YOLO-SECANet等算法檢測結果的對比,通過實驗結果可以發現本文所提Ad-YOLO-SECANet算法相比于YOLOv3算法精度提高了1.5個百分點,相對于Ad-YOLO-SENet算法提高了0.6個百分點,且檢測速度更快,實驗結果表明,本文中的方法可以有效提升檢測的精度并具有實時檢測的能力。

表1 在紅外電力圖像數據集上的檢測結果
針對紅外電力設備檢測中存在的多尺度和多形態的問題,本文在YOLOv3算法的基礎上,通過添加160×160尺度檢測層增加網絡對小目標檢測的敏感性,然后使用Involution算子對Backbone的結構進行改進,在減小參數量的同時,獲得了精度的提升,最后,提出新的輕量級注意力機制對特征進行。實驗結果證明,本文給出的算法在測試集上的精確度為83.1%,同其它網絡模型比較,具有較好的檢測性能和魯棒性,證明了本文所提出方法的有效性,為變電站設備紅外檢測提供了更加精準高效的檢測思路。