謝旭琛,王祥東,鄧月輝,田明明
(廣東電網(wǎng)有限責(zé)任公司惠州供電局,廣東惠州,516001)
變電站是電力系統(tǒng)的重要組成單元,擁有眾多電力設(shè)備,這些設(shè)備在長期使用后,會產(chǎn)生磨損、老化等現(xiàn)象,導(dǎo)致設(shè)備出現(xiàn)缺陷故障。目前大部分的設(shè)備缺陷都需要依靠人工根據(jù)現(xiàn)場情況來進(jìn)行評估,這樣的方式不但需要消耗大量的人力及時間成本,也不符合當(dāng)下電力系統(tǒng)高效發(fā)展的需求。
隨著大數(shù)據(jù)與人工智能行業(yè)的發(fā)展,深度學(xué)習(xí)在各個領(lǐng)域的應(yīng)用也越來越多,從生物醫(yī)療到居家安防,尤其是在視覺圖像領(lǐng)域,深度學(xué)習(xí)結(jié)合計算機(jī)視覺的發(fā)展勢如破竹。從AlexNet在2012年ImageNet挑戰(zhàn)賽上大獲成功之后[1],卷積神經(jīng)網(wǎng)絡(luò)(CNN)應(yīng)用到計算機(jī)視覺這一領(lǐng)域引起了許多研究者的興趣,隨后伴隨著VGG、YOLO[2]等網(wǎng)絡(luò)的發(fā)表,卷積神經(jīng)網(wǎng)絡(luò)在視覺任務(wù)中的應(yīng)用越來越廣泛。目標(biāo)檢測是大多數(shù)計算機(jī)視覺任務(wù)的第一步,目前目標(biāo)檢測有兩個主要的方向:一階段網(wǎng)絡(luò)和二階段網(wǎng)絡(luò)。一階段和二階段檢測的主要區(qū)別在于二階段檢測算法需要先生成預(yù)選框,進(jìn)而再進(jìn)行詳細(xì)的物體檢測;而一階段檢測算法會直接在網(wǎng)絡(luò)中提取特征來預(yù)測物體的分類和位置。這兩種方法各有不同,一階段網(wǎng)絡(luò)更注重速度及效率,而二階段網(wǎng)絡(luò)更關(guān)心準(zhǔn)確性。
缺陷識別算法使用二階段級聯(lián)目標(biāo)檢測網(wǎng)絡(luò)Cascade Rcnn[3],其主干網(wǎng)絡(luò)使用殘差網(wǎng)絡(luò)ResNet,能有效地識別變電場景的缺陷目標(biāo)。當(dāng)獲取到場站內(nèi)攝像頭畫面后,圖像先進(jìn)行縮放、歸一化等預(yù)處理,然后輸入到目標(biāo)檢測網(wǎng)絡(luò)內(nèi),一次性輸出潛在的缺陷目標(biāo),并給出置信度供用戶參考,無需重復(fù)多次推理。
現(xiàn)階段變電站設(shè)備缺陷的識別存在以下幾種問題:
(1)同一類缺陷形變多(如掛空懸浮物、滲漏油、蓋板破損等),目標(biāo)形狀不一,特征難統(tǒng)一;(2)目標(biāo)與背景物容易混淆,如鳥巢與背景的樹木、圓形表盤與變壓器本體上其它圓形的部件等等,容易導(dǎo)致誤報;(3)部分類別目標(biāo)尺寸太小,如吸煙,煙頭占畫面的面積非常??;(4)部分類別目標(biāo)數(shù)量太少,如呼吸器硅膠桶破損、油位狀態(tài)異常,數(shù)量少難以訓(xùn)練模型。
Cascade rcnn的整體邏輯如圖1所示,圖片x輸入到骨干卷積層conv提取圖像特征,B0為RPN模塊,對可能存在的目標(biāo)進(jìn)行前后景分類,對認(rèn)為是目標(biāo)前景的區(qū)域進(jìn)行ROI pooling(第一個pool),接著輸入到第一個檢測頭H1,輸出類別C1結(jié)果和bbox坐標(biāo)B1;然后B1又作為第二階段的bbox proposal,進(jìn)行第二次ROI pooing,步驟與第一階段一致;由此再重復(fù)第三次同樣的過程,最終輸出bbox結(jié)果B3以及對應(yīng)的類別結(jié)果C3。

圖1 Cascade rcnn 結(jié)構(gòu)
Cascade RCNN模型能有效地降低假陽性,而為了進(jìn)一步提升我們的檢測精度,我們還對模型中的骨干backbone部分和特征融合neck部分進(jìn)行了改進(jìn)。
Cascade RCNN原版的骨干網(wǎng)絡(luò)為ResNet,近年來為了提升骨干網(wǎng)絡(luò)的特征提取能力,一些新的機(jī)制被提出,可變形卷積(Deformable Convolution)便是其中一種??尚巫兙矸e結(jié)構(gòu)(DCN)對感受野上的每一個點加一個偏差值,這個值的大小是通過學(xué)習(xí)得來的,接入偏差量后感受野不再是矩形,而是與物體的實際形狀相匹配,對于形變大的類別,如滲漏油,能識別到比較準(zhǔn)確的位置。如圖2所示,左圖為傳統(tǒng)卷積網(wǎng)絡(luò)最終框出的矩形區(qū)域,可見有邊緣部分區(qū)域被漏掉了;右圖為可變形卷積的可視化結(jié)果,可見檢測器會把注意力集中在不規(guī)則油漬的周圍。

圖2 檢測器注意力機(jī)制圖示對比
針對改進(jìn)前后,使用相同數(shù)據(jù)集對改進(jìn)前后的網(wǎng)絡(luò)進(jìn)行測試,結(jié)果如表1所示。

表1 結(jié)果表
可以看出,算法改進(jìn)后(Improved-DCN)AP值與之前相比(Baseline)有較明顯的提升,并且對于識別目標(biāo)形變而導(dǎo)致的誤檢以及漏檢問題,有較好的改善。此外,可變形卷積對于用戶硬件開銷的提升不多,因此,可以在保證經(jīng)濟(jì)的情況下提高算法的整體準(zhǔn)確性。
我們使用的是基于一階段檢測的YOLO算法第五代(下文簡稱YOLOv5),YOLOv5使用Leaky ReLU激活函數(shù),檢測層使用Sigmoid激活函數(shù)。YOLOv5提供了兩種優(yōu)化器,Adam和SGD,都預(yù)設(shè)了匹配的訓(xùn)練超參數(shù)。并且YOLOv5使用Pytorch框架,比上一代使用的Darknet框架更容易投入生產(chǎn)。
YOLOv5的架構(gòu)設(shè)計并不復(fù)雜,整體上維持了FPN的設(shè)計方式,F(xiàn)PN加強(qiáng)了重復(fù)迭代,兩次迭代的結(jié)構(gòu)稱為PAN。這個結(jié)構(gòu)還可以進(jìn)一步重復(fù),類似EfficientDet那樣演進(jìn)為BiFPN。backbone仍然是Darknet的形式,通過殘差結(jié)構(gòu)讓網(wǎng)絡(luò)加深。模型開始引入Focus的設(shè)計降低了resolution,也使得YOLOv5變得更加輕量。SPP模塊的引入進(jìn)一步融合了多尺度特征提取。并且YOLOv5還可以通過改變網(wǎng)絡(luò)深度參數(shù),控制網(wǎng)絡(luò)大小。

圖3 YOLOv5 結(jié)構(gòu)
在實際使用中,由于與實驗室環(huán)境存在差距,識別勢必會受到天氣、距離等因素的影響,并且隨著天氣或距離的變化,圖片中的目標(biāo)會越難識別,造成誤檢、漏檢的情況發(fā)生,影響生產(chǎn)安全,針對這類問題,我們提出了yolo-att結(jié)構(gòu),引入了注意力機(jī)制模塊,將其嵌入到算法當(dāng)中。
Squeeze-and-Excitation Networks(SENet)曾 贏 得ImageNet分類競賽的冠軍,其有效性得到了認(rèn)可,其提出的SE模塊構(gòu)思簡單,易于實現(xiàn),可以輕松加載到現(xiàn)有的網(wǎng)絡(luò)模型框架中。
一個SE模塊的過程分為Squeeze(壓縮)和Excitation(展開)兩個步驟:
Squeeze(壓縮):通過在特征圖上執(zhí)行全局池化,得到當(dāng)前Feature Map的全局壓縮特征量;我們定義統(tǒng)計變量z∈R,C是通過收縮U的空間維度H×W來生成的,這樣,z的第c個元素通過以下方式計算。
Excitation(展開):通過兩層全連接的bottleneck結(jié)構(gòu)得到特征圖中每個通道的權(quán)重,并將加權(quán)后的特征圖作為下一層網(wǎng)絡(luò)的輸入。
圖4是加入了SE模塊的yolov5s骨干結(jié)構(gòu)簡圖,其中SE模塊的輸入是上層C3的輸出。

圖4 改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)
在改進(jìn)了網(wǎng)絡(luò)結(jié)構(gòu)后,我們使用自己的數(shù)據(jù)集對于改進(jìn)前后的網(wǎng)絡(luò)進(jìn)行了測試(改進(jìn)前:yolov5s-baseline,改進(jìn)后yolov5s-attention),發(fā)現(xiàn)帶有SE模塊的YOLOv5s網(wǎng)絡(luò)的準(zhǔn)確率明顯高于改進(jìn)前的YOLOv5s,從93.7%提升至97.2%。

表2 結(jié)果表
本文針對當(dāng)下變電站中存在的多種缺陷,人工巡檢存在時效性差,存在誤檢、漏檢、錯檢等問題,提出了基于深度學(xué)習(xí)和計算機(jī)視覺的的變電站在線巡視方法,使用改進(jìn)后的卷積神經(jīng)網(wǎng)絡(luò)中的YOLOv5算法和Cascade rcnn算法,能夠大大提高缺陷識別的準(zhǔn)確性,降低誤檢、漏檢、錯檢的幾率。經(jīng)過實際測試,證明了文中方法的有效性。