律方成 牛雷雷 王勝輝 謝 慶 王子豪
(1. 新能源電力系統(tǒng)國(guó)家重點(diǎn)實(shí)驗(yàn)室(華北電力大學(xué)) 北京 102206 2. 河北省輸變電設(shè)備安全防御重點(diǎn)實(shí)驗(yàn)室(華北電力大學(xué)) 保定 071003)
絕緣子、金具等是電網(wǎng)輸變電設(shè)備的重要組成部分,及時(shí)掌握其絕緣水平和運(yùn)行狀態(tài)對(duì)電力系統(tǒng)的安全穩(wěn)定運(yùn)行至關(guān)重要[1]。目前電網(wǎng)主要采用的人工巡檢方式耗時(shí)費(fèi)力,且無法及時(shí)全面地掌握主要電氣設(shè)備的外絕緣狀態(tài)[2]。基于無人機(jī)和巡檢機(jī)器人搭載的可見光、紫外和紅外圖像信息是高壓設(shè)備熱、電參量非接觸檢測(cè)的重要手段和發(fā)展趨勢(shì),而絕緣子等主要電氣設(shè)備的識(shí)別是對(duì)其進(jìn)行綜合診斷以實(shí)現(xiàn)其絕緣狀態(tài)判別的基礎(chǔ)[3]。
實(shí)現(xiàn)絕緣子等高壓設(shè)備圖像識(shí)別思路主要有機(jī)器學(xué)習(xí)方式和深度學(xué)習(xí)方式。前者主要針對(duì)電氣設(shè)備的形狀和紋理特征進(jìn)行設(shè)計(jì),優(yōu)點(diǎn)為針對(duì)性強(qiáng)、特征具有可解釋性,缺點(diǎn)為檢測(cè)魯棒性差,對(duì)目標(biāo)的拍攝角度等要求較高[3];后者通過卷積算法自動(dòng)提取目標(biāo)抽象化特征,實(shí)現(xiàn)端到端圖像識(shí)別,其識(shí)別精度高,泛化能力好,識(shí)別速度快,但對(duì)樣本需求量大,可解釋性差[4]。隨著無人機(jī)和機(jī)器人巡檢方式的推廣,現(xiàn)場(chǎng)將產(chǎn)生大量高壓設(shè)備檢測(cè)視頻和圖片,基于此,本文采用了深度學(xué)習(xí)方式。
深度學(xué)習(xí)的概念是在由G. E. Hinton 等2006 年提出的非監(jiān)督貪心逐層訓(xùn)練算法的基礎(chǔ)上[5],融合了卷積計(jì)算、神經(jīng)網(wǎng)絡(luò)框架、下采樣和自動(dòng)提取及匹配網(wǎng)絡(luò)特征的端到端有監(jiān)督學(xué)習(xí)框架。常用的深度學(xué)習(xí)框架包括以LeNet,F(xiàn)aster R-CNN(Region-Convolution Neural Network),SSD(Single Shot MultiBox Detector)和YOLO(You Only Look Once)為代表的深度卷積神經(jīng)網(wǎng)絡(luò)及以長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM),GRU(Gated Recurrent Unit)為代表的循環(huán)卷積神經(jīng)網(wǎng)絡(luò)[6]等,其在電氣領(lǐng)域的應(yīng)用研究主要包括:①利用電力系統(tǒng)運(yùn)行數(shù)據(jù)實(shí)現(xiàn)其調(diào)度預(yù)測(cè)[7]、調(diào)度控制[8]、穩(wěn)定性評(píng)估[9]。例如:文獻(xiàn)[7]以100%消納光伏發(fā)電為前提,提出采用周期衰減學(xué)習(xí)率的改進(jìn)型深度確定性策略梯度算法(CDLR-DDPG)的光伏-抽水蓄能互補(bǔ)發(fā)電系統(tǒng)的實(shí)時(shí)智能調(diào)度方法。②利用計(jì)算機(jī)視覺、結(jié)構(gòu)化和非結(jié)構(gòu)化文本,實(shí)現(xiàn)電力系統(tǒng)和電氣設(shè)備狀態(tài)預(yù)測(cè)[10]、缺陷識(shí)別與故障診斷[11]、自然語言處理[12];例如:文獻(xiàn)[11]基于Faster R-CNN 算法對(duì)變壓器、套管等變電設(shè)備進(jìn)行目標(biāo)檢測(cè),基于溫度閾值判別法對(duì)設(shè)備區(qū)域進(jìn)行缺陷識(shí)別。檢測(cè)平均精度均值達(dá)到90.61%。文獻(xiàn)[13]提出了一種基于改進(jìn)LSTM 的短期高壓負(fù)荷電流預(yù)測(cè)方法。該模型在時(shí)間序列方面引入自循環(huán)權(quán)重,使細(xì)胞彼此循環(huán)連接,從而動(dòng)態(tài)改變時(shí)間尺度,進(jìn)而增強(qiáng)長(zhǎng)短期記憶功能。
對(duì)圖像識(shí)別主要采用深度卷積神經(jīng)網(wǎng)絡(luò)[4]。相比于Faster R-CNN,YOLO 在2015 年由美國(guó)華盛頓大學(xué)提出。同屬圖像識(shí)別state-of-art 檢測(cè)框架,YOLO 采用無候選區(qū)域的類別和坐標(biāo)one-stage 檢測(cè)思路,具有較高的識(shí)別準(zhǔn)確度和更高的識(shí)別速度[14],可實(shí)現(xiàn)對(duì)無人機(jī)和機(jī)器人巡檢產(chǎn)生的圖像的實(shí)時(shí)、整體識(shí)別。其在電力系統(tǒng)的應(yīng)用方面,文獻(xiàn)[15]采用YOLOv3 算法,通過調(diào)整學(xué)習(xí)率等超參數(shù),實(shí)現(xiàn)了模型的快速收斂,平均識(shí)別準(zhǔn)確率為88.7%,可結(jié)合紫外光路實(shí)現(xiàn)絕緣子的智能診斷。文獻(xiàn)[16]探究了隨機(jī)旋轉(zhuǎn)角度、飽和度、曝光度、色調(diào)等預(yù)處理紅外成像數(shù)據(jù),研究了基于YOLOv3 算法的絕緣子紅外圖像故障檢測(cè)方法。以上研究主要基于YOLOv3 或更早版本,關(guān)于網(wǎng)絡(luò)參數(shù)對(duì)訓(xùn)練誤差和識(shí)別準(zhǔn)確度的影響的研究較少。
為了對(duì)外絕緣設(shè)備的絕緣狀態(tài)進(jìn)行智能診斷,本文對(duì)YOLOv4 網(wǎng)絡(luò)框架進(jìn)行了研究,建立了絕緣子、均壓環(huán)、防振錘、套管和導(dǎo)線訓(xùn)練和測(cè)試數(shù)據(jù)庫(kù),研究了數(shù)據(jù)擴(kuò)充算法、錨框及其聚類中心對(duì)其訓(xùn)練和識(shí)別性能的影響。主要工作包括:采用表征訓(xùn)練誤差、識(shí)別準(zhǔn)確度和訓(xùn)練速度的系統(tǒng)性能評(píng)價(jià)體系,分析了YOLOv4 檢測(cè)框架及網(wǎng)絡(luò)框架,研究并改進(jìn)了 Mosaic 數(shù)據(jù)擴(kuò)充算法,研究了交并比(Intersection over Union, IoU)算法對(duì)不同尺度檢測(cè)目標(biāo)的邊界框預(yù)測(cè)有效性,以及自建數(shù)據(jù)庫(kù)的寬高數(shù)據(jù)標(biāo)注值聚類對(duì)檢測(cè)結(jié)果及其評(píng)價(jià)參數(shù)的影響,優(yōu)化了YOLOv4 的網(wǎng)絡(luò),提出基于IoU 和識(shí)別準(zhǔn)確度的網(wǎng)絡(luò)調(diào)參方法,最終較好地實(shí)現(xiàn)了主要電氣設(shè)備的識(shí)別。
YOLOv4 的其運(yùn)行檢測(cè)流程及網(wǎng)絡(luò)框架構(gòu)成如圖1 和圖2 所示。

圖1 One stage 檢測(cè)流程Fig.1 Inspection of one stage method

圖2 YOLOv4 網(wǎng)絡(luò)框架Fig.2 Network architecture of YOLOv4
首先,圖片被打包輸入骨架(Backbone)部分進(jìn)行卷積計(jì)算,Backbone 的卷積網(wǎng)絡(luò)以Darknet53為檢測(cè)框架,將圖片分辨率由416×416×3 卷積、下采樣至13×13×1 024。Backbone 網(wǎng)絡(luò)包含29 個(gè)卷積層堆疊而成的5 組NDC(dropout connect)單元,其網(wǎng)絡(luò)權(quán)重參數(shù)經(jīng)過了Imagenet 的預(yù)訓(xùn)練,是圖片特征提取的主體和性能良好的分類器,如圖1 和圖2 的Backbone 部分所示。
其次,進(jìn)入以空間金字塔池化(Spatial Pyramid Pooling, SPP)和路徑聚合網(wǎng)絡(luò)(Path Aggregation Network, PAN)為特征的Neck 框架,兩者可增加圖像訓(xùn)練和檢測(cè)過程中特征提取單元的感受視野,將不同通道數(shù)據(jù)進(jìn)行拼接(Concatenation),提取最重要的、不同路徑特征[14],經(jīng)過兩個(gè)上采樣單元形成26×26 和52×52 兩個(gè)分辨率,同Backbone 的13×13輸出,形成的三個(gè)不同尺度的中間檢測(cè)單元,如圖1 和圖2 的Neck 部分所示。
最后,將Neck 輸出的三種分辨率送入Head 部分,如圖1 和圖2 所示。作為類別和邊界框同時(shí)預(yù)測(cè)的one-stage 預(yù)測(cè)框架,Head 部分采用YOLOv3結(jié)構(gòu),進(jìn)行基于每個(gè)錨框產(chǎn)生多組輸出變量的高密度目標(biāo)檢測(cè)[14]:生成錨框并分別預(yù)測(cè)其類別和邊界框偏移量得到預(yù)測(cè)邊界框。訓(xùn)練過程中,利用預(yù)測(cè)值與真實(shí)值的IoU 進(jìn)行非極大值抑制,篩除無效預(yù)測(cè)邊界框,并給出優(yōu)化結(jié)果。
圖2 中,可將網(wǎng)絡(luò)的卷積單元由卷積計(jì)算C、批均一化U 和激活函數(shù)(mish、leaky RELU 和Linear)三部分組成,根據(jù)采用的激活函數(shù)不同可分為CUm、CUlr 和CUl 三類。
Backbone 采用CUm[17],mish 激活函數(shù)表達(dá)式為

兩個(gè)CUm 卷積單元通過Shortcut 層相加連接可構(gòu)成一個(gè)殘差單元RU,N個(gè)殘差單元經(jīng)過route層構(gòu)成組dropout connect 單元NDC。
中間框架采用leaky-RELU 作為激活函數(shù),其計(jì)算式為

網(wǎng)絡(luò)的出口處的卷積層采用Linear 函數(shù)y=x作為激活函數(shù),其作用是將網(wǎng)絡(luò)的輸出統(tǒng)一為T×T×255,其中T表示網(wǎng)絡(luò)的三個(gè)檢測(cè)尺度。
訓(xùn)練集中,將每一個(gè)錨框(anchor box)看作一個(gè)訓(xùn)練樣本,需要為其標(biāo)注錨框類別和錨框偏移量?jī)蓚€(gè)標(biāo)簽,而在測(cè)試階段順序?yàn)椋荷慑^框;預(yù)測(cè)每個(gè)錨框類別和偏移量;基于非極大值抑制篩選預(yù)測(cè)邊界框(bounding box)[18]。

圖 3 展示了錨框和真實(shí)邊界框的匹配標(biāo)注過程。在圖3 中,矩陣H中最大元素h23所在的行和列為i1=2,j1=3 ,則為將錨框2A標(biāo)注為3B,同時(shí),將H中第2 行、第3 列元素置零。繼續(xù)找出H中最大的元素h61所在的行和列i2=6,j2=1,將錨框6A標(biāo)注為1B,將H中第6 行、第1 列元素置零,依次找出h33和h84,并為對(duì)應(yīng)錨框標(biāo)注邊界框,接下來只需遍歷h14、h34、h54和h74并根據(jù)其IoU 值決定是否為剩余的錨框分配邊界框。

圖3 錨框與真實(shí)邊界框Fig.3 Anchor boxes and the bounding boxes
在訓(xùn)練過程中,錨框A被標(biāo)注為邊界框B,則將B的類別賦予A,假設(shè)A和B的中心坐標(biāo)、寬和高分別為(xa,ya,wa,ha)和(xb,yb,wb,hb),則A的偏移量計(jì)算公式為[18]

式中,Bgt表示真實(shí)標(biāo)注框,但I(xiàn)oU-loss 只在兩個(gè)邊界框有交叉時(shí)才有效,基于此,文獻(xiàn)[19]提出增加了懲罰項(xiàng)的GIoU-loss,即

式中,C為包含了B和Bgt的最小框。
當(dāng)B和Bgt位于水平或垂直位置時(shí),GIoU-loss依然具有很大的誤差,文獻(xiàn)[20]將重合面積、邊界框中心坐標(biāo)之間的距離和邊界框的寬高比加入懲罰項(xiàng),提出了DIoU-loss 和CIoU-loss,分別為

1.3.1 Cutmix
Cutmix[21]在Cutout[22]的基礎(chǔ)上進(jìn)行了改進(jìn),融合兩張圖片的特征,其計(jì)算式分別為

式中,M為二進(jìn)制0、1 矩陣;⊙表示從兩個(gè)圖像中刪除并填充的位置;λ為Beta(τ,τ)貝塔分布,τ為超參數(shù)。經(jīng)過Cutmix 擴(kuò)充處理前后的效果如圖4所示。

圖4 Cutmix 數(shù)據(jù)擴(kuò)充Fig. 4 Cutmix data augment
1.3.2 改進(jìn)Mosaic
Mosaic[14]在Cutmix 的基礎(chǔ)上,將融合的圖片特征數(shù)量增加為4 張,等效增加了訓(xùn)練批次的圖片數(shù)量,提高檢測(cè)性能。本文對(duì)Mosaic 進(jìn)行了改進(jìn),在圖像融合過程中加入基于Mixup[23]的背景虛化,改進(jìn)后的計(jì)算式為

式中,Mi分別為第i個(gè)二進(jìn)制0-1 矩陣,其并集為整張圖片(Σ∪Mi=Ω);μ、iλ為透明度調(diào)整系數(shù),服從貝塔分布。經(jīng)過改進(jìn)Mosaic 擴(kuò)充處理的數(shù)據(jù)效果如圖5 所示。

圖5 改進(jìn)Mosaic 數(shù)據(jù)擴(kuò)充Fig.5 Refined mosaic data augment
YOLOv4 采用K-means 聚類算法,基于VOC 數(shù)據(jù)庫(kù)進(jìn)行聚類中心數(shù)量為9 的label 寬高比聚類。K-means 是迭代求解的聚類分析算法,其步驟為:首先將數(shù)據(jù)分為k組并隨機(jī)選取初始聚類中心;其次,計(jì)算每個(gè)數(shù)據(jù)點(diǎn)與各聚類中心之間的距離,并將其分配給距離最近的聚類中心所在的組[24]。優(yōu)化迭代因子為

式中,xn為數(shù)據(jù)點(diǎn);n為數(shù)據(jù)點(diǎn)個(gè)數(shù);rnk在數(shù)據(jù)點(diǎn)xn被歸類到組k時(shí)為1,否則為0;μk為歸類到組別k中的數(shù)據(jù)點(diǎn)的平均值。
為對(duì)比分析K-means 聚類和可指定聚類中心的其他聚類方法的聚類效果,研究錨框聚類結(jié)果對(duì)網(wǎng)絡(luò)性能的影響,并從整體上評(píng)價(jià)兩者的檢測(cè)表現(xiàn),本文引入了分層聚類算法。分層聚類以樹形結(jié)構(gòu)在不同層次上對(duì)數(shù)據(jù)集進(jìn)行自下而上的劃分,其步驟為:首先將每個(gè)樣本看作初始聚類簇;其次通過計(jì)算集合間的豪斯多夫距離,將距離較近的聚類簇合并;最終得到預(yù)設(shè)的聚類個(gè)數(shù)[24]。
圖6 展示了標(biāo)注樣本的寬高原始數(shù)據(jù)及其聚類數(shù)據(jù)。圖6a 為樣本的原始寬高數(shù)據(jù),不同顏色代表了不同高壓設(shè)備類別。基于自建數(shù)據(jù)庫(kù),K-means 的K值和分層聚類簇群數(shù)均設(shè)為5。圖6b 為K-means聚類效果,算法以點(diǎn)到聚類中心的距離為分類標(biāo)準(zhǔn),5 個(gè)聚類中心近似沿直線y=x軸對(duì)稱分布;圖6c 為5 類聚類樹狀圖,可看出簇類層次,如當(dāng)簇群數(shù)為3時(shí),原簇類沿樹狀圖合并為A、B 和C 三個(gè)新簇群;圖6d 為分層聚類效果,算法以簇類之間的距離為分類標(biāo)準(zhǔn),除簇類1 和簇類5,其余簇類的分布與Kmeans 基本相同,聚類中心分布沒有明顯的規(guī)律。


圖6 數(shù)據(jù)標(biāo)簽及其聚類Fig.6 Label and cluster
以 Linux 系統(tǒng)下的 darknet 平臺(tái)搭建了基于YOLOv4 的深度學(xué)習(xí)網(wǎng)絡(luò)框架。訓(xùn)練服務(wù)器GPU 為Nvidia Quadro P600,CPU 為Intel silver 4210,訓(xùn)練集為在實(shí)驗(yàn)室和現(xiàn)場(chǎng)拍攝得到的絕緣子、均壓環(huán)、防振錘、導(dǎo)線和套管五類圖片2 800 張,測(cè)試集200張,每個(gè)類別的圖片各占20%,部分訓(xùn)練集數(shù)據(jù)庫(kù)如圖7 所示。

圖7 訓(xùn)練集數(shù)據(jù)庫(kù)Fig.7 Train database
采用lableimg 標(biāo)注訓(xùn)練集,生成包含電氣設(shè)備類別、尺寸、位置信息的.xml 文件,再將其轉(zhuǎn)換為包含中心坐標(biāo)(x,y)和(w,h)偏置的.txt 標(biāo)注文本[14]。
實(shí)驗(yàn)過程中,網(wǎng)絡(luò)的迭代次數(shù)為8 000 次,采用YOLOv4 默認(rèn)參數(shù)作為基準(zhǔn)組,每次訓(xùn)練只改變一個(gè)超參數(shù)變量,研究變量包括數(shù)據(jù)增強(qiáng)算法(Cutmix、Mosaic 和改進(jìn)Mosaic)、IoU(CIoU,GIoU和DIoU)、anchor 聚類中心個(gè)數(shù)(5、9 和YOLOv4)和聚類函數(shù)類型。
系統(tǒng)性能評(píng)價(jià)體系可表征訓(xùn)練誤差、識(shí)別準(zhǔn)確度和訓(xùn)練速度。采用avgLoss 和IoU 來表示系統(tǒng)訓(xùn)練的評(píng)價(jià)指標(biāo),采用真正例(True Positive, TP)、假正例(False Positive, FP)、假負(fù)例(False Negative,FN)作為網(wǎng)絡(luò)的識(shí)別指標(biāo),其中TP 值越高,F(xiàn)P 和FN 值越小,網(wǎng)絡(luò)的優(yōu)化效果越好[24]。采用準(zhǔn)確率(Precision), 平均準(zhǔn)確率均值(mean average precision, mAP)和召回率(Recall)指標(biāo)來表征系統(tǒng)檢測(cè)準(zhǔn)確性和魯棒性,使用F1來度量網(wǎng)絡(luò)的識(shí)別準(zhǔn)確度與召回率均衡時(shí)的網(wǎng)絡(luò)得分,即

式中,P和R分別為準(zhǔn)確率和召回率。
將訓(xùn)練過程中每次迭代所需時(shí)間定義為 Avgspeed,單位為s,表征網(wǎng)絡(luò)迭代速度。
圖8 對(duì)比分析了Cutmix、Mosaic 和改進(jìn)Mosaic數(shù)據(jù)增強(qiáng)方法對(duì)網(wǎng)絡(luò)參數(shù)的影響。圖9 展示了不同算法的平均網(wǎng)絡(luò)損失與檢測(cè)準(zhǔn)確度和迭代次數(shù)的關(guān)系。

圖8 數(shù)據(jù)增強(qiáng)方法與識(shí)別結(jié)果Fig.8 Data augment and detection results

圖9 數(shù)據(jù)增強(qiáng)方法與損失準(zhǔn)確度Fig.9 Data augment and network loss detection results
圖8 中,在具有較低的FN 值的同時(shí),改進(jìn)Mosaic 的TP 表現(xiàn)明顯高于Mosaic 和Cutmix,說明在相同訓(xùn)練條件下,采用改進(jìn)Mosaic 數(shù)據(jù)擴(kuò)充方式能夠得到更高的Recall 和網(wǎng)絡(luò)識(shí)別準(zhǔn)確度;對(duì)比而言,改進(jìn)Mosaic 和Cutmix 具有更小的FP 值。
因增加了融合圖片數(shù)量,對(duì)比Cutmix,Mosaic和改進(jìn)Mosaic 具有更好的網(wǎng)絡(luò)性能,而改進(jìn)Mosaic加入了模糊處理的原始尺寸圖像,解決了的Mosaic FP 值較高的問題。
圖9 中,平均損失(avgLoss)隨著訓(xùn)練批次的增加而降低。相比而言,采用了Cutmix 的模型損失(loss)最小(0.185),7 000 次迭代之后的改進(jìn)Mosaic模型的loss 減小到與前者相當(dāng)(0.302),而Mosaic模型的loss 最大(1.011)。mAP 在訓(xùn)練過程中上下波動(dòng),但總體隨訓(xùn)練批次增加而增加,其中,Cutmix的模型識(shí)別準(zhǔn)確度最低(82.3%),相比于Mosaic 模型,改進(jìn)Mosaic 模型的平均識(shí)別準(zhǔn)確度提高了2%。其原因在于,Cutmix 算法主要對(duì)圖片進(jìn)行切割和嵌入,在不改變訓(xùn)練集圖片分辨率的情況下降低了網(wǎng)絡(luò)訓(xùn)練誤差,但也因圖片的嵌入降低了網(wǎng)絡(luò)的識(shí)別準(zhǔn)確度。Mosaic 算法將4 張訓(xùn)練集圖片融合,等效增加每次訓(xùn)練圖片數(shù)量,但減小了訓(xùn)練集圖片的分辨率。改進(jìn)Mosaic 在Mosaic 的基礎(chǔ)上增加了Mixup的思想,在擴(kuò)充數(shù)據(jù)集的基礎(chǔ)上保持訓(xùn)練集的分辨率,相比于Mosaic,在相同迭代次數(shù)下的網(wǎng)絡(luò)誤差降低了約70%,識(shí)別準(zhǔn)確度提高了2%。
IoU 是基于錨框和邊界框回歸算法的目標(biāo)定位算法。圖10 展示了網(wǎng)絡(luò)采用不同IoU 算法時(shí),訓(xùn)練批次(epoch)、平均網(wǎng)絡(luò)損失(avg Loss)和學(xué)習(xí)率(learning rate)的變化曲線。


圖10 不同IoU 的誤差變化曲線Fig.10 Average loss of different IoU
在圖10a 中,網(wǎng)絡(luò)前300 次迭代訓(xùn)練采用的學(xué)習(xí)率逐漸增大,采用CIoU、DIoU 和GIoU 算法的網(wǎng)絡(luò),其訓(xùn)練誤差首次小于10 所需的訓(xùn)練次數(shù)分別為188、212 和174。迭代訓(xùn)練前期,GIoU 算法的網(wǎng)絡(luò)誤差起始值小(1 775),收斂速度較快。
在圖10b 中,網(wǎng)絡(luò)的300~4 000 次迭代學(xué)習(xí)率為0.001 3。每迭代50 次,對(duì)CIoU、DIoU 和GIoU的網(wǎng)絡(luò)誤差值進(jìn)行采樣。在75 次采樣中,其網(wǎng)絡(luò)誤差值為三者中最小的次數(shù)分別為28、14 和33,表明在迭代過程中,GIoU 整體表現(xiàn)較優(yōu)。而在3 500迭代之后,CIoU 網(wǎng)絡(luò)的訓(xùn)練誤差均為最小,整體來看,CIoU 的效果較好。
圖11 展示了網(wǎng)絡(luò)采用CIoU、DIoU 和GIoU 時(shí),在相同測(cè)試集上的識(shí)別準(zhǔn)確度曲線。
圖11a 中,網(wǎng)絡(luò)mAP 隨著迭代次數(shù)的增加而變化,整體呈提高趨勢(shì)。采用CIoU、DIoU 和GIoU 算法網(wǎng)絡(luò)的平均識(shí)別準(zhǔn)確度標(biāo)準(zhǔn)差分別為 3.407、4.334 和4.722,CIoU 波動(dòng)幅度較小,GIoU 網(wǎng)絡(luò)具有mAP 最大值94.51%。



圖11 不同IoU 的識(shí)別準(zhǔn)確度曲線Fig.11 Average precision of different IoU
圖11b~圖11f 分別為絕緣子、導(dǎo)線、均壓環(huán)、防振錘和套管五種電氣設(shè)備的 IoU-50%識(shí)別準(zhǔn)確度,CIoU 網(wǎng)絡(luò)在絕緣子、防振錘和套管識(shí)別方面識(shí)別效果較好,而在如均壓環(huán)的小目標(biāo)識(shí)別上,GIoU網(wǎng)絡(luò)的識(shí)別效果較好。表1 展示了采用不同IoU 算法識(shí)別的網(wǎng)絡(luò)參數(shù)。

表1 檢測(cè)準(zhǔn)確性表Tab.1 Detection parameters of different IoU
從表1 中可以看出,采用CIoU 網(wǎng)絡(luò)在識(shí)別準(zhǔn)確度、召回率、F1得分和平均IoU 上具有較大優(yōu)勢(shì),這得益于 CIoU 在錨框歸類的訓(xùn)練過程中將傳統(tǒng)IoU、中心坐標(biāo)和寬高比作為最優(yōu)化目標(biāo),使網(wǎng)絡(luò)預(yù)測(cè)錨框更接近真實(shí)標(biāo)注框。與此同時(shí),DIoU 的網(wǎng)絡(luò)訓(xùn)練速度最快,Avg-speed 為7.98s,這是因?yàn)镃IoU和GIoU 網(wǎng)絡(luò)增大了計(jì)算開銷,降低了迭代的速度。
基于自建的五種主要電力設(shè)備圖像數(shù)據(jù)庫(kù)和K-means 與分層聚類算法,本文計(jì)算得到了label 寬高數(shù)據(jù)聚類中心坐標(biāo),圖12 展示了不同聚類中心屬性對(duì)網(wǎng)絡(luò)訓(xùn)練和識(shí)別相關(guān)參數(shù)的影響。
圖12a~圖12d 中K=9 時(shí)的K-means 聚類中心的網(wǎng)絡(luò)參數(shù)較YOLOv4 變差,原因是相比于VOC,自建數(shù)據(jù)庫(kù)的類別和樣本量較少。聚類中心K=5 時(shí),網(wǎng)絡(luò)Precision 和平均IoU 值與YOLOv4 的默認(rèn)參數(shù)基本持平,但兩者的標(biāo)準(zhǔn)差分別降低減至0.029 和5.44,優(yōu)于 YOLOv4 情況。當(dāng)網(wǎng)絡(luò)迭代次數(shù)大于3 500 時(shí),最優(yōu)mAP 和召回率參數(shù)分別為94.37%和98%,雖波動(dòng)較大,但最優(yōu)結(jié)果比YOLOv4 的默認(rèn)參數(shù)分別提高了0.3%和1%。

圖12 不同label 寬高數(shù)據(jù)聚類的網(wǎng)絡(luò)特性Fig.12 Network performance of label w-h data clusters
采用分層聚類的總體系統(tǒng)性能評(píng)價(jià)參數(shù)除mAP 外,IoU、召回率和識(shí)別準(zhǔn)確率與K=9 時(shí)的Kmeans 聚類方法表現(xiàn)相當(dāng)。其原因是K-means 分類是基于歐氏距離,各個(gè)聚類中心相互獨(dú)立;而分層聚類基于簇類集合之間的距離逐級(jí)合并,簇類越少,聚類中心與簇內(nèi)各點(diǎn)之間距離的波動(dòng)越大,而導(dǎo)致網(wǎng)絡(luò)提取五種設(shè)備特征的能力變差。
圖13 展示了不同label 寬高數(shù)據(jù)聚類中心對(duì)網(wǎng)絡(luò)訓(xùn)練誤差和識(shí)別準(zhǔn)確度的影響。

圖13 不同label 寬高數(shù)據(jù)聚類中心的網(wǎng)絡(luò)特性Fig.13 Loss-precision characteristic of different label w-h cluster algrithom
圖13 中,采用K-means 算法且K=5、K=9 時(shí),平均網(wǎng)絡(luò)損失avg Loss 最小值相比于YOLOv4 分別減小了3%和4%。同時(shí),K=5 時(shí)網(wǎng)絡(luò)的識(shí)別Precision平均值為89.61%,相比于YOLOv4 提高了0.8%。原因是基于自建數(shù)據(jù)庫(kù)聚類錨框進(jìn)行訓(xùn)練時(shí),網(wǎng)絡(luò)的初始化和優(yōu)化更加貼合原始標(biāo)注數(shù)據(jù),訓(xùn)練誤差更小,識(shí)別準(zhǔn)確度更高。
采用分層聚類算法且層數(shù)為5 時(shí),網(wǎng)絡(luò)avgLoss相比于 YOLOv4 減小了 73%,但網(wǎng)絡(luò)的識(shí)別Precision 表現(xiàn)與K=9(K-means)相近,其原因在于,分層聚類的分類標(biāo)準(zhǔn)基于集合距離,導(dǎo)致較多電氣設(shè)備圖片聚類類別與實(shí)際類別不同,因此網(wǎng)絡(luò)剔除了分類錯(cuò)誤的圖片而降低了損失函數(shù),以降低網(wǎng)絡(luò)的召回率的代價(jià)保持Precision 基本穩(wěn)定。
表2 展示了基于不同聚類錨框?qū)W(wǎng)絡(luò)訓(xùn)練和識(shí)別性能的影響。
由表2 可知,采用K-means 算法且聚類中心個(gè)數(shù)K=5、K=9 時(shí),網(wǎng)絡(luò)的F1-score 較高,說明自建數(shù)據(jù)庫(kù)的K-means 聚類在識(shí)別準(zhǔn)確度和召回率均衡度上優(yōu)于分層聚類和YOLOv4 默認(rèn)參數(shù)。K=5 時(shí),網(wǎng)絡(luò)的最高召回率和準(zhǔn)確率更高,各方面表現(xiàn)較為均衡。當(dāng)分層聚類層數(shù)為5 時(shí),以犧牲召回率的代價(jià)提高了系統(tǒng)損失和IoU 的總體表現(xiàn),且檢測(cè)速度較快。

表2 label 寬高數(shù)據(jù)聚類對(duì)網(wǎng)絡(luò)性能的影響Tab.2 The influence of label w-h cluster on network performance
分層聚類網(wǎng)絡(luò)的訓(xùn)練速度高于YOLOv4,其原因是分層聚類網(wǎng)絡(luò)的召回率最低,等效于減少了每張圖片中網(wǎng)絡(luò)的目標(biāo)數(shù)量,降低了計(jì)算復(fù)雜度。Kmeans 聚類算法訓(xùn)練速度低于YOLOv4 的原因除較高召回率之外,還包括因VOC 數(shù)據(jù)庫(kù)預(yù)訓(xùn)練的權(quán)重?cái)?shù)據(jù)與自建數(shù)據(jù)庫(kù)數(shù)據(jù)結(jié)構(gòu)不一致而增加的計(jì)算開銷。
基于以上研究,本文采用了改進(jìn)Mosaic 數(shù)據(jù)增強(qiáng)算法對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行數(shù)據(jù)擴(kuò)展;針對(duì)均壓環(huán)和防振錘小目標(biāo)的檢測(cè),采用GIoU-loss 作為IoU 分類函數(shù),而對(duì)于絕緣子等較大檢測(cè)目標(biāo),則采用CIoU 作為分類函數(shù);基于自建數(shù)據(jù)庫(kù),采用K=5 的K-means 算法訓(xùn)練獲得標(biāo)注值寬高數(shù)據(jù)聚類中心,最終實(shí)現(xiàn)的主要電氣設(shè)備識(shí)別效果如圖14 所示。

圖14 優(yōu)化后網(wǎng)絡(luò)的識(shí)別效果Fig.14 Detection results of the network after optimize
本文基于YOLOv4,搭建了五種主要電氣設(shè)備識(shí)別平臺(tái),提出了網(wǎng)絡(luò)的改進(jìn)方法,并對(duì)其調(diào)參方法進(jìn)行了研究。主要結(jié)論如下:
1)對(duì)數(shù)據(jù)擴(kuò)充算法進(jìn)行了改進(jìn),優(yōu)化后的網(wǎng)絡(luò)訓(xùn)練誤差由1.011 降低到了0.302,識(shí)別平均識(shí)別準(zhǔn)確率提高了2%。
2)研究并分析了CIoU 和GIoU 方法在訓(xùn)練和識(shí)別大目標(biāo)和小目標(biāo)中的優(yōu)劣勢(shì),對(duì)均壓環(huán)和防振錘等相對(duì)較小目標(biāo)采用了GIoU 的優(yōu)化方法,使其平均識(shí)別準(zhǔn)確率提高了3%。
3)提出了基于自建數(shù)據(jù)庫(kù)識(shí)別類別和label 寬高數(shù)據(jù)的聚類思路,經(jīng)過優(yōu)化后的網(wǎng)絡(luò)識(shí)別準(zhǔn)確度提高了0.8%,訓(xùn)練誤差減小了3%。
經(jīng)過優(yōu)化和參數(shù)調(diào)優(yōu),較好地實(shí)現(xiàn)了主要電氣設(shè)備的識(shí)別。可用于基于無人機(jī)和巡檢機(jī)器人搭載的多光譜成像檢測(cè)。