張 雷,呂一仕,楊 佳,徐忠峰,徐光平,3
(1.河北大唐國際王灘發電有限責任公司,河北唐山 063611;2.蘇州熱工研究院有限公司,江蘇蘇州 215043;3.北京中安吉泰科技有限公司,北京 100029)
機器視覺是由圖像處理、機械工程、點光源照明、傳感器和計算機軟硬件等技術組成。在一些危險的作業環境中,用機器人搭載攝像頭等圖像采集裝置采集作業環境的圖像信息,用圖像處理技術進行信息提取,做出各種檢測和判斷,可以在很大程度上代替人工,大大提高檢測的效率和自動化水平。
機器視覺的發展速度很快,也越來越成熟,已經應用到了各個行業中,最為廣泛的應用是缺陷檢測,可以減少人力投入,提高檢測精度。
本文主要針對深度學習算法對水冷壁缺陷宏觀檢測展開研究,利用攝像頭近距離采集水冷壁各種數據,將圖片數據進行相應的處理分析,完成對鍋爐水冷壁的檢測工作,最終可以代替人完成檢測任務,降低火電廠鍋爐維護檢測費用以及人員安全風險。
計算機的性能提升越來越快,變得越來越智能,在目前的大數據時代,AI(Artificial Intelligence,人工智能)是一個很具研究課題的領域,并且出現了很多優秀的AI 企業,從而使人工智能與我們的生活越來越密切。
作為人工智能的一個分支,機器學習是通過算法讓機器從歷史數據中學習潛在的規律。但是,由于機器學習需要特征,選取特征費時費力,有時候還會選取到不合適的特征。深度學習可以解決這個問題,它不需要人參與特征選取的過程。
Facebook 在DeepFace 項目中,人臉識別的準確率達到了97%以上,說明深度學習在圖像識別方面具有優勢。深度學習算法不斷優化使深度學習不斷發展。
YOLOv5 提供了5 個版本的目標檢測網絡:YOLOv5n、YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x。
YOLOv5 的網絡結構分4 個模塊:輸入端、Backbone、Neck、Prediction。
(1)輸入端對圖像進行預處理,采用Mosaic 數據增強、自適應圖片縮放、自適應錨定框計算方法。
(2)Backbone 增加了Focus 結構和CSP 結構,其中Focus 結構用來做切片操作。
(3)Neck 采用FPN+PAN 結構,Neck 結構中的CSP2_X 結構增強了網絡特征融合。
(4)Prediction 使用GIOU_Loss 函數做Bounding Box 的損失函數。YOLOv5 網絡模型檢測速度非常快,每幅圖像的推理時間只需要0.007 s,達到了140 FPS。
YOLOv5 網絡輸入端采用Mosaic 數據增強,增加了網絡的魯棒性和檢測數據集的多樣性。采用自適應錨框方法和自適應圖片縮放方式,有效提升檢測精度和檢測速度。主干網絡采用Focus 結構和CSP 網絡,Focus 結構的切片操作可以很好的提取特征圖,CSP 網絡可以增強網絡的學習能力,減少模型參數的同時還可以保證檢測的準確性,降低計算成本。Neck 網絡主要采用了SPP 模塊和FPN+PAN,主要是更充分地提取融合特征,在Backbone 和輸出端中插入Neck 層。SPP 網絡使用不同尺度最大池化,再將得到不同尺度的特征圖Concat 的操作。在輸出端Bounding box 損失函數為GIOU_Loss,可以提升預測框回歸的速度和精度。采用DIOU_NMS(非極大值抑制)的方式,可以提升重疊目標框的檢測效果。
圖1 為不同版本的YOLOv5 與EfficientDet 檢測算法之間的性能比較曲線。橫軸表示的是該算法在GPU 上面的推理時間(ms/img),該數值越小越好;縱軸表示的是該算法在COCO 測試數據集上面的AP 指標,該數值越大越好。

圖1 性能比較曲線
通過觀察可以得出以下的初步結論:
(1)與EfficientDet0 相比,YOLOv5s 不僅可以獲得更高的AP指標,而且可以獲得更快的推理速度。
(2)與EfficientDet4 相比,YOLOv5x 不僅能夠獲得更高的AP指標,其推理速度是它的1/5 左右。
圖2 為不同版本的YOLOv5 檢測算法在COCO2017 驗證集與測試集上面的各項指標,具體包括:模型輸入大小、AP50指標、Speed、FPS、params 與GFLOPS。

圖2 算法指標
1.準確率:所有預測為正樣本的結果中,預測正確的比率。
Precision=TP/(TP+FP)
2.所有正樣本中被正確預測的比率。
Recall=TP/(TP+FN)
3.PR 曲線
以Recall 為橫坐標,Precision 為縱坐標組成的曲線
4.mAP@0.5
TP:IoU>0.5 的檢測框數量(同一GT 只計算一次)
FP:IoU<=0.5 的檢測框數量,或檢測到同一個GT 的多余檢測框的數量
因此,Precision 和Recall 可以表示為:
Precision=TP/all detection boxes
Recall=TP/all ground truths
5.mAP@0.5:0.95 表示在不同IOU 閾值(從0.5 到0.95,步長0.05)上的平均mA。
(0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)
(1)數據來源。采用機器人搭載的攝像頭對水冷壁表面進行視頻圖像采集。
(2)數據標注。標注工具采用LabelImg,標注工具快捷鍵比較多,大大的提高標注效率。標注信息為目標框坐標和類別,可以在一張圖像上標注多個目標,保存的標注信息為txt 文件。
(3)數據集劃分。目標檢測訓練集共有1500 張圖像,存在缺陷作為檢測目標,按照8:2 的比例劃分訓練集和驗證集。
(4)數據集優化。由于前期缺陷目標特征學習的不夠,在優化前的鍋爐水冷壁管缺陷目標檢測數據集上訓練算法模型mAP 在75%左右。通過制定標注的規范,優化數據集,最終在鍋爐水冷壁管缺陷目標檢測數據集上訓練的算法模型的mAP 達到93%左右。
(5)數據增強。采用Mosaic、旋轉、縮放、翻轉、顏色變化、灰度化和裁剪等數據增強方法對訓練數據進行數據擴充。
(6)數據標注規范:①參考PASCAL VOC 數據集標注規范標注;②只保留清晰度高、目標清晰的圖像;③去掉相似圖像。
(7)訓練過程。采用PyTorch 深度學習框架訓練算法模型。采用遷移學習的方法,減少模型訓練時間和增強模型檢測性能。對輸入圖像采用旋轉、縮放、翻轉、顏色變化、灰度化、裁剪和Mosaic 數據增強的方法進行數據擴充。訓練時,設置的迭代次數為300 次,選擇準確率最高的一次迭代作為實驗結果。
1.3.1 準確率曲線
圖3 為準確率和置信度的關系,x 軸為置信度,y軸為準確率。設置置信度為某一數值時各個類別識別的準確率。可以看到,置信度越大時類別檢測的越準確。這也很好理解,只有Confidence 很大,才被判斷是某一類別。但也很好想到,這樣的話,會漏檢一些置信度低的類別。實驗結果曲線符合預期。

圖3 準確率和置信度的關系
1.3.2 召回率曲線
圖4 為召回率和置信度之間的關系,x 軸為置信度,y 軸為召回率。設置置信度為某一數值時,各個類別查全的概率。可以看到,置信度越小時類別檢測的越全面。

圖4 召回率和置信度的關系
1.3.3 P—R 曲線
圖5 為P—R 曲線,其中:P 代表precision(精準率),R 代表Recall(召回率),P—R 曲線代表精準率與召回率的關系,一般情況下,將Recall 設置為橫坐標,Precision 設置為縱坐標。從曲線中可以看到mAP@0.5 準確率達到0.932,實驗效果還是可以的,擴充訓練集數量和標簽數量,提高數據集質量,模型性能還會有所提升。

圖5 P—R 曲線
1.3.4 各項指標
圖6 提供了模型性能的一些其他指標。定位損失box_loss:預測框與標定框之間的誤差(GIOU);置信度損失obj_loss:計算網絡的置信度;分類損失cls_loss:計算錨框與對應的標定分類是否正確;準確率Precision:精度(找對的正類/所有找到的正類);Recall:真實為Positive 的準確率,即正樣本有多少被找出來(召回了多少);mAP@0.5:0.95:表示不同IOU 閾值(從0.5 到0.95,步長0.05)(0.5、0.55、0.6、0.65、0.7、0.75、0.8、0.85、0.9、0.95)上的平均mAP;mAP@0.5:表示閾值大于0.5的平均mAP。

圖6 模型性能其他指標
從圖7、圖8 檢測結果可以看出,模型對水冷壁缺陷的識別效果還是不錯的,基本上能按照標注的內容識別出來,符合預期的效果。

圖7 檢測結果1

圖8 檢測結果2
本文建立的鍋爐水冷壁管數據集缺陷類別和檢測目標類別較少,且缺陷類別和缺陷目標分布不均衡。未來可以不斷地對這兩個數據集進行擴充,建立鍋爐水冷壁管缺陷數據公開的數據集。
本文鍋爐水冷壁管缺陷自動分類識別和檢測模型的建立都是采用遷移學習的方法,通過數據增強的方式,在建立的數據集上訓練現有的深度學習網絡獲得自動分類識別和檢測模型。可以隨著數據集的增加,優化特征提取網絡,獲得性能更好的鍋爐水冷壁管缺陷分類識別和檢測模型。
對常見的鍋爐水冷壁管檢測目標進行分級,將比較容易發生缺陷的區域檢測出來進行分級處理,達到危險等級的范圍做出預警,由專業的檢修人員復核判斷是否需要維護處理。
本文提出并且實現了鍋爐水冷壁管缺陷目標自動檢測的方法,構建了鍋爐水冷壁管缺陷目標檢測數據集,然后基于深度學習的方法建立了缺陷目標檢測模型。在算法模型選擇方面,采用遷移學習的方法對YOLOv5 網絡訓練模型進行實驗。采用了數據增強,進行數據擴充。學習率lr 設為0.005,展開迭代次數為300 輪的模型訓練,獲得在鍋爐水冷壁管數據上的最佳缺陷目標檢測模型。通過實驗數據表明,YOLOv5 算法對本文構建的鍋爐水冷壁管缺陷目標特征學習的很充分,檢測速度最快,IOU 為0.5,mAP 精度為97%,IOU=0.5:0.95 的值,mAP精度為76.3%。這一研究為鍋爐水冷壁管缺陷目標自動檢測提供了新的方法,可以提升鍋爐機組水冷壁管自動化、高效化和智能化的檢測水平,減少電廠鍋爐機組的非停時間,提高電廠的經濟效益。