裴傳福,崔凱,成功
(華能沁北發電有限責任公司,河南 濟源 459000)
目前,在我國由鐵路運輸的煤炭,需要將車廂部分,經由整套翻車設備將車廂內礦料倒入指定工位,早在20世紀50 年代我國就已經將成套的翻車設備投入使用,但是受技術的限制,翻車系統的各個部分未實現有效連接,效率低下。至今,在不斷的改良與進步中,國內廠家設計開發“C”型單車、雙車翻車機等改良型設備,實現了翻車機系統部分的連鎖作業,其作業效率、穩定性、安全性都顯著提升。
但是,在當下的大部分鐵路運輸設備中,人工實現摘鉤復鉤等作業任務仍然是必須的,人工摘鉤存在多種弊端:摘鉤工作接連不斷,長時間工作帶來的精力消耗,且摘鉤工作需要在與列車同步時進行,不僅影響效率而且存在危險;人工作業受現場天氣、光線等環境的影響;翻車機卸料設備的粉塵污染,造成的職業健康問題(圖1)。

圖1 火車摘鉤作業現場
華能沁北發電有限責任公司位于河南省濟源市五龍口鎮境內,北倚太行山,南臨沁河,距濟源市區17 公里。電廠發電機組裝機容量4×600MW+2×1000MW,是國家計委確定的首批超臨界國產化依托項目、國家“十五”規劃的重點工程,于2004 年投產發電。
華能沁北發電有限責任公司火車來煤卸車有兩臺單翻和一臺雙翻三套翻車機接卸系統,位于儲煤場的南部,翻車工藝采用流水線設計,火車煤接卸作業流程中運行設備包括撥車機、翻車機、推車機、牽車臺、帶式輸送機、帶式給煤機、活化給煤機、斗輪機等,最后通過兩條膠帶機運輸線以及斗輪機將煤運送到煤場內存放。
為更充分、更高效地利用翻車機系統及工作人員的職業健康,華能沁北發電有限責任公司計劃選擇一套翻車機系統,通過研發、安裝、調試等工作,實現一套自動摘鉤、正鉤、復鉤機器人與翻車機自動連鎖作業,希冀實現單套翻車機全自動作業。在諸多的技術難題中,對列車車廂的車鉤進行高效、準確的追蹤與識別是首要解決的問題。
深度學習是指具有多個處理層次的多個數據表達的模型,它們的出現極大地提高了語言識別、視覺識別等技術的發展。深度學習是通過正向與反向傳播進行參數確定,從而發現數據中的重要結構特征。
深度學習的普遍定義為一種利用多層非線性結構,通過有監督或者無監督的特征變換與提取,進行模式分析與分類的模型方法。它的運作原理是先于計算機輸入初始數據,經神經網絡檢測、提取和分類其中包含的各類特征。該方法有著多個用于處理數據的網絡層級,能夠通過簡單、非線性的處理方式來擬合,每個級別將上一個級別所輸出的特征處理成一個更具有高維特征、更抽象的輸出結果。有了層層的網絡層級和各個層級的對應輸出,我們就可以用它來進行更準確的學習,更深層次的擬合處理,能進行高效、高精度、工作量龐大的分類任務(圖2)。

圖2 傳統神經網絡(左)和深度學習模型(右)
摘鉤自動化系統中的目標捕捉技術應該實現兩大問題:一是判斷列車車鉤的位置和狀態;二是能夠在各種環境下準確的分割出列車車鉤。針對實際使用情況與本次所規劃系統之中任務目標,目標捕捉部分應具有以下功能。
(1)精確檢測多類型多狀態車鉤手柄。車鉤手柄受工作環境影響形狀各異,由于不同形狀摘鉤方式或有區分,因此準確判斷車鉤手柄類型即當前狀態是實現準確摘鉤的必要條件。現實中通過提拉車鉤手柄解鎖車鉤,對手柄的位置精度要求較高,檢測系統還需要精確分割出車鉤輪廓。
(2)適應復雜的環境。車鉤手柄處于兩節車廂之前,且可能有粉塵影響、光線較差,周圍有各種零部件且與車鉤手柄顏色相近,以上成為了獲取車鉤手柄信息時的干擾因素。編組站通常為露天,光線及天氣等外部環境會影響圖像質量。因此,目標捕捉系統應能在各種干擾環境下保證穩定性。
針對翻車機車鉤改進后的YOLO-V2 模型的車鉤識別算法,該算法通過改進K-means 聚類算法選擇最佳車鉤手柄和手柄基座的候選框長寬和數量,完成ancher預設,然后利用獲得的ancher 預設訓練神經網絡模型。相較于傳統的RCNN 算法,YOLO-V2 算法的計算速度大大提升,又相較于YOLO-V1,YOLO-V2 在目標定位的準確率和召回率有明顯的改善。通過不斷調整YOLO-V2 模型中的網絡深度和卷積層以得到更有效的各類車鉤特征,然后利用改進后的YOLO-V2 算法在目標訓練集上不斷迭代更新,獲得到最優權重,不斷提高訓練所得模型的效果,輸入圖片、視頻進行識別效果檢測,輸出車鉤檢測結果,判斷其識別結果的正確性,最后輸出所識別車鉤狀態圖像和車鉤坐標位置信息(圖3)。

圖3 YOLO-V2 結構示意圖
神經網絡的深度和寬度是表征網絡復雜度的兩個核心因素,這其中深度特征對神經網絡影響更大,為了進一步提高車鉤識別的準確率,增加神經網絡的復雜程度是行之有效的方法,但是過量增卷積層數,增深網絡深度,往往會直接影響神經網絡的梯度,模型收斂性下降、過飽和、模型退化、準確率下降的等各種情況伴隨發生。而引入殘差網絡模塊則能有效改善以上問題,殘差網絡允許原始輸入信息直接傳輸到后面的網絡層,即在后面卷積層之間加入幾個全等映射層,利用全等映射層把前一層特征傳輸到后面層,就能有效規避訓練模型梯度消失、不收斂的問題,選擇合適的殘差卷積核,也能降低全等映射帶來的擾動特性。
損失函數的目的是優化神經網絡參數,通過神經網絡將目標的實際值與預測值進行匹配比較,損失函數會計算出損失值,然后通過梯度下降算法優化網絡權重,降低算法訓練過程損失,不斷地更新神經網絡所訓練出的模型。
當下主要的損失函數包括均方差損失函數和交叉熵損失函數,實際效果中均方差損失假設誤差服從高斯分布,在分類任務下這個假設沒辦法被滿足,因此,在大多數分類任務中效果會很差,所以針對車鉤手柄和手柄基座進行多元分類,選用多分類交叉熵損失函數,原理公式如下所示:
在運用YOLO-V2 算法識別車鉤前,首先,要進行數據集的預處理包括且不限于通過翻轉、旋轉、噪聲、顏色變換四種圖片增強方法得到更豐富的數據樣本,然后對數據集進行準確標注,保證模型訓練所需要的基礎數據。基于深度學習的YOLO-V2 車鉤識別算法中,通過改進K-means 聚類算法選擇最佳車鉤手柄和手柄基座的候選框長寬和數量,完成ancher 預設;在神經網絡的結構中增設殘差模塊提升視覺識別的準確率;選用多分類交叉熵損失函數,用作神經網絡模型的訓練。
通過運用改進后的YOLO-V2 算法來實現對火電廠列車車廂車鉤的實時識別,進而使自動摘鉤機器人能夠進行準確的摘鉤作業。目標數據集包括在光線、時間、角度等諸多不同情況下的4875 張圖片,訓練集圖片包含2875 張華能沁北列車的車廂車鉤手柄基座的圖片及相應的標注;測試集圖片包含2000 張列車車鉤的圖片,對訓練集中的車鉤手柄及基座進行標注,標注的標簽包含四種輸出情況,即A 手柄(A-handle)、B 基座(B-pedestal)、C 手柄(C-handle) 及D 基座(D-pedestal),正確的輸出為A 手柄、B 基座或C 手柄、※※D基座,基座與手柄同時收集并標注計為標注成功(圖4)。

圖4 車鉤識別圖像結果
模型訓練進行2000 次,通過對比目標數據集中圖片的預測結果與真實值的重合率達到了97.3%,YOLO_V2檢測一張圖片平均用時為30ms,約33 幀/s,基本滿足現場的實際需求。在現場測試過程中,以翻車機工作現場采集的圖像序列為測試數據源,針對現場采集的圖像在原實驗訓練模型的基礎上再次進行訓練,針對現場不同的時間段,不同光線環境下的數據進行實時數據分析處理,最終得到的手柄基座的準確率高達95%以上。
機器學習、圖像識別的不斷研究與運用大大地提升了翻車機摘鉤機器人智能化程度,相較傳統的電氣控制系統,該套算法的利用在整體結構和識別摘鉤手柄的準確率上都有了質的提高。在實際應用中,盡管車鉤的檢測時間很短,經由YOLO-V2 算法所訓練的模型仍能及時地反饋其信息,但是,為了提高系統整體的穩定性,該算法的魯棒性仍然需要針對性提升。翻車機車鉤識別理論的不斷更新與研究以及在摘鉤機器設備上的運用,使翻車機系統在實現全自動化道路上邁出堅實的一步。