高聰,林建輝,鄧韜,楊見光
(西南交通大學 牽引動力國家重點實驗室,四川 成都 610031)
接觸網是電氣化鐵路的重要組成部分,接觸網支持與懸掛裝置工作狀態的好壞直接影響列車受流狀況及其受流質量,與接觸網的安全狀態息息相關[1]。隨著高速鐵路6C系統的發布實施,針對接觸網系統中的關鍵零部件,利用高清相機結合圖像處理技術進行定位識別及故障分析已經成為主要研究方法[2]。
隨著C4檢測系統技術指標要求不斷細化,基于圖像處理技術的非接觸式檢測技術研究不斷深化。文獻[3]利用改進的HOG特征及離散余弦變換特征增強,訓練AdaBoost分類器檢測承力索座、利用圓弧檢測和聚類判別輔助承力索缺失;文獻[4]基于HOG特征與二維Gobor小波變換實現耳片斷裂故障檢測;文獻[5]基于LBP-HOG實現了接觸網旋轉雙耳區域識別;文獻[6]利用HOG特征與支持向量機和AdaBoost 分類器級聯的方法實現接觸網斜撐套筒的定位;文獻[7]基于卷積神經網絡的深度學習方法實現接觸網定位器檢測和識別;文獻[8]利用HOG特征以及支持向量機和極限學習機實現了定位線夾的定位和檢測;文獻[9]利用LBP和HOG特征實現了絕緣子的定位和檢測。
針對待檢測圖像,基于積分圖方法描述圖像旋轉不變LBP(rotation invariant local binary pattern)與HOG(histogram of oriented gradients)的融合特征和支持向量機,采用多尺度滑動窗口檢測旋轉雙耳,實現旋轉雙耳定位識別;采用圓弧檢測實現旋轉雙耳銷釘準確定位;利用環形對稱Gabor變換(circularly symmetrical Gabor transform, CSGT)完成銷釘圖片紋理邊緣信息的特征提取,最后結合BP神經網絡實現對旋轉雙耳銷釘穿插狀態的判斷識別。該檢測方法的流程圖如圖1所示。
旋轉雙耳的定位識別可分為樣本訓練和定位識別兩個階段。樣本訓練主要利用特征提取算法計算正負樣本兩類的融合特征,訓練線性支持向量機(SVM)分類器。定位識別主要采用多尺度檢測方法以及窗口合并,實現對不同大小旋轉雙耳的定位識別。
LBP是一種能夠有效度量和提取圖像局部紋理信息的算子,具有旋轉不變性和灰度不變性等顯著優點[10]。由于具有對光照不敏感的特性,是紋理和人臉識別中一種重要的特征提取方法[11]。原始的LBP算子定義為在3×3的窗口內,以窗口中心點gc處的像素為閾值,將相鄰的8個像素的灰度值與其進行比較,若相鄰像素值大于或等于中心像素值,則該標記為1,否則為0。相鄰域內8個點經過比較可產生8位二進制數,轉換為十進制數即LBP碼,共有256種。

圖1 銷釘穿插狀態判別流程圖
(1)
改進后的圓形LBP允許在半徑為R的圓形鄰域內有任意多個采樣點,當采樣點坐標為非整數時,參考鄰域4個整數坐標處灰度值,采用線性插值計算該采樣點灰度值。為了去除旋轉對LBP值所產生的影響,獲得唯一LBP值,定義旋轉不變LBP算子如下:
LBP(gc)=min(ROR(LBP(gc),i))
(2)
式中ROR(LBP(gc),i)代表將LBP二進制模式按照順時針方向移位i次,找到最小LBP值,即為旋轉不變LBP算子[12]。對于8個采樣點,有36種旋轉不變LBP模式。
HOG即梯度方向直方圖特征,是一種針對圖像局部重疊區域的描述符, 它通過計算局部區域的梯度方向直方圖來構成特征[13]。HOG特征提取的過程包括:每一個檢測窗口劃分成若干個細胞單元(cell),相鄰4個細胞單元組成1個塊(block),塊與塊之間可以相互重疊。針對每個細胞單元中的像素點I(x,y),利用如下公式計算梯度大小m(x,y)和方向θ(x,y):
dx=I(x+1,y)-I(x-1,y)
(3)
dy=I(x,y+1)-I(x,y-1)
(4)
(5)
(6)
對每一個塊中的特征進行直方圖歸一化,消除光照變化帶來的影響。
(7)
式中:v為未歸一化處理的特征向量;υnorm為歸一化處理后的特征向量;‖υ‖2為v的二范數;無窮小量ε防止分母為0,所有塊的特征向量連接在一起即為檢測窗口HOG特征。根據文獻[14]中實驗證明,將360°分為9個梯度方向,即每個梯度方向為20°時檢測效果較好。
支持向量機是利用正負樣本數據,尋找滿足分類間隔最大的超平面,可在小樣本提供的有限特征數據下尋找最優分類結果。支持向量機將不能線性分離的數據通過特定的非線性映射函數投影到某個高維特征空間中,在此高維空間尋找一個最佳超平面,使樣本分類可以滿足類間間隔最大[15]。
正負樣本剪切于接觸網支撐與懸掛裝置高清圖像,樣本尺寸統一縮放為128×64,正負樣本如圖2和圖3所示。樣本HOG特征描述時,將圖像劃分為8×8的cell,2×2個cell組成一個block,每個cell取9個方向描述特征,1個block包含4×9=36維特征向量,HOG特征為15×7×36=3 780維向量。樣本旋轉不變LBP特征描述時,選擇圓形LBP描述算子,取半徑R=2,采樣數P=8。1個block統計特征向量為36維,旋轉不變LBP特征為15×7×36=3 780維向量。正負樣本旋轉不變LBP與HOG的融合特征向量維數為7 560,利用所有正負樣本進行訓練線性支持向量機,得到訓練后的模型。

圖2 正樣本

圖3 負樣本
在檢測圖像中是否含有旋轉雙耳時,采用積分圖的方法描述圖像旋轉不變LBP特征和HOG特征,檢測窗口大小設置為128×64,檢測過程采用多尺度滑動窗口掃描,滑動步長為8,通過合并檢測結果中同類窗口完成旋轉雙耳最終定位識別,旋轉雙耳檢測結果如圖4所示。

圖4 檢測結果圖
首先將旋轉雙耳區域圖片尺寸統一縮放為640×320,對圖像預處理后利用Canny算子對旋轉雙耳圖像進行邊緣信息的提取,采用圓弧檢測的方法實現銷釘的準確定位。設定圓弧半徑范圍為(15,25),可在旋轉雙耳正面圖像中檢測出包含銷釘在內的3個圓弧,通過圓弧間的相對位置關系可以準確定位銷釘圓弧位置。以圓弧中心位置為中心點,以80×80尺寸剪裁得到雙耳配合處銷釘準確定位圖片,銷釘識別定位過程如圖5所示。

圖5 銷釘定位結果
旋轉雙耳配合處銷釘背景為耳片,此處銷釘穿插雖然具有相似的形狀結構,但穿插角度不固定,在銷釘穿插狀態檢測中不能使用傳統的水平或豎直灰度投影的方法。基于環形對稱Gabor提取銷釘圖片特征,利用BP神經網絡實現銷釘穿插正常、松脫及缺失狀態檢測,銷釘穿插的3種狀態如圖6所示。

圖6 銷釘穿插3種狀態圖
Gabor小波可以近似地模仿人眼視覺識別機制,實現多尺度和多方向的描述能力。傳統的Gabor函數中的方向選擇是離散的,不具有旋轉不變性。待識別的圖像中特征具有的方向和角度是不確定的。為了對圖像特征進行更全面的描述,采用環形對稱Gabor變換進行特征提取,文獻[16]中將環形對稱Gabor變換應用到人臉識別領域并取得理想效果。環形對稱Gabor變換是忽略式中方向參數,表達式如下:
(8)

為了使窗口函數大小適應尺度大小,降低卷積時的計算量,可以根據窗口的大小選擇合適的模板以適應各不同尺度。σ/kν決定高斯窗口寬度的大小,文獻[17]取r=floor(nσ/kν),n可取2,3,4等的方法確定模板的邊長為2r+1。選擇ν∈{0,1,2,3,4},n=2,即在5個尺度下選擇模板r=floor(2σ/kν)對圖像進行環形對稱Gabor變換。保證模板可以覆蓋窗口函數的主要信息,提高特征提取時的效率。圖7為環形對稱Gabor變換的5個尺度幅值圖像。

圖7 環形對稱Gabor的 5個尺度幅值圖像
在故障識別分類中,采用機器學習算法中的人工神經網絡。本文使用BP神經網絡,由包含1個輸入層、1個輸出層和1個或者多個隱層的神經網絡組成,相鄰層之間的神經元為全連接,同一層之間的神經元無連接。訓練方法采用BP算法,其核心思想是基于誤差反向傳播對權重矩陣進行校正。在實際輸出值與期望值輸出不同時,會不斷修正權值,對網絡進行校正。
在神經網絡設計中,隱層節點數少會導致網絡學習能力差,隱層節點數多容易導致缺乏記憶主要信息的能力,混入大量非規律的次要信息[18]。多隱層的網絡相對單隱層網絡具有相對較強的學習能力,合理設計神經網絡和選取學習速率等訓練參數十分重要。選擇學習速率的初始值范圍一般為(0.01,0.8),節點個數可取經驗公式:
(9)
式中:n為輸入層神經元個數;m為輸出層神經元個數;p為隱層神經元個數;a為修正常數。
利用環形對稱Gabor變換對圖像進行特征處理后,將幅值最大值、幅值最小值和幅值平均圖進行融合,可以突出表達旋轉雙耳銷釘紋理信息,邊緣對比度較大,特征信息較明顯。原始旋轉雙耳銷釘圖片尺寸相對較大,本文選擇將銷釘圖片尺寸分別縮放為10×10、15×15、20×20、25×25和30×30進行測試訓練。訓練過程選用60張穿插正常狀態、80張穿插松脫狀態、60張穿插缺失狀態樣本3類融合特征圖訓練BP神經網絡,利用環形對稱Gabor變換對銷釘穿插正常狀態圖像進行特征提取后的結果如圖8所示。

圖8 銷釘穿插正常狀態特征圖
實驗證明選擇圖片尺寸為15×15結合使用雙隱層BP神經網絡模型時有較好的分類識別結果,學習速率取0.03。BP神經網絡輸入層神經元數量為675,輸出層神經元數量為3;根據經驗公式和實驗,第1層隱含層神經元數量取20,第2層隱含層神經元數量取為10。
在Microsoft Visual C++下基于OpenCV圖像處理平臺利用本文提出方法,對43張來自C4接觸網檢測系統采集到的接觸網支持與懸掛裝置現場高清圖像進行實驗驗證。實驗結果如表1所示。

表1 接觸網旋轉雙耳定位識別結果
利用40張旋轉雙耳高清圖像進行實驗驗證,基于圓弧檢測正確定位38張圖片的銷定區域,漏檢2張,具有較高的定位精度。
利用旋轉雙耳銷釘樣本對訓練模型進行驗證,其中0代表正常樣本,1代表松脫樣本,2代表缺失樣本,實驗結果如表2所示(表中“—”表示數據不存在)。

表2 銷釘狀態判別結果
分析實驗結果可知,定位算法針對旋轉雙耳檢測具有較高的定位識別精度,能夠定位識別正反面及不同尺度下的旋轉雙耳。在檢測圖像背景干擾較小,只包含單個旋轉雙耳時具有檢測精度高的優點;在包含2個旋轉雙耳時具有較高的檢測精度,漏檢是由于相機拍攝角度導致未檢測到的旋轉雙耳與后面接觸網支持與懸掛裝置中絕緣子與腕臂部分存在較大重疊與干擾,影響檢測結果;對于不包含旋轉雙耳的其他接觸網支持與懸掛裝置圖像無漏檢和誤檢。模型針對旋轉雙耳銷釘穿插的3種狀態整體有較好的識別分類效果,其中對穿插缺失狀態正確判別率為96.78%,具有很高的識別率。對穿插松脫狀態的正確判別率雖然只有86.67%,但基本全部誤判為穿插缺失。對穿插正常狀態正確判別率為90.32%,具有較高的識別率。分析誤檢情況的圖片,存在不清晰等問題,進行特征提取時不能很好地表達紋理邊緣信息。
實驗結果表明,檢測方法在較復雜的背景干擾下可實現旋轉雙耳正反面及不同尺度下的定位識別,利用圓弧精定位旋轉雙耳銷釘以及BP神經網絡判別穿插狀態具有較高的識別精度。本文對接觸網支持與懸掛裝置零部件定位識別進行了有益的研究,在實現接觸網關鍵零部件故障缺陷智能識別方面進行了嘗試。