徐 順
(中車青島四方機(jī)車車輛股份有限公司 技術(shù)工程部,山東 青島 266000)
配電柜線號特征提取和識別方法研究
徐 順
(中車青島四方機(jī)車車輛股份有限公司 技術(shù)工程部,山東 青島 266000)
配電柜接線狀態(tài)是影響高速動車組運(yùn)行性能的重要因素,基于視覺的自動化檢測方式可以解決傳統(tǒng)的人工檢測的低效、主觀性強(qiáng)的問題,是工業(yè)檢測的一個(gè)重要的檢測方向,由于動車配電柜在光照和空間等方面的惡劣情況,線號數(shù)字呈現(xiàn)灰度、尺寸、角度等差異,極不利于線號的識別;以線號正確分割提取為前提,提取分割的數(shù)字區(qū)域的HOG特征和LBP特征,并利用SVM和ANN兩種分類器配合兩種特征進(jìn)行對比試驗(yàn),因?yàn)镠OG特征在圖像幾何和光學(xué)的形變會表現(xiàn)出優(yōu)異的不改變的特性,且SVM分類器克服了后者局部極小的困擾,最終選用SVM分類器配合HOG特征進(jìn)行配電柜線號識別。
支持向量機(jī);方向梯度直方圖;局部二值模式;線號識別;主成分分析
近年來高速動車組隨著經(jīng)濟(jì)的飛速發(fā)展有了長足的進(jìn)步,帶動了很多產(chǎn)業(yè)的升級。高速動車組在生產(chǎn)過程中需要部署大量電氣配線,但是人眼識別配電柜中電氣配線接線是否準(zhǔn)確效率相對較低,為了提升高速動車組電氣配線的安全可靠性,應(yīng)用機(jī)器視覺技術(shù)代替人眼識別是一項(xiàng)有效方式。目前,由于配電柜線號復(fù)雜、檢測過程不易規(guī)范化等問題,國內(nèi)外對于數(shù)字識別的研究在配電柜線號識別的應(yīng)用少之又少。
配電柜線纜型號較多造成背景顏色紛雜,極不利于線號定位,線號有角度扭轉(zhuǎn)、聚焦模糊、反光等情況更增加了數(shù)字識別的難度,如圖1所示。

圖1 配電柜線號情況
應(yīng)用機(jī)器視覺技術(shù)進(jìn)行配電柜線號識別的步驟如圖2所示,包括對采集的配電柜圖像進(jìn)行預(yù)處理過濾噪聲和光照影響,之后進(jìn)行線號定位并對線號區(qū)域進(jìn)行分割獲得數(shù)字區(qū)域,并提取數(shù)字的特征進(jìn)行識別。在配電柜線號識別的過程中,獲取高質(zhì)量的配電柜圖像是進(jìn)行正確識別的基礎(chǔ),選擇合適的數(shù)字特征值和分類器更是關(guān)鍵所在。本文采用1200萬像素手機(jī)攝像頭采集圖像,主要研究數(shù)字的特征提取和數(shù)字識別的內(nèi)容。

圖2 配電柜線號識別流程
2.1 LBP特征
LBP特征也叫局部二值模式特征,廣泛的應(yīng)用到圖片處理等相關(guān)領(lǐng)域。其特征算子是對應(yīng)一個(gè)3*3的區(qū)域,如圖3所示,該區(qū)域包含9個(gè)像素點(diǎn),將周圍的8個(gè)像素點(diǎn)的灰度值與中心點(diǎn)的灰度值進(jìn)行比較,如果其值大于等于零那么該位置的像素值變?yōu)?,否則變?yōu)?[1]。將得到的八個(gè)二進(jìn)制數(shù)按照一定的順序排列好轉(zhuǎn)變成十進(jìn)制數(shù),這個(gè)數(shù)就是改點(diǎn)的LBP值,其中計(jì)算LBP如式(1)所示:

(1)
圖3 3*3區(qū)域
配電柜線號的LBP特征如圖4所示,圖4(a)為配電柜線號的數(shù)字區(qū)域,圖4(b)為圖像LBP特征的灰度顯示,對圖像的LBP特征劃分窗口進(jìn)行統(tǒng)計(jì),得到每個(gè)窗口的直方圖,各直方圖組成特征向量,在分類器中進(jìn)行訓(xùn)練和測試。

圖4 線號數(shù)字的 LBP特征圖
2.2 HOG特征
方向梯度直方圖特征(HOG),該特征大量應(yīng)用在圖像處理識別等領(lǐng)域,相比于LBP特征等其它特征,自身擁有很多優(yōu)勢,HOG特征在圖像幾何和光學(xué)的形變會表現(xiàn)出優(yōu)異的不改變的特性。且數(shù)字形狀可以很好的被梯度和關(guān)于邊界的方向密度分布合理的表示出來。因?yàn)樽R別數(shù)字就是要識別數(shù)字的邊界,恰好梯度可以很好的詮釋數(shù)字邊界信息,因此用梯度直方圖可以表示出數(shù)字的邊界情況。HOG特征的提取過程如圖5所示。

圖5 HOG特征提取過程
圖像灰度化的目的是為了降低因?yàn)椴煌墓鈴?qiáng)影響到的線號局部的陰影和光強(qiáng)的變化。處理方法就是降低數(shù)值的量綱,如公式(2)所示:
A(x,y)=A(x,y)n(0 (2) 通過計(jì)算每一個(gè)像素點(diǎn)的水平方向和垂直方向的梯度值從而得到該點(diǎn)的梯度值和方向大小,對數(shù)據(jù)進(jìn)行求導(dǎo)還可以進(jìn)一步弱化光強(qiáng)的干擾因素,梯度公式如(3)和(4)所示。 (3) (4) Qx為水平梯度;Qy為垂直梯度;N(x,y)為梯度大小;θ(x,y)為梯度方向。 配電柜線號HOG特征如圖6所示,(a)為原始圖像,(b)為圖像的邊緣方向和梯度特征,對圖像分塊進(jìn)行方向梯度特征的統(tǒng)計(jì),得出圖像的HoG特征。 圖6 HOG特征圖 2.3 線號特征降維 通過提取線號數(shù)字的HOG特征會得到432維的數(shù)字特征,并且原始數(shù)據(jù)信息中包含著一定程度的噪聲信息和冗余信息,導(dǎo)致線號數(shù)字特征在SVM[2-4]訓(xùn)練中時(shí)間變長和準(zhǔn)確率變低,因此為了提高線號數(shù)字的識別速度和正確率,需要先對提取好的線號數(shù)字特征進(jìn)行降維[5-7]處理,在此采用了PCA算法對線號的HOG特征進(jìn)行降維[8]。 PCA是一種常用的數(shù)據(jù)分析方法,通過線性變換將原特征矩陣轉(zhuǎn)換為各維度線性無關(guān)的表示,可用于提取特征矩陣的主要分量,如下式: 即將p維的特征向量轉(zhuǎn)換為m維的線性無關(guān)的特征向量。由數(shù)學(xué)知識可知,特征向量包含的信息可由其方差衡量,方差越大的特征向量包含的信息量越大。因此我們將特征向量按包含信息量的多少進(jìn)行排列,則F1,F2,…,Fm分別代表著特征的由主到次的成分特征。特征向量Fn互不相關(guān),即互相之間協(xié)方差cov(X,Y)=0,并且Fn隨著n的增大其方差減小,因此引入?yún)f(xié)方差矩陣的概念。 含有n個(gè)樣本的集合X={X1,X2,X3,…,Xn}其均值、標(biāo)準(zhǔn)差、方差為: 協(xié)方差用來度量兩個(gè)隨機(jī)變量關(guān)系: PCA降維的方法就是將線號HOG特征的多維數(shù)據(jù)映射到低維空間當(dāng)中,盡可能地保留線號HOG特征數(shù)據(jù)的原始信息,并且去掉冗余信息和噪聲干擾信息。本文通過映射將原線號HOG特征投影到一個(gè)新的線性子空間如公式(5)所示: (5) X為代表提取的特征空間;βi為代表X在子空間i軸的投影;Bi為代表i軸的特征向量;μ為代表特征向量的平均值。 圖7 主成份信息分布 當(dāng)選取前35個(gè)特征成分時(shí),攜帶數(shù)據(jù)為95%,當(dāng)選取前55個(gè)特征成分時(shí),攜帶信息為97.86%。本文選取前50個(gè)主成份作為配電柜線號的特征,用于后續(xù)的識別分類。 SVM分類器優(yōu)于神經(jīng)網(wǎng)絡(luò)[9-11]分類器,該分類方法最終轉(zhuǎn)變?yōu)閷?yōu)的問題,可以最終獲得整體的優(yōu)點(diǎn),克服了后者局部極小的困擾,以及因?yàn)榫€號樣本訓(xùn)練的誤差過小而影響對樣本預(yù)測的精度。如果訓(xùn)練樣本不是無窮盡,而是有限的,那么在這種情況下,該分類器可以依然可以得到最合適的解。且SVM分類器可以很好的用線性函數(shù)解決非線性函數(shù)的問題,雖然HOG特征有很高的維數(shù),但是該方法的繁瑣程度與特征的高維數(shù)并沒有任何聯(lián)系[12]。 SVM的目標(biāo)函數(shù)為: y(x)=wTφ(x)+b) (6) 分類決策函數(shù)為: f(x)=sign(y(x)) (7) 在計(jì)算最優(yōu)超平面的時(shí)候,需要先建立一個(gè)拉格朗日函數(shù): (8) 最終求得最優(yōu)解和最終的分類決策函數(shù)為: (9) (10) f(x)=sign(w*φ(x)+b*) (11) SVM是本質(zhì)上是二分類器,但是外周血白細(xì)胞不僅包括典型的五類六種細(xì)胞,異常形態(tài)的白細(xì)胞也包括三類異型淋巴細(xì)胞、假性佩爾格爾畸形以及與之形態(tài)形似的幼稚細(xì)胞等,因此白細(xì)胞的分類是一個(gè)多分類模式,多分類器方法主要有一對多法一對一法和SVM決策樹法。 通過反復(fù)的實(shí)驗(yàn)論證,發(fā)現(xiàn)LBP特征和HOG特征后者的配合SVM分類器進(jìn)行線號數(shù)字的分類識別的準(zhǔn)確率最高。實(shí)驗(yàn)結(jié)果如表1所示。 表1 LBP特征準(zhǔn)確率 % 從表1中可以看出,在HOG特征情況下配合SVM分類器實(shí)現(xiàn)的分類準(zhǔn)去率相對比較理想,在此基礎(chǔ)上通過改進(jìn)訓(xùn)練樣本,可以進(jìn)一步提高配電柜線號數(shù)字分類的準(zhǔn)確性。在實(shí)際檢測識別過程中,由于線號中存在著類似的字符,如“8”“B”,“0”“D”,“1”“7”,“5”“S”等易錯(cuò)誤識別,結(jié)合先驗(yàn)知識信息,使得線號識別率大大提升。 為解決動車組配電柜接線狀態(tài)人工檢測效率低、主觀性強(qiáng)的問題,本文對應(yīng)用機(jī)器視覺技術(shù)進(jìn)行配電柜線號識別特征提取和模式識別的相關(guān)知識進(jìn)行了研究,提出了基于SVM分類器配合HOG特征對配電柜線號中的數(shù)字實(shí)現(xiàn)準(zhǔn)確識別的技術(shù)方法。首先對分割好的數(shù)字區(qū)域進(jìn)行尺寸歸一化,之后提取數(shù)字的方向梯度特征,并分塊進(jìn)行統(tǒng)計(jì),然后進(jìn)行主成分分析,去除相關(guān)性大的冗余特征,最后用SVM分類器進(jìn)行分類,達(dá)到了很好的識別準(zhǔn)確率,能夠有效提升高速動車組配電柜接線質(zhì)量及生產(chǎn)效率。 [1] 王 葉, 張洪剛,方 旭, 等. 基于改進(jìn)的LBP的低分辨率車牌漢字識別[J]. 中文信息學(xué)報(bào), 2009, 23(5): 86-91. [2] 唐靈潔, 胡紅萍. 基于SVM的車牌數(shù)字識別方法[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識, 2012, 42(23): 138-143. [3] 劉會河, 徐維超, 劉 舜, 等. 基于SVM的降維方法在三類ROC分析中的應(yīng)用[J]. 計(jì)算機(jī)與現(xiàn)代化, 2016, 251: 49-54. [4] 李文博. 一種基于SVM的數(shù)字儀表顯示值識別方法[J]. 現(xiàn)代電子技術(shù), 2011, 34(4): 195-197. [5] 周 杰, 張敏情. 基于雙重特征選擇降維的圖像隱寫分析[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2016, 37(11): 2917-2922. [6] 高紅民, 李臣明, 周 惠, 等. 神經(jīng)網(wǎng)絡(luò)敏感性分析的高光譜遙感影像降維與分類方法[J].電子與信息學(xué)報(bào), 2016, 38(11): 2715-2723. [7] 陳 銳, 王 敏, 陳 肖, 等. 基于PCA降維的HOG與LBP融合的行人檢測[J]. 信息技術(shù), 2015, (2): 101-105. [8] 郭榮艷, 胡雪惠. BP神經(jīng)網(wǎng)絡(luò)在車牌字符識別中的應(yīng)用研究[J]. 計(jì)算機(jī)仿真, 2010, 27(9): 299-301. [9] 張文達(dá), 許悅雷, 倪嘉成, 等. 基于多尺度分塊卷積神經(jīng)網(wǎng)絡(luò)的圖像目標(biāo)識別算法[J]. 計(jì)算機(jī)應(yīng)用, 2016, 36(4): 1033-1038. [10] 史鶴歡, 許悅雷, 馬時(shí)平, 等. PCA預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)目標(biāo)識別算法[J]. 西安電子科技大學(xué)學(xué)報(bào), 2016, 43(3): 161-165. [11] 李 穎, 李耀輝, 王金鑫, 等. SVM和ANN在多光譜遙感影像分類中的比較研究[J]. 海洋測繪, 2016, 36(5): 19-22. [12] 申 勇, 范 紅. 基于SVM的數(shù)字識別技術(shù)研究[J]. 微計(jì)算機(jī)信息, 2010, 26(5-1): 194-196. StudyofFeatureExtractionandRecognitionforDistributionCabinet XuShun (CRRC Qingdao SiFang Locomotive & Rolling Stock Co.,Ltd.,The Engineering Department,Qingdao 266000,China) Distribution cabinet is a key equipment of the China Railway High-speed(CRH). Automatic detection method based on computer vision can solve the subjective problem and low efficiency of traditional manual detection. Bad situation in the light and space and differences in gray scale and angle made recognition more difficult. Based on correct segmentation district , extracting HOG features and LBP features of line number, using SVM and ANN classifiers with the two characteristics to recognize line number. Considering the excellent invariance of HOG features in geometry and optical deformation of the image, and SVM classifier can overcomes local minimum problem, This paper use SVM classifier with HOG characteristics to recognize distribution cabinet line number. support vector machine; histogram of oriented gradient; local binary pattern; line number recognition; principal component analysis 2017-02-14; 2017-03-02。 徐 順(1960-),男,山東濟(jì)南人,高級工程師,主要從事軌道車輛電氣調(diào)試工藝方向的研究。 1671-4598(2017)04-0197-03DOI:10.16526/j.cnki.11-4762/tp TM A

3 SVM分類器



4 實(shí)驗(yàn)結(jié)果與分析

5 結(jié)論