郝建華
(山西汾西礦業(集團)有限責任公司 供用電分公司, 山西 介休 032000)
?
煤礦變電所數顯儀表字符識別研究
郝建華
(山西汾西礦業(集團)有限責任公司 供用電分公司, 山西 介休032000)
針對煤礦變電所數顯式儀表存在巡檢自動化程度低和識別可靠性差等問題,提出了一種基于改進遺傳算法和支持向量機算法的字符識別算法。該算法采用Harr-Like特征作為字符識別特征,通過改進的遺傳算法對分類器支持向量機的參數進行尋優,利用主元分析法進行降維處理,并使用支持向量機識別數顯式儀表字符。實驗驗證了該算法的有效性和可行性。
煤礦變電所; 數顯式儀表; 字符識別;Harr-Like特征; 改進遺傳算法
網絡出版地址:http://www.cnki.net/kcms/detail/32.1627.TP.20160902.1018.015.html
煤礦變電所中大量使用數顯式儀表用于顯示電力系統的電壓、電流、功率等參數,其優點是讀數簡單且不需要估計。但在一般情況下,數顯式儀表并不和測量系統進行數據傳輸,僅僅顯示當前的測量結果,而測量結果需要通過人工抄寫記錄,并將其錄入計算機內,以對這些數據作進一步處理。這種檢測方式不僅費時費力,而且可靠性易受檢測員的影響變得不穩定。本文將機器視覺技術引入煤礦變電所,用于采集數顯式儀表的圖像,并進行處理和識別。常用的字符識別法有穿線識別法、模板匹配法、支持向量機法等。穿線識別法易于實現,但對定位區域要求較高。模板匹配法簡單,但運算量較大。另外,上述2種方法對字符扭曲、變形抵抗能力不強。故本文提出一種基于Harr-Like特征及改進遺傳算法支持向量機的字符識別算法,并進行了實驗研究。
1.1Harr-Like特征
Harr-Like特征庫有3種類型、4種形式。利用這些特征可以從字符中提取斜向邊緣特征、斜向灰度特征等有用信息[1-2]。
假設圖像高為H,寬為W,如果特征量滿足式(1),則五元組(x,y,p,h,θ)能夠表示擴展Harr-Like特征中的旋轉矩陣特征及豎直矩陣特征。

(1)
式中:x,y表示矩形的位置;p,h分別為矩形的寬和高;θ為矩形的傾斜角度。
每個特征在實際訓練中的個數是不相同的,一個大小為p×h的正面特征,在一幅大小為W×H的圖像中的個數為
(2)
式中:N為θ=0°對應的特征數;X=W/h;Y=H/h。
對于θ=45°的特征量,在W×H的圖像中個數為
(3)
式中z=p+h。
1.2支持向量機
尋求支持向量機最優分類超平面可轉化為求解如下的約束優化問題:
(4)
式中:(xi,yi)代表第i個樣本;w,b分別為超平面的法向量和截距;l為樣本個數。
這是一個凸二次規劃問題,原約束優化問題可以轉化為對偶問題:
(5)
式中αi為拉格朗日乘子。
在線性分類問題中,有時可能會出現一些噪聲樣本點,導致原線性可分的樣本數據變得線性不可分,此時需使其能夠忽略一定的誤差,引入一個評估誤差損失的懲罰權重對訓練誤差進行考量,從而使分類器的分類效果更好,具體目標函數可以定義為
(6)
式中:C為懲罰因子,表示對訓練誤差的重視程度;ξi為松弛因子。
對于某空間中線性不可分的數據,往往可先使用映射函數Φ(x)將訓練樣本從低維空間轉換到高維空間,這個函數被稱為核函數。使用核函數后,原優化問題可寫為
(7)

決策函數可以寫為
(8)
式中β*為分類閾值。
常用的核函數包括多項式核函數、高斯徑向基核函數及Sigmoid核函數[3]。本文采用高斯基核函數。
(9)
式中γ為高斯徑向基核函數的半徑。
使用遺傳算法對支持向量機進行參數尋優時,先在設定區間內隨機選點進行搜索,其方向由適應度函數決定,流程如圖1所示。

圖1 基于遺傳算法參數尋優流程
使用二進制符號串d1,d2,…,da,da+1,…,dg對支持向量機中的C和γ編碼,其中,C對應d1,d2,…,da,γ對應da+1,da+2,…,dg;a為C的編碼長度(位數),g為γ的編碼長度(位數)。自變量編碼與支持向量機參數相互對應。
支持向量機參數尋優過程中的適應度函數一般為交叉驗證函數,但在遺傳算法中很難保證種群多樣性,容易導致局部最優現象,因此,需要對適應度函數進行調整。適應度函數為

(10)
式中:F*(x)為調整后的適應度函數;F(x)為原適應度函數,即交叉驗證函數;B為最佳適應度;A為平均適應度[4];s≥1且為整數,一般為2;k由交叉驗證函數確定,若F(x)≥1,則k>1且為整數,若F(x)<1,則k∈(0,1);n為現遺傳代數;M為最大遺傳代數[5]。
通常遺傳算法的交叉概率Pc=0.6~1,變異概率Pm=0.001~0.1。在初期階段個體適應度差異較大,較大的交叉概率及較小的變異概率可以更好地保存有用遺傳信息;而在后期,個體適應度差異較小,相反的交叉概率和變異概率能夠增加種群多樣性。查閱相關資料后,本文使用的交叉概率和變異概率如下:
(11)
(12)
式中n1為第一代遺傳代數。
支持向量機中核函數選用高斯徑向基函數,其中參數分別使用經驗法、遺傳算法和改進遺傳算法獲得。在經驗法中,C=1 000,γ=0.01,遺傳算法和改進遺傳算法中核函數C的搜索范圍設為[2-2,24],γ的搜索范圍設為[2-4,24],種群數量設置為20,最大遺傳進化數為100次。
實驗采用自建字符圖像庫進行測試,字符庫包含10種字符,每種字符選取110張圖像,其中有些字符表面受到光照、薄膜影響。部分字符圖像如圖2所示,每種字符選取35幅圖像用作測試,剩余圖像作為訓練圖像。

圖2 部分字符圖像
對字符圖像進行二值化處理后,部分字符受噪聲干擾明顯,如圖3所示。
分別檢驗采用穿線法、模板匹配法和不同參數支持向量機方法的識別結果。使用支持向量機識別字符時提取特征并使用主元分析法進行數據降維,選取主成分貢獻率大于90%。對其中一幅字符圖像使用遺傳算法優化參數,得到的適應度曲線如圖4所示。得到的支持向量機最優參數為C=13.792 6,γ=0.007 9。

圖3 部分受噪聲干擾的字符二值化圖像

圖4 遺傳算法適應度曲線
采用改進遺傳算法優化參數得到的適應度曲線如圖5所示。得到的支持向量機最優參數為C=39.960 3,γ=0.007 5。

圖5 改進遺傳算法適應度曲線
使用遺傳算法進行參數尋優在開始階段選擇的種群具有隨機性,因此,對于相同訓練數據,每次參數尋優的結果并不一致,對數據進行5組實驗,遺傳算法參數尋優結果見表1。改進遺傳算法參數尋優結果見表2。

表1 遺傳算法參數尋優結果

表2 改進遺傳算法參數尋優結果
對每個字符分別進行8組實驗,對結果求平均值,得到不同方法的識別率見表3。

表3 不同方法的識別率 %
通過實驗結果可以看出,采用Harr-Like提取字符特征,然后基于改進遺傳算法支持向量機分類,對字符圖像有較好的識別率,在樣本不是很大的情況下,分類速度較快,滿足時效性要求。
介紹了基于改進遺傳算法支持向量機的字符識別算法,并將其應用于煤礦變電所數顯式儀表的圖像處理和識別。該算法采用Harr-Like特征作為字符識別特征,相比穿線法、模板匹配法、支持向量機法等傳統的字符識別算法,其參數優化效率高、分類速度快、準確率高,具有更好的識別效果。
[1]ZHANGC,LIUJ,LIANGC,etal.ImageclassificationusingHarr-liketransformationoflocalfeatureswithcodingresiduals[J].SignalProcessing, 2013,93(8):2111-2118.
[2]邵平,楊路明,曾耀榮.計算旋轉Harr型特征的積分圖像算法改進[J].計算機技術與發展,2006(11):146-147.
[3]黃瓊英.支持向量機多類分類算法的研究及應用[D].天津:河北工業大學,2005.
[4]劉虎,羅斌,吳晟,等.改進的遺傳算法在SVM參數優化中的應用[J].云南師范大學學報(自然科學版),2012(4):47-51.
[5]楊旭,紀玉波,田雪.基于遺傳算法的SVM參數選取[J].遼寧石油化工大學學報,2004(1):54-58.
Study of character recognition of digital display instrument in coal mine substation
HAO Jianhua
(BranchofPowerSupplyandConsuption,ShanxiFenxiMining(Group)Co.,Ltd.,Jiexiu032000,China)
Inviewofproblemsoflowautomationdegreeandrecognitionreliabilityofdigitaldisplayinstrumentincoalminesubstation,akindofcharacterrecognitionalgorithmbasedonimprovedgeneticalgorithmandsupportvectormachinealgorithmwasproposed.ThealgorithmadoptsHarr-Likefeaturesascharacterrecognitionfeatures,improvedgeneticalgorithmwaschosentosearchtheoptimalparametersofthesupportvectormachineclassifier,andusesprincipalcomponentanalysismethodtoconductthedimensionreducingprocess,thenappliessupportvectormachinetoidentifycharacterofthedigitaldisplayinstrument.Theeffectivenessandfeasibilityofthealgorithmwasvalidatedbyexperiments.
coalminesubstation;digitaldisplayinstrument;characterrecognition;Harr-Likefeatures;improvedgeneticalgorithm
1671-251X(2016)09-0064-04DOI:10.13272/j.issn.1671-251x.2016.09.015
2016-06-29;
2016-07-28;責任編輯:張強。
江蘇省自然科學基金項目(BK20130207)。
郝建華(1963-),男,山西太古人,工程師,現主要從事煤礦供電安全研究及管理等工作,E-mail:200510322@163.com。
TD611
A網絡出版時間:2016-09-02 10:18
郝建華.煤礦變電所數顯儀表字符識別研究[J].工礦自動化,2016,42(9):64-67.