童軍心,童 超,吳宇睿,王金明,單松興
(1.國(guó)網(wǎng)江西省電力有限公司電力科學(xué)研究院,江西 南昌 330096;2.南昌工程學(xué)院,江西 南昌 330096;3.國(guó)網(wǎng)江西省電力有限公司超高壓分公司,江西 南昌 330096;4.國(guó)網(wǎng)江西省電力有限公司樟樹(shù)市供電分公司,江西 宜春 336000)
為了準(zhǔn)確了解電力系統(tǒng)輸變電設(shè)備的運(yùn)行狀態(tài),需要對(duì)系統(tǒng)進(jìn)行安全評(píng)估,對(duì)可能存在的風(fēng)險(xiǎn)進(jìn)行預(yù)警,需要對(duì)輸變電設(shè)備進(jìn)行大量檢測(cè)試驗(yàn),而大量?jī)x器儀表的數(shù)據(jù)需要被記錄便于進(jìn)行數(shù)據(jù)挖掘和分析。在復(fù)雜的檢測(cè)場(chǎng)景下,一些檢測(cè)儀器無(wú)通訊接口,只能通過(guò)紙筆抄錄完成報(bào)告后再輸入系統(tǒng)中,效率低下且容錯(cuò)率低。為了給變電檢測(cè)現(xiàn)場(chǎng)過(guò)程提質(zhì)增效,運(yùn)用圖像識(shí)別技術(shù)對(duì)儀器數(shù)據(jù)進(jìn)行定位識(shí)別,再將識(shí)別結(jié)果自動(dòng)返回報(bào)告中[1-3]。
儀表的數(shù)字識(shí)別過(guò)程由區(qū)域定位、字符分割、字符識(shí)別三部分組成。其中,儀表區(qū)域定位是數(shù)字識(shí)別的前提,起著關(guān)鍵性作用?;赟IFT、SURF 的定位算法廣泛應(yīng)用于電力系統(tǒng)中目標(biāo)檢測(cè)與研究中。文獻(xiàn)[4]針對(duì)SIFT 算法中特征向量的維數(shù)過(guò)高問(wèn)題,提出了一種雙向SIFT 匹配的方法,降低了特征向量維數(shù),提高了匹配精度,較好地應(yīng)用在電力設(shè)備識(shí)別中。SURF 算法借鑒了SIFT 簡(jiǎn)化近似思想,將DOH 中的高階、二階微分模板進(jìn)行了近似簡(jiǎn)化,可以采用積分圖像計(jì)算,實(shí)驗(yàn)證明SURF 算法綜合性能優(yōu)于SIFT算法[5-8]。
傳統(tǒng)圖像文字識(shí)別技術(shù)大多采用傳統(tǒng)光學(xué)字符識(shí)別,該技術(shù)需輸入圖像背景干凈,字體簡(jiǎn)單且排布整齊,才能達(dá)到很高的識(shí)別水平,對(duì)復(fù)雜儀表圖像幾乎無(wú)法識(shí)別。與純文字的圖片不同,復(fù)雜環(huán)境下的儀表信息識(shí)別則面臨著圖像背景復(fù)雜、拍攝角度和光線強(qiáng)弱等眾多因素造成的分辨率低、對(duì)比度和亮度不均勻等問(wèn)題。
基于此,文中提出基于SURF+OCR 對(duì)變電檢測(cè)儀器數(shù)據(jù)定位[9]識(shí)別方法,根據(jù)尺度不變特征變換實(shí)現(xiàn)儀器面板特征匹配、關(guān)鍵數(shù)據(jù)位置定位與截取,實(shí)現(xiàn)對(duì)儀器面板重要信息的獲取,獲取后的圖片經(jīng)過(guò)預(yù)處理后放入Tesseract-OCR[10-11]引擎中識(shí)別,繼而得到精確的識(shí)別結(jié)果。
SURF算法的實(shí)現(xiàn)主要有以下5個(gè)步驟:
1)構(gòu)造比例空間:利用高斯模糊形成不同尺度的圖像,構(gòu)成高斯金字塔。為確保圖片中的要素與比例無(wú)關(guān),通過(guò)高斯函數(shù)計(jì)算出不受尺度和旋轉(zhuǎn)影響的極值點(diǎn)。
2)關(guān)鍵點(diǎn)本地化:對(duì)極值點(diǎn)進(jìn)行擬合三維二次函數(shù)運(yùn)算,去除影響SURF 算法的邊緣響應(yīng)點(diǎn),同時(shí)確定極值點(diǎn)的尺度和位置,進(jìn)而確定合適的特征成為關(guān)鍵點(diǎn)。
3)方向分配:提取圖像在某個(gè)特定小區(qū)域內(nèi)的梯度值的最大值,并作為該關(guān)鍵點(diǎn)的方向特征值,確保關(guān)鍵點(diǎn)角度不變。
4)關(guān)鍵點(diǎn)描述符:在關(guān)鍵點(diǎn)領(lǐng)域內(nèi),計(jì)算出選定區(qū)域的梯度大小,并用該梯度值表征圖像在局部區(qū)別內(nèi)光照、形狀變化,為每個(gè)關(guān)鍵點(diǎn)分配獨(dú)特的指紋。
5)圖像匹配:運(yùn)用漢明距離、歐氏距離等方法對(duì)兩幅圖像關(guān)鍵點(diǎn)特征向量進(jìn)行相似運(yùn)算,之后通過(guò)單應(yīng)性矩陣對(duì)圖片進(jìn)行調(diào)整。
為了提高識(shí)別的準(zhǔn)確率,在對(duì)數(shù)字儀表的重要信息識(shí)別前,對(duì)圖像進(jìn)行預(yù)處理。
1)中值濾波
結(jié)合圖像背景考慮,文中采用中值濾波對(duì)圖像進(jìn)行圖像平滑處理。中值濾波是一種非線性的平滑技術(shù),對(duì)于胡椒噪聲和鹽噪聲有非常顯著的影響。中值濾波取當(dāng)前像素點(diǎn)和它周?chē)呐R近奇數(shù)個(gè)像素點(diǎn)的像素值,將像素值排序,取中間位置的像素值作為當(dāng)前像素點(diǎn)像素值。中值濾波原理用式(1)表示為:

式中:Xi,j表示像素點(diǎn)在坐標(biāo)為(i,j)時(shí)的像素值;A為濾波窗口;Med 為中值濾波函數(shù);Yi,j為濾波窗口內(nèi)的中間像素值。
2)圖像形態(tài)學(xué)操作
為簡(jiǎn)化圖像,對(duì)圖像采用形態(tài)學(xué)處理,以提高數(shù)字儀表圖像的質(zhì)量,減少字碼中斷帶來(lái)的影響。膨脹和腐蝕處理是形態(tài)學(xué)運(yùn)算的基礎(chǔ)。設(shè)兩幅圖像X、B,若X是被處理對(duì)象,B是用來(lái)處理X的,那么則把B稱為結(jié)構(gòu)元素。
其中膨脹處理和腐蝕處理分別如式(2)、式(3)所示:

式中:B表示結(jié)構(gòu)元素;X表示為原始圖像。D為X和B的邏輯異或操作的值,B的黑色和X的黑色有一個(gè)對(duì)應(yīng)就讓該個(gè)點(diǎn)為黑色;E為X和B的邏輯與操作的值,B的黑色和X的黑色完全對(duì)應(yīng),就讓該個(gè)點(diǎn)為黑色。
3)圖像二值化
為提高識(shí)別的準(zhǔn)確率,在對(duì)數(shù)字儀表識(shí)別前,對(duì)圖像進(jìn)行二值化處理。對(duì)此,文中采用Otsu 算法,以減少光照和對(duì)比度給二值化帶來(lái)的不利影響。假設(shè)連通區(qū)域S,其像素的灰度范圍表示為[0,255],其中灰度級(jí)x的概率用p(x)表示。Otsu 就是求式(4)得到最大灰度級(jí)m值。

而上述值則為最佳的分割閾值。
Tesseract 是HP 實(shí)驗(yàn)室開(kāi)發(fā)由Google 維護(hù)的OCR 引擎,Tesseract-OCR[12]運(yùn)行過(guò)程:首先將經(jīng)過(guò)預(yù)處理的二值化圖片傳入OCR 引擎中進(jìn)行分析,通過(guò)識(shí)別引擎獲取目標(biāo)區(qū)域,采用自適應(yīng)分類(lèi)器定位文本行、分割字。通過(guò)兩次字符分析識(shí)別使OCR 引擎對(duì)圖片中的模糊區(qū)域進(jìn)行改進(jìn),校驗(yàn)字符是否正確后將圖片識(shí)別輸出文本。Tesseract-OCR 架構(gòu)圖如圖1所示。

圖1 Tesseract-OCR架構(gòu)圖
如圖2 為變壓器鐵芯接地電流測(cè)試儀面板,面板中有操作按鈕和顯示屏2 個(gè)區(qū)域。面板中間部位的電流值和頻率值是測(cè)量的結(jié)果數(shù)據(jù),即該儀器關(guān)鍵信息、數(shù)據(jù)特征為數(shù)值型,面板下部為操作按鈕區(qū)。拍照時(shí)應(yīng)滿足拍攝規(guī)范,如拍攝角度不得過(guò)大,被測(cè)儀器盡量清晰并且大部分處于圖片中。

圖2 變壓器鐵芯接地電流測(cè)試儀面板
利用尺度不變特征變換對(duì)儀器面板進(jìn)行重要數(shù)據(jù)定位,需要對(duì)變壓器鐵芯接地電流測(cè)試儀面板建立標(biāo)準(zhǔn)化模板圖片,如圖3所示。該模板含有足夠的不變特征,將重要信息區(qū)域(電流值、頻率值)用純白色背景替換,減少了干擾特征。

圖3 儀器面板模板圖
對(duì)按要求拍攝情況下變壓器鐵芯接地電流測(cè)試儀圖像進(jìn)行尺度旋轉(zhuǎn)不變特征檢測(cè)并匹配模板照片,其特征點(diǎn)匹配的效果如圖4所示,特征點(diǎn)匹配直線圖表明,該算法能實(shí)現(xiàn)模板的完整匹配。在此基礎(chǔ)上依據(jù)定位流程算法,依次通過(guò)優(yōu)質(zhì)關(guān)鍵點(diǎn)篩選、求解單應(yīng)性矩陣、計(jì)算映射四邊形、圖片旋轉(zhuǎn)擺正、定位截取數(shù)據(jù)等步驟,實(shí)現(xiàn)對(duì)電流值和頻率值的提取,如圖5所示。

圖4 角度不同的特征點(diǎn)匹配圖

圖5 電流值和頻率值的定位提取圖
對(duì)圖片進(jìn)行預(yù)處理后,Tesseract-OCR 對(duì)圖片識(shí)別的效果更佳。因此對(duì)于本次實(shí)驗(yàn)所用儀器樣本,分析由定位算法所得圖片,經(jīng)過(guò)各種方法的驗(yàn)證,得到最佳的處理效果,處理步驟如圖6所示。

圖6 定位圖片預(yù)處理步驟
定位圖片處理結(jié)果如圖7所示。

圖7 定位圖片處理結(jié)果圖
本例圖片是規(guī)則的數(shù)字,根據(jù)Tesseract-OCR 引擎自帶的“chi_sim”字庫(kù)對(duì)這個(gè)字符具有較高的識(shí)別率,識(shí)別結(jié)果如表1所示。

表1 定位圖片識(shí)別結(jié)果
通過(guò)上述方法的試驗(yàn)效果可知(見(jiàn)表2):

表2 不同角度獲得的圖片定位及識(shí)別結(jié)果
1)對(duì)圖片拍攝角度發(fā)生變化時(shí),圖片定位成功率較高,在0°~30°之間高達(dá)100%,在45°時(shí)達(dá)90%。該定位算法實(shí)時(shí)性好、匹配點(diǎn)多,有較多準(zhǔn)確的匹配點(diǎn),400 張隨機(jī)拍攝的樣本整體定位成功比例高于97.5%,證明該算法穩(wěn)定性好,具有一定的魯棒性。
2)通過(guò)對(duì)比定位圖片前后的識(shí)別率,處理后的圖片識(shí)別率遠(yuǎn)高于處理前的,高達(dá)95%以上,證明圖片經(jīng)過(guò)預(yù)處理后形成的二值化圖片更適合放在Tesseract-OCR引擎中識(shí)別。
在變電檢測(cè)現(xiàn)場(chǎng)中,為了有效減輕檢測(cè)人員儀器讀數(shù)工作強(qiáng)度,避免人工讀數(shù)誤差,用相機(jī)對(duì)試驗(yàn)儀器進(jìn)行圖像獲取,文中提出基于SURF+OCR對(duì)變電檢測(cè)儀器數(shù)據(jù)定位識(shí)別的方法,設(shè)計(jì)了在變電檢測(cè)現(xiàn)場(chǎng)可能出現(xiàn)的情況,對(duì)400 張受拍攝角度影響的情況下的隨機(jī)樣本圖片進(jìn)行SURF 定位算法測(cè)試,樣本整體定位成功率高于97.5%。對(duì)定位的樣本圖片進(jìn)一步預(yù)處理,利用Tesseract-OCR 引擎對(duì)定位樣本圖片進(jìn)行識(shí)別,識(shí)別率高達(dá)95%以上。在特定場(chǎng)景下的儀器圖片,經(jīng)預(yù)處理后識(shí)別效果仍不佳,可以訓(xùn)練該類(lèi)儀器專屬的字符庫(kù),以提高識(shí)別率。因此,文中所提出的方法具有一定的工程實(shí)踐價(jià)值。