楊遠(yuǎn)航,張 鑫,石恒初,張榮奎,孔德志
(1.云南電力調(diào)度控制中心,云南昆明 650011;2.云南云電同方科技有限公司,云南 昆明 650200)
電網(wǎng)設(shè)備的運(yùn)行維護(hù)工作是電力工業(yè)中的基礎(chǔ)環(huán)節(jié),正常電力運(yùn)維的工作主要包括設(shè)備的日常巡視、設(shè)備的缺陷管理和檢修、設(shè)備臺(tái)賬的維護(hù)以及設(shè)備隱患管理[1]。運(yùn)維工作需要處理的事務(wù)較多,繁瑣費(fèi)時(shí),為了提高工作效率,對(duì)電網(wǎng)設(shè)備臺(tái)賬輸入的方式進(jìn)行創(chuàng)新使用,以往臺(tái)賬輸入多依賴于人工,電力設(shè)備臺(tái)賬輸入自動(dòng)化的創(chuàng)新使用節(jié)省了大量人力。電力設(shè)備臺(tái)賬輸入的自動(dòng)化主要通過(guò)電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能實(shí)現(xiàn),通過(guò)標(biāo)簽采集功能,自動(dòng)獲取電網(wǎng)設(shè)備臺(tái)賬信息[2]。以往使用的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能多數(shù)受到使用平臺(tái)的限制,存在兼容性差的問(wèn)題,因此,采用OCR 技術(shù),設(shè)計(jì)基于OCR 技術(shù)的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能[3-5]。將該技術(shù)應(yīng)用在電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能中,減少人力手動(dòng)輸入的時(shí)間,大幅度提升工作效率,同時(shí)解決以往電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能存在的兼容性差的問(wèn)題。
電網(wǎng)設(shè)備臺(tái)賬多數(shù)以文本圖像的形式存在,其中包含大量的文本信息,為電網(wǎng)設(shè)備制定合適大小的臺(tái)賬標(biāo)簽,利用OCR 技術(shù)識(shí)別標(biāo)簽,獲取其中的電網(wǎng)設(shè)備信息,通過(guò)采集功能采集到計(jì)算機(jī)中。
通常采用光學(xué)掃描儀使用OCR 技術(shù)識(shí)別圖像,分辨率是重要參數(shù),描述了在空間上的精細(xì)程度[6]。獲得圖像后,對(duì)圖像進(jìn)行預(yù)處理,圖像預(yù)處理的好壞將會(huì)直接影響OCR 技術(shù)的實(shí)際識(shí)別能力,預(yù)處理主要包括二值化、去噪、形變反變換等[7-8]。
經(jīng)過(guò)二值化處理的圖像前后顯示如圖1 所示。

圖1 二值化處理前后文本圖像
其處理過(guò)程主要利用二值數(shù)學(xué)形態(tài)學(xué),其基本運(yùn)算包括膨脹、腐蝕[9]。在形態(tài)變換過(guò)程中,將結(jié)構(gòu)元素設(shè)置為Q(r),對(duì)工作空間W中的每一點(diǎn)r,膨脹的定義為:



圖2 預(yù)處理后的目標(biāo)圖像
從圖中可以明顯看出,與原始的目標(biāo)圖像相比,經(jīng)過(guò)預(yù)處理后的圖像更加清晰,空白處也得到了填補(bǔ)。
在完成圖像預(yù)處理操作后,得到二值圖像。使用OCR 技術(shù)識(shí)別圖像文本信息特征,OCR 識(shí)別文本信息關(guān)鍵在于字符分割和特征提取。利用光學(xué)儀器掃描目標(biāo)圖像后[13],借助圖像的水平投影實(shí)現(xiàn)行切分,水平投影和垂直投影效果如圖3 所示。

圖3 文本圖像投影效果
投影的計(jì)算公式如下:

找到最后一條黑色像素點(diǎn)個(gè)數(shù)為0 的白色文本行,將其標(biāo)記為L(zhǎng)ine(i++),作為行文本的上下分界線,依此找滿足條件的邊界線,完成文本圖像行切分。
字符切分需借助圖像的垂直投影實(shí)現(xiàn),垂直投影的計(jì)算公式如式(5)所示。

掃描文本圖像像素矩陣,將最后一個(gè)不等于0的垂直線段記為C(i),將第一個(gè)等于0 的垂直線段記為C(j),位于C(i)和C(j)之間的字符就是切分的單一字符,繼續(xù)執(zhí)行掃描操作,確定所有字符的左右分界線,完成字符切分任務(wù)。
由于某些英文字符和中文字符是合體字,字符之間的間隔區(qū)分不明顯,在切分時(shí),容易造成字符的錯(cuò)誤切割[14]。因此對(duì)英文字符和中文字符分別采取不同的解決方案,避免出現(xiàn)誤判的情況。對(duì)于等寬字符,采用固定寬度的滑動(dòng)窗口進(jìn)行字符隔離;對(duì)于非等寬字符,模糊處理寬度值大于平均值的字符,重新切分下一個(gè)切分點(diǎn)的英文字符。
對(duì)于中文字符,根據(jù)垂直投影將文本切割成單個(gè)字符,再根據(jù)字符寬度分類,得到正確的字符寬度后進(jìn)行二次分割[15]。中文字符分割流程如圖4 所示。

圖4 中文字符分割流程圖
通過(guò)上述過(guò)程將電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽文本圖像中的字符進(jìn)行切分,達(dá)到提升文本圖像質(zhì)量的目的,進(jìn)而提取文本圖像中的字符結(jié)構(gòu)特征。結(jié)構(gòu)特征指的是字符本身具有的特點(diǎn),用于標(biāo)識(shí)出唯一漢字。
天葬師仍然沒(méi)有轉(zhuǎn)頭,直到顫巍巍地走出幾步之后,回答的聲音才終于響起:“天葬師也無(wú)權(quán)駁回任何一個(gè)族人提出的,關(guān)乎云浮興衰存亡的訴求!”
計(jì)算每個(gè)像素點(diǎn)的方向線索特征,根據(jù)組成漢字的基本元素以及其元素的反方向一共構(gòu)成一個(gè)8維的方向矢量,如圖5 所示。

圖5 方向矢量示意圖
依據(jù)圖5 所示方向矢量圖,計(jì)算8 維矢量的和,最后得到一個(gè)128 維的矢量就是文本圖像字符方向像素矢量特征。
設(shè)計(jì)電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能,將其與服務(wù)器直接進(jìn)行數(shù)據(jù)交互,使用OCR 相機(jī)對(duì)標(biāo)簽進(jìn)行拍攝[16],通過(guò)上述圖像預(yù)處理與特征提取過(guò)程,得到文本信息,將標(biāo)簽信息整合并傳送至服務(wù)器中。
控制相機(jī)拍攝電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽,使用OCR 技術(shù)對(duì)相機(jī)拍攝到的圖像進(jìn)行光學(xué)字符識(shí)別處理,將文本信息轉(zhuǎn)換為字符串,上傳至服務(wù)器并存儲(chǔ)在本地?cái)?shù)據(jù)庫(kù)中。采集功能的實(shí)現(xiàn)主要依賴于通信接口電路,保證采集的信息安全合理地傳輸至數(shù)據(jù)庫(kù)中。
使用常用的RS-232 標(biāo)準(zhǔn)串口進(jìn)行通信,由于RS-232 標(biāo)準(zhǔn)采用-15~-3 V 和+3~+15 V 電平范圍定義邏輯“1”和“0”,方便提高數(shù)據(jù)傳輸?shù)目垢蓴_能力,由此設(shè)計(jì)RS-232 通信接口電路,如圖6 所示。

圖6 RS-232通信接口電路
通過(guò)設(shè)計(jì)的通信接口電路,使得經(jīng)過(guò)OCR 技術(shù)處理并識(shí)別的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽信息能夠傳輸至數(shù)據(jù)庫(kù)中,保證采集功能正常運(yùn)行。至此,基于OCR技術(shù)的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能設(shè)計(jì)完成。
一般情況下,電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能依賴于計(jì)算機(jī)系統(tǒng),針對(duì)以往的采集功能存在兼容性差的問(wèn)題,電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能仿真測(cè)試基于Windows 系統(tǒng)實(shí)現(xiàn),在計(jì)算機(jī)中使用數(shù)據(jù)模擬器生成隨機(jī)的數(shù)據(jù)流,使用基于不同技術(shù)的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能采集數(shù)據(jù),通過(guò)采集完成后的反饋結(jié)果,分析基于不同技術(shù)的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能的兼容性。命令執(zhí)行界面如圖7 所示。

圖7 數(shù)據(jù)流隨機(jī)生成命令執(zhí)行界面
隨機(jī)選取的數(shù)據(jù)流相關(guān)屬性如表1 所示。

表1 測(cè)試數(shù)據(jù)屬性
為了保證功能測(cè)試的公平性,使用表中隨機(jī)生成的數(shù)據(jù),測(cè)試基于不同技術(shù)的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能。
使用基于RFID 技術(shù)的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集方法獲得測(cè)試結(jié)果1,使用基于機(jī)器學(xué)習(xí)的采集功能獲得測(cè)試結(jié)果2,使用基于OCR 技術(shù)的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽功能獲得測(cè)試結(jié)果3。具體的測(cè)試結(jié)果如圖8所示。
從圖8 顯示結(jié)果中可以看出,測(cè)試結(jié)果1 中的第3 組和第5 組出現(xiàn)請(qǐng)求未響應(yīng)情況,第6 組和第9組測(cè)試出現(xiàn)請(qǐng)求超時(shí)的情況;測(cè)試結(jié)果2 中同樣第3組存在請(qǐng)求未響應(yīng)的情況,第5 組和第10 組存在請(qǐng)求超時(shí)的情況;測(cè)試結(jié)果3 中測(cè)試結(jié)果正常,未出現(xiàn)異常情況。綜上所述,設(shè)計(jì)的基于OCR 技術(shù)的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能比其他兩種更加完善,沒(méi)有出現(xiàn)異常情況,兼容性更好。

圖8 基于不同技術(shù)的采集功能測(cè)試結(jié)果
電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能的出現(xiàn)對(duì)電網(wǎng)設(shè)備的管理與巡檢有重要意義,通過(guò)采集功能大大節(jié)省了電網(wǎng)設(shè)備巡檢和管理所需的人力物力,提高了工作效率。文章通過(guò)設(shè)計(jì)基于OCR 技術(shù)的電網(wǎng)設(shè)備臺(tái)賬標(biāo)簽采集功能,解決了以往采集功能中存在的問(wèn)題,通過(guò)應(yīng)用OCR 技術(shù)使得電網(wǎng)設(shè)備調(diào)賬標(biāo)簽采集功能兼容性更好。