摘要:復雜背景圖象字符特征檢取方法的研究,因存在背景紋理及顏色的不確定性、圖像退化、字符缺損、字符種類多等眾多不利因素,已成為當前字符特征檢取研究中的難題;本課題主要對復雜背景圖象下字符定位切割、字符特征提取方法作比較深入的研究,在以往研究基礎上提出一種比較實用準確有效的檢取算法,并以視頻流圖象幀背景下的中文字符特征檢取為例,運用此檢取算法建立一種系統的實現模型。
關鍵詞:字符特征檢?。荒p字符;圖象退化
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2008)05-10ppp-0c
1 引言
目前字符圖象的分割檢取與識別技術受到廣泛關注,已應用于多個研究領域如復雜目標定位、手寫體和印刷體文字的識別等。然而對復雜背景圖象中字符檢取與識別研究,因存在背景紋理及顏色的不確定性、圖像磨損退化、字符缺損、字符種類多等許多不利因素 ,已成為當前字符檢取與識別研究中的難題。因此,對復雜背景圖象字符檢取與識別實用有效算法方面的研究,并建立該算法的系統實現模型,將有著非常廣闊的應用前景與經濟理論價值。
字符特征檢取本質是一種目標定位,就是運用一定的方法提取目標的特征,并根據一定的準則將它們相互區別;在復雜的背景中字符區域往往只占圖像的一小部分,特別是在字符區域字符磨損等不利因素影響的情況下,準確快速地切割與提取字符區域非常困難;目前,在字符圖像分割、預處理、字符特征提取和識別等方面,國內外學者主要集中在一般字符圖象的字符檢取與識別方法的分析應用研究,它們對普通字符的字符檢取識別率比較高,而對漢字字符檢取識別率非常低,尤其在磨損字符的復雜背景圖象中對中文字符的字符檢取識別率更低,并且在原始字符點陣恢復方面的算法研究也甚少?;谏鲜鲞@些情況,本課題主要對復雜背景圖象下字符定位切割、字符特征提取方法作比較深入的研究,在以往研究基礎上提出一種比較實用準確有效的檢取算法,并以視頻流圖象幀背景下的磨損中文字符特征檢取為例,運用此檢取算法建立一種系統的實現模型。
2 字符定位、分割與特征提取方法概述
從復雜背景圖象中提取字符,因圖象的背景復雜且光照不均,對比度較低或模糊,給字符定位帶來了很大的困難,在課題研究中提出了一種綜合Canny算子作邊緣檢測、主動輪廓模型作圖象局部分割和種子填充作可疑區評測相結合的字符區域定位方法。由于文字區域邊緣比較豐富,使用Canny算子作邊緣檢測,得到圖象的邊緣圖,然后在此圖象進行水平掃描,進行紋理,再輔助以顏色分割,可得到圖象中字符的可疑區域;在得到的可疑區域中檢測出真正的字符區域,由于光照不均勻,以及不知道字符的灰度值所處的閾值范圍,使得在使用以往的閾值分割很難適用各種復雜的情況,改進的主動輪廓模型局部分割可疑區域則由于對光照不敏感,可以取得很好的效果。分割出局部圖象之后,再進行開運算,運用開運算中的膨脹運算可填充字符區域中的空洞,增加字符的連通性,腐蝕運算消除細小物體和在纖細處分離的部分,從而起到消除噪聲和其他無用細節信號的作用,提高了定位字符區域位置的準確性;然后通過種子填充法作字符連通分析,生成許多小字符,作為判斷可疑區域是否是真正的字符區域的一個最重要的指標,通過加以如可疑區域顏色是否相通,小字符長寬以及比例等判斷指標,較可靠檢測出真正的字符區域。
為了檢取定位區域中的字符特征,必須將字符從字符區域中分割出來,字符的分割方法很多,其中最常用是基于投影分析的波峰—波谷法投影法,它對于規格比較統一、字符分離清晰的字符區域比較有效,但在實際問題中由于定位往往不能精確定位字符,使得分割出來的區域中包含其他背景,加上噪聲干擾、光照不均或污染,會出現字符傾斜、字符粘連和斷裂等現象,使得直接使用投影法很難達到理想的效果,在字符分割過程中運用了一種高效的基于極大方差的校正方法,有效地改進了傳統的投影法,并綜合了形態學與標志法相結合的字符切割方法,兩種方法相結合進行字符切割,實驗中取得了良好的效果。
字符特征檢取是字符模式識別的一個重要環節,抽取穩定有效的字符特征是字符識別系統成功的關鍵。字符特征檢取主要有兩類方法:統計方法和結構方法,統計方法具有良好的魯棒性,較好的抗干擾抗噪聲、抗筆畫的粘連與斷裂等特性,它一般按一定的距離度量匹配準則,采用多維特征值累加的辦法,把局部噪聲和微小畸變淹沒在最后的累加和中,但是它區分相似字的能力較差;而結構方法對結構特征較敏感,區分相似字的能力較強,但是結構特征難以抽取,不穩定。因字符具有二維結構,單純用統計特征或者結構特征很難反映字符的特性,所以一種有效的字符特征應將統計特性與結構信息結合起來,將字符筆畫的特性與字符背景特性結合起來,目前在字符檢取與識別中最為有效的字符特征主要有方向線素特征,四平面筆畫穿透數目特征、細胞特征等。在字符特征的檢取研究過程中,通過優化字符的幾何特征,不變矩特征,圖像熵特性,結構特征和統計特征等多種特征的優點,使多種字符特征互為補充進行特征提取,大大減少了字符檢取與識別的“死角”,同時運用特征互補算法使磨損字符恢復原始字符點陣,提高了異常字符的檢取與識別效率;
3 系統模型實現
基于以上字符定位、分割與特征提取方法,以視頻流中圖象幀的字符檢取為例,建立字符檢取識別系統的系統模型。從MPEG視頻流中檢取文字主要是利用圖象中紋理所具有的方向性特點,首先直接在DCT域中提取字符橫向、豎向、斜向文理的方向信息,然后根據各自的閾值把字符區域從圖象背景中分割出來。在處理過程中,用形態濾波的方法可有效地消除噪音點。視頻流中圖象幀去噪與預處理后,具體的系統模型實現流程如圖1所示:

圖1 系統模型實現流程圖
4 結束語
本文實現了復雜自然背景下字符區域的自動定位和字符檢取的系統方案。在實驗中提出了一種綜合Canny算子作邊緣檢測、主動輪廓模型作圖象局部分割和種子填充作可疑區評測相結合的字符區域定位方法,通過實驗表明,它具有定位準確、速度快,對光照不均勻背景不敏感等優點;在圖象校正方面,本文提出魯棒高效的基于極大方差的文字圖象校正方法,實驗證實相對其它如hough檢測傾斜校正等方法具有更高效更準確的特點;在特征提取方面,實驗中利用“組合優化特征”的綜合檢取識別方式,充分發揮各個特征的長處,從而提高字符檢取識別效率??傊?,在字符定位分割與特征提取過程中,通過算法的改進使用,在目標定位準確性、字符特征檢取的有效性等方面獲得非常好的效果,其中某些算法可以應用于復雜目標定位、人臉識別、車牌識別、指紋識別、條形碼識別等許多應用場合。
參考文獻:
[1]楊楊,張田文.基于多分辨率方法的主動輪廓線跟蹤算法[J].計算機學報,1998,21(3):210-216.
[2]鄒榮金,蔡士杰,張福炎,等.字符粘連及字線相交的分割與識別方法[J].軟件學報,1999.
[3]莊越挺,劉駿偉,吳飛,等.基于支持向量機的視頻字幕自動定位與提取[J].計算機輔助設計與圖形學學報,2002(8).
[4]梁路宏,艾海舟,肖習攀,等.基于模板匹配與支持矢量機的人臉檢測[J].計算機學報,2002,25(1):22-29.
收稿日期:2008-01-13
作者簡介:孫德超(1978-),男,湖北人,浙江萬里學院實驗師,從事軟件工程,嵌入式系統方向的研究;陳冬亮(1975-),男,浙江人,浙江萬里學院講師,從事圖形圖象處理、控制、管理信息系統等計算機應用研究。