邢方方
摘 要:現代科學技術的快速發展,在一定程度上推動了文檔圖像分類處理工作的進步。結構化的局部邊緣處理模式在文檔圖像處理工作方面得到了普遍的推廣,該算法能夠將鄰域中的空間分布結構精確的描述出來,提高了圖形文檔的區分能力。本文通過試驗的方式和HOG進行了對比,并對四種文檔類型特征進行了分類,探究了結構化局部邊緣模式下的文檔圖像分類處理。
關鍵詞:結構化局部邊緣模式;文檔圖像;模式分類
目前,文檔圖像具有很多種模式形態,其分類方法也多種多樣。在過去,人們比較常用的分類方法是光學字符識別系統,該系統主要根據文本特征、結構特征、混合特征三種方法對文檔進行識別分類,但是該分類方法的分類速度比較慢,對所處理圖像解析度的要求比較高。因此,該方法逐漸被結構化局部邊緣模式分類方法所替代。
1 結構化局部邊緣模式下處理圖像分類的預備知識
文本管理工作主要包括:壓縮、管理、歸檔、文本分析等,在進行文檔工作處理的時候,相對準確的文檔類型信息能夠有效的提高文本檢索的速度以及工作人員的工作效率。文檔具有多種模式形態,每種形態都有自己的獨特性以及形態之間的相似性。結構化局部邊緣模式的使用,不僅可以實現對圖像分割模式的自由調節,還能夠有效的提高文檔圖像特征提取的準確性,在使用結構化局部邊緣模式進行文檔圖像特征提取的時候,采用的是圖像區塊之間重疊的方法,通過這種方式有效的確保圖像分割區域特征本身的連貫型性。
2 采用結構化局部邊緣模式下,文檔圖像分類特征的提取
本文在對結構化局部邊緣模式下文檔圖像分類處理的研究中,進行分類對比采用的是HOG。結構化局部邊緣系統通過LEP特征,根據圖像像素鄰域的邊緣方向進行了相關的編碼。文檔圖像本身特征就比較明顯,例如影像圖片的像素數值變化比較大;一般學術論文的格式比較規整且字數比較多;灰度圖像之相似性比較大,沒有明顯的規律可循;表格文件的特征性比較明顯,橫線和豎線比較多;PPT幻燈片的圖像、文字等變化性比較明顯,但是在排版方面具有一定的規律可以遵循,為了方便結構化局部邊緣模式在處理文檔圖像方面的研究工作,上述幾種圖像類型的邊緣信息都比較明顯。
3 結構化局部邊緣模式和HOG的主要特征
3.1 模式分類框架
文中在進行結構化局部邊緣模式下,文檔圖像的分類處理研究中,還沒有形成一一個完整通用的基準數據庫進行相關的實驗研究,并且受其它因素的限制也比較明顯。所以,本文在進行處理研究的時候,通過綜合對比研究選取了含有5000張圖像并具有四種文檔圖像類別,每種類型都包含1250張圖像,類型包括:影像圖片、學術論文、PPT幻燈影片以及含有表格的文件。另外,在進行文檔圖像處理研究時,圖片都是隨機獲取的。
3.2 結構化局部邊緣模式的特征描述
結構化局部邊緣模式主要是利用計算機模擬技術對對視覺、圖像等進行處理,在使用的過程中,根據圖片中重復出現的不同pixel,并將其按照不同的方向延伸成九宮格的形狀作為參考的重點。在模式計算的過程中,首先要獲取到原始的邊緣圖像,并建立一個3*3的鄰域窗口,在這一過程中,文本會被分為比較小的空間區塊,其計算方式為:結構化局部邊緣模式(SLEP)=Ni/N,i=0,1,2,…31,其中結構化邊緣模式的變化范圍是在0到31之間,Ni中的i代表的是pixel的數目,n代表的是piexl的總數目。
3.3 HOG的特征描述
HOG特征是目前人們比較常用的圖像特征提取方法,該方法在計算的時候選取的是320*256的圖像區域,在此基礎上,把區塊的大小劃分為32*32,其中九宮格的大小為16*16,將九宮格的每一格作為最基本地計算單元,然后進行相關的串聯計算。方法步驟如下。第一,可以對圖像進行卷積處理,目的是了解圖像中像素的梯度以及方向變化,一般將范圍值控制在[-1,0,1]或者是[1,0,-1]。第二,對每個格子進行量化處理,角度量化的范圍值是[0,180],然后根據每個像素的模建立九維方向角直方圖。第三,把區塊內部各格子之間的直方圖進行串聯處理,然后組成36維直方圖的特征向量。第四,把所有的特征向量串聯在一起,就會形成最后的直方圖特征向量。
4 結構化局部邊緣模式的處理分析
在對上述四種類型的圖像特征進行信息提取研究以后,了解到在進行圖像分析的過程中,圖像的解析度分別為:80*64,160*128,這組數據說明和HOG相比,結構化局部邊緣模式在運用過程中性能效果比較好,分辨率也比較高。這說明結構化局部邊緣系統在不適用OCR系統的條件下,也具有高質量的文檔圖像分辨率。當圖像大小為80*64,文檔圖像的類別為影像照片以及規范化的學術論文的時候,SLEP測試效果要比HOG高0.1到1.6個百分點,但是當進行表格文件處理的時候,百分點就會比HOG的百分點低,當進行PPT幻燈片測試的時候,百分點又會比HOG高,這表明,結構化局部邊緣模式在文檔圖像處理的時候,使用整體效能比較高。當圖像大小逐漸變大的時候,除表格文件的測試百分點比較低之外,其余也呈現逐漸增高的現象。上述研究表明,當圖像文檔比較混亂的時候,梯度方向呈現混亂的狀態,進行文檔圖像、影片特征分類會比較方便,但是在進行表格文檔處理的時候,使用HOG取得的效果會更加的明顯。
[參考文獻]
[1]康勤,邱開金,肖國強.基于塊邊緣模式的圖像內容描述符[J].計算機科學,2010(5).
[2]朱慶生,張敏.一種優化的文檔圖像分割方法[J].計算機科學,2009(4).