張思俊,王樂樂,宦 海,陸振宇
(南京信息工程大學電子與信息工程學院,江蘇南京 210044)
隨著智能手機的普及,信息分享的速度越來越快。很多人喜歡用手機隨時拍下自己的所見所聞。例如,在課堂上,如果來不及記錄老師的PPT,很多同學會用手機直接拍下黑板上的影像回去再慢慢整理。不過,由于手機的拍攝功能遠沒有相機專業,加之多是在1~2 s的短時間內迅速完成的拍照,更無暇考慮光線的問題,因而導致拍攝的內容不清晰。這種在不規則光線下拍攝的圖片上會出現大塊的陰影、噪聲點或者是局部出現高光,直接影響了有效信息的讀取。針對這些問題,提出了自適應閾值處理分割的有效信息提取方法,較好地解決了問題。
對于原始圖像首先是進行前期處理,這樣可以濾除一部分噪聲的影響以及其他一些無關信息,增強圖像的品質以便于之后的分割。通常圖像預處理過程包括:數字化、幾何變換、歸一化、平滑、復原和增強等步驟[1]。但文中的預處理主要是進行圖像灰度化處理,將彩色的原始圖像轉換為灰度圖。此時顏色并不是目標信息,灰度處理能降低需要處理的信息量,排除不必要的干擾。在處理后圖像的基礎上再進行前景背景的分割,效果會更好。圖1是原始圖像和經過預處理后的圖像。

圖1 原始圖片與預處理圖片對比
通常圖像二值化是一種特殊的閾值分割法。設原始圖像為f(x,y),按一定的準則在原始圖像f(x,y)中找到特征值T,將圖像分割為兩個部分。如指定b0=0(黑),b1=1(白),得出的就是二值化的圖像[2]。閾值分割方法是在區域圖像分割技術的基礎上,像上述這樣通過設定不同的特征閾值,對圖像像素點進行分類,再按照特征閾值進行分割的方法。閾值分割方法分為:基于點的全局閾值方法、基于區域的全局閾值方法、局部閾值方法以及多閾值方法[3]。針對不規則光照下的圖像,由于陰影、噪聲、局部高光和不規則邊緣等復雜因子的存在,并不能找到一個有效的單一閾值,這時如仍采用單一的全局閾值分割方法,會將目標區域和背景區域混淆,導致錯誤劃分。
自適應閾值分割的思想,即圖像中的每個像素點對應的閾值有可能不相同。一個比較簡單的自適應閾值選取方法是:每個像素的閾值由以自身為中心的一個鄰域內的窗口確定,該鄰域的中值、均值、或者高斯卷積都可以作為閾值,另外還可以在此基礎上加上一個常量等。
自適應閾值分割是建立在局部多閾值方法上。將圖像劃分成若干個子圖像(F1,F2,F3,…,Fn),每個子圖像再根據自身的顏色分布等特征劃分多個鄰域(M1,M2,M3,…,Mn),這樣劃分出來的鄰域足夠小并具有一定的代表性,整個大圖就有很多個閾值(a1,a2,a3,…,an),圖2所示是這種方法的原理示意圖。若劃分夠多,每個閾值近乎可以代表原來那個像素點的灰度值。采用自適應劃分閾值的方法,對于照明不均而使畫面變得復雜的圖像,它的多個局部特征得到保留,就可有效地避免背景和有效信息的錯誤劃分[4-5]。

圖2 自適應閾值劃分原理示意圖
文中設計的算法包含兩個Matlab代碼,將自適應閾值分割算法作為函數調用。圖3是分割后的結果。

圖3 提取出的前景圖像
進一步對初步提取的目標圖像進行圖片質量增強。分割后的圖片中可能還存在一些噪聲,可以通過中值濾波去除獨立存在的噪聲,如果噪聲比較多而且分布得較分散,則采用均值濾波,一般采用3×3的窗口再進行二值化增強效果較好。如果目標圖像中的字母,文字等比較模糊,可以采用Sobel算子進行銳化處理。圖4是使用圖片的實際效果進行增強后的結果。

圖4 增強處理后的目標圖像
對比圖2和圖3,通過坐標定位,圖3去除了一些不需要的背景線條,使目標區域更加突出。通過均值濾波去除了部分噪聲點,目標圖像更加清晰。
文中對多幅不規則光照下拍攝的圖像進行了分割實驗,圖4是另外兩組圖片的原始圖像和自適應閾值分割后的圖像。經多次實驗發現,對于英文、數字、圖形類似的對象,采用文中方法提取出的效果較好,對于筆畫多的漢字,由于光照不均已經造成文字模糊,識別更加復雜。

圖5 另兩組圖片的識別效果
文中所提出的自適應閾值分割方法,能夠較好地解決不規則光照下圖像中陰影、高光等造成的模糊問題,快捷有效地提取目標圖像,從而方便人們讀取有用信息。文中提出的方法針對拍攝到的書本文字圖像、PPT投影圖像、文件等圖片前景的提取效果較好。
[1]錢蘇斌.基于四鄰域檢索的自適應閾值分割方法[J].成都大學學報:自然科學版,2011(3):239-241.
[2]迂雪峰,吳慶洪.美元圖像的自適應閾值分割方法[J].現代電子技術,2007(8):96-100.
[3]楊星,陸宇平.一種用于彩色圖像目標識別的自適應閾值分割方法[J].計算機與數字工程,2006(8):15-17.
[4]高旭輝.一種自適應閉值分割方法[J].紅外與激光工程,2006(10):167-170.
[5]趙仕良.一種用于彩色圖像處理的自適應閾值分割方法[J].四川師范大學:自然科學版,2002,25(4):405 -408.
[6]冉隆科.一種基于檢測方法的骨齡圖像關鍵點定位[J].電子設計工程,2011(14):181-183.