楊 肖,徐 曉
(華南理工大學理學院,廣東廣州 510640)
圖像分割是一種重要的圖像技術,分割的好壞將會直接影響信息提取的精確性和快速性,因此,無論是在理論研究領域還是在實際應用中都得到了廣泛的重視[1]。針對不同彩色圖片上的信息,基于彩色圖像的分割方法早已呈現出了多樣化和差異化。文獻[2]提出了多種常用的彩色圖像分割的方法,其中指出彩色圖像分割由灰度圖像分割方法和彩色空間組合而成,為彩色圖像的分割提出了方法論。文獻[3]基于HSV空間提出了顏色距離的思想,并運用改進后的Sobel算子,有效結合了顏色信息和空間信息實現了彩色圖像邊界的提取。文獻[4]為了突顯彩色圖像中的重要區域,采取顏色分類和圖像細節區域檢測的組合的方式提取出了特殊區域。
不同的彩色圖片可以提取不同的信息,相同的彩色圖片也可以提取出不同的信息[5,6]。本文為了提取儀器儀表上的字符,提出一種基于顏色空間和遺傳算法分割圖片的算法。選取HSV空間為顏色空間,H分量作為粗分割的主信息,然后采用遺傳算法細分割,實現字符的提取。
HSV(hue,saturation,value)顏色空間是一種均勻的顏色空間,比較接近人眼的色彩感知,它可以用一個圓錐空間模型來描述,如圖1。色彩H,S包含顏色信息,而V與色彩信息無關。色調H由繞V軸的旋轉角給定。紅、綠、藍分別相隔120°,每一種顏色和它的補色相差180°。色彩S代表純度,是所選顏色的純度與該顏色最大的純度之間的比率,范圍為0~1。色彩V代表色彩的明亮程度,范圍為0~1。

圖1 HSV空間Fig 1 HSV space
將彩色圖像(0~255)上所有點從RGB空間轉換到HSV空間,可以由下面的程序轉換

根據如上轉換定義,H的范圍為[0°,360°],S,V的范圍均為[0,1]。
圖片轉換到HSV空間后,分別提取出H,S,V,將H分量中大于0.8小于1的像素點濾掉,然后統計分割出H分量小于0.1 的像素點(0.1,0.8,1 是經過試驗仿真測試得出的最佳臨界點)。用Matlab所寫代碼如下:

遺傳算法(GA)以自然選擇和遺傳理論為基礎,模擬達爾文的遺傳選擇和淘汰的生物進化過程,對群體反復進行基于遺傳學的操作。根據預定的目標適應度函數對每個個體進行評價,依據適者生存、優勝劣汰的進化準則,不斷得到更優的群體,同時以全局并行搜索方式來搜索優化群體中的最優個體,以求得滿足要求的最優解[7]。
基本遺傳算法可表示為

式中 C為個體的編碼方法;E為初始種群;M為種群大小;Φ為選擇算子;Γ為交叉算子;Ψ為變異算子;T為遺傳運算終止條件。
利用遺傳算法進行圖像分割的基本思想是,把圖像中的像素按灰度值用閾值M分成兩類圖像,一類為目標圖像C1,另一類為背景圖像C2。圖像C1由灰度值在ML-M之間的像素組成,圖像C2由灰度值在M-MH之間的像素組成。其中ML為圖像中最小的灰度值,MH為最大的灰度值,MA為平均值。
對于任意一副彩色圖像,其灰度圖上各個像素點的灰度值處在0~255之間,采用二進制編碼方式,用長度為8的染色體即可表示出所有灰度值,即0~28。本算法中,一副圖片進行粗分割后,統計計算出灰度圖的最大值M1和最小值M2,不同的圖片其最大值和最小值動態變化。
隨機生成的初始種群大小為40,個體的染色體編碼有一定的大小范圍,不同的圖片、不同的字符在不同的光照下,其灰度的最大值和最小值均不同,因而,其隨機生成的初始種群也不同,初始種群用Chrom數組表示。
將粗切割出的圖像上的所有像素點的灰度值均一與初始種群中的動態灰度值M進行比較。大于灰度M的像素點個數為O1(M),平均灰度為U1(M)。小于或等于灰度M的像素點為O2(M),平均灰度為U2(M),選取的灰度適應度函數表達式為f(M)=O1(M)·O2(M)·[U1(M)-U2(M)]2,適應度值越大,遺傳概率越大。
不同條件下,最優適應度不同,根據每幅圖片中的最大值、最小值、均值和灰度直方圖,經過測試仿真,灰度最優適應度值出現在灰度為1.1MA±5%左右(MA為平均灰度)。
2.4.1 選擇算子
個體的差異性使個體在環境中體現出的適應性不同,根據種群個體適應度評價函數的高低排序,Matlab條件下選擇算子代碼為 select('SUS',Chrom,FitnV,0.9)。SUS 代表隨機遍歷抽樣,Chrom是初始種群矩陣,FitnV是包含初始種群的個體適應度的列矩陣。從父代復制到子代的選擇率為 0.9。
2.4.2 交叉算子
交叉算子在遺傳算法中起著至關重要的作用,是產生新個體的主要方法,本算法中,交叉算子Matlab條件下所使用的代碼為:recombin('XOVSP',SelCh,0.7),XOVSP 代表單點交叉,Selch代表交叉矩陣,0.7為單點交叉率。
2.4.3 變異算子
變異算法決定了遺傳算法的局部搜索能力。變異率太大會破壞優秀個體的繼承,變異率太小則不利于收斂。本算法中,變異算子 Matlab條件下所使用的代碼為:mut(SelCh)。缺省值變異率PM=0.7/Lind,即 0.0875。
為了采集到研究最終需要的信息,本算法基于實驗的不斷測試,采用的停止準則如下:自行遺傳一定的代數,判斷閾值是否符合最優的適應度算子,如符合,則輸出閾值并得出二值化圖像做進一步處理,如不符合,則重新刷新初始種群和遺傳代數直至得到最優解。
為了對儀器儀表中的關鍵字符信息進行快速提取,基于HSV空間和遺傳算法的圖像分割步驟(如圖2)。
1)顏色空間轉化:根據式(1)將目標圖像從RGB空間轉換到HSV顏色空間;
2)粗分割:在H分量圖進行去噪處理后分割出最大的黑色區域。映射到RGB空間即可實現粗分割;
3)細分割:對粗分割出的區域的灰度進行估量進而確定了遺傳算法初始種群的灰度區域,然后基于遺傳算法實現目標信息和背景的分離,進而提取出了字符信息。

圖2 分割流程圖Fig 2 Flow chart of segmentation
本算法基于Matlab R2009a對1000幅不同條件下儀器儀表上的數值字符進行了測試提取,不同的光照環境條件下,本算法均切實可行地分割出了目標字符。
本文以隨機抽取的三幅圖像作為樣本(如圖3樣本圖1、樣本圖2與樣本圖3),樣本圖1與樣本圖2是基于相同的光照下的不同的字符提?。ㄏ嗤瑮l件條件下不同信息的提?。?,樣本圖2和樣本圖3是相同的字符在不同光照條件下的分割提取(不同條件下相同信息的提取)。
本算法有效利用HSV色彩空間與RGB空間的差異性,結合RGB和HSV空間,并針對各自的空間對相同圖片進行了分割,分割效果如表1所示。從各自分割出的結果可以看出:基于HSV空間的粗分割更精準。

表1 粗分割Tab 1 Coarse segmentation
基于粗分割后的圖片,本算法分別就簡單的平均閾值分割(AS)和 GA閾值分割(GAS)進行了仿真測試(如圖4),如表2結果所示,對比三幅原圖片和最后分割二值化的結果,可以看出:GAS算法不僅實現了閾值的收斂,而且更標準化地實現了圖片的二值化。表3分別用兩種算法對1000幅圖片進行分割比較,GAS算法對比AS算法,所花費的時間相對較長,其時間的長短由遺傳算法代數決定的,但其正確率相對較高。

表2 細分割(M代表灰度閾值)Tab 2 Fine segmentation(M is gray level threshold)

表3 GAS同AS比較Tab 3 Comparison of GAS and AS

圖3 樣本圖Fig 3 Sample charts

圖4 多種方法分割效果圖Fig 4 Segmentation effect digram of a variety of methods
本文基于RGB和HSV空間的差異性,將二者有機結合起來,實現了特定區域的提取。然后,基于GA將特定區域的特定信息與背景有效分離,從而精準地分割出了待提取信息。經仿真測試,達到了一定的精度和速度。在GA過程中,其收斂性具有穩定性[8],但是偶爾也會出現死循環得不到收斂后的二值化結果,而這種情況可以通過控制工業環境得到一定的改善[9]。
[1]黃慶明,張田文,潘少靜.基于色彩學習的彩色圖像分割方法[J].計算機研究與發展,1995,32(9):60 -64.
[2]林開顏,吳軍輝,徐立鴻.彩色圖像分割方法綜述[J].中國圖形圖像學報,2005,10(1):1 -10.
[3]包全磊.基于 HSV空間的彩色圖像分割[J].軟件導刊,2010,7(9):171 -172.
[4]張國權,李戰明,李向偉,等.HSV空間中彩色圖像分割研究[J].計算機工程與應用,2005,46(26):179 -181.
[5]張志安,駱 斌.基于顏色和空間特征的圖像檢索[J].桂林工學院學報,2007,27(3):422 -426.
[6]Brown L G.A survey of image registration techniques[J].ACM Computer Survey,2002,24(4):325 -376.
[7]Sugisaka M,Fan Xinjian.Adaptive genetic algorithm with a cooperative mode[C]//Proceedings of IEEE International Symposium on Industrial Electromics,2001.
[8]惲為民,席裕庚.遺傳算法的全局收斂性和計算效率分析[J].控制理論與應用,1996,13(4):454 -460.
[9]徐宗本,高 勇.遺傳算法過早收斂現象的特征分析及其預防[J].中國科學,1996,26(4):564 -375.