摘 要:在計算機視覺的相關研究中,圖像分割是連接低級視覺和高級視覺的橋梁和紐帶,而圖像分割是計算機視覺系統中最關鍵和重要的一個環節。在概要介紹幾種常用圖像分割方法的基礎上,比較了每種圖像分割算法的優缺點及其適應范圍,結果表明:不同工程應用中,應根據其需求與圖像特點合理采用不同的圖像分割方法以達到更好的處理效果。
關鍵詞:圖象分割;圖象處理
中圖分類號:TP
文獻標識碼:A
文章編號:1672-3198(2010)12-0361-02
1 引言
近年來,隨著工業、農業、醫學、軍事等領域自動化和智能化需求的迅速發展,對圖像處理技術的要求也日益提高。其中,對圖像的自動識別與理解就是一項重要任務,而對圖像進行分割來提取目標是其關鍵步驟之一,如果得不到合理的圖像分割圖,也就無法對圖像進行正確的識別與理解。在過去的四十多年里,圖像分割的研究一直受到人們高度的重視。迄今為止,研究者提出了上千種不同類型的分割算法,而且近年來每年都有上百篇相關研究成果發表。但是,現有的方法多是為特定應用設計的,有很大的針對性和局限性,對圖像分割的研究還缺乏一個統一的理論體系。Fu和Mui從細胞學圖像處理的角度將圖像分割技術分為三大類:特征閾值或聚類、邊緣檢測和區域提取。依據算法所使用的技術或針對的圖像,Pal and Pal把圖像分割算法分成了6類:閾值分割、像素分割、深度圖像分割、彩色圖像分割、邊緣檢測和基于模糊集的方法。本文將依據上述兩種分類方法進行深入研究。
2 圖象分割方法
簡而言之,圖像分割(Image Segmentation)就是把圖像中的物體與背景或物體與物體分割開,實現不同區域的特殊處理。
2.1 基于閾值的分割方法
這類方法簡單實用,在過去的幾十年間備受重視,其分類也不一而足。根據使用的是圖像的整體信息還是局部信息,可以分為上下文相關方法和上下文無關方法;根據對全圖使用統一閾值還是對不同區域使用不同閾值,可以分為全局閾值方法和局部閾值方法;另外,還可以分為單閾值方(bileverthresholding)和多閾值方法。
閾值分割的核心問題是如何選擇合適的閾值。其中,最簡單和常用的方法是從圖像的灰度直方圖出發,先得到各個灰度級的概率分布密度,再依據某一準則選取一個或多個合適的閾值,以確定每個像素點的歸屬。選擇的準則不同,得到的閾值化算法就不同。
下面就常見的幾種閾值分割算法進行比較:
表1 幾種閾值分割算法
準則閾值化方法優點缺點
分割得到的目標和背景的概率應該等于其先驗概率p-分位數(p-title)法無需任何迭代和搜索嚴重依賴對先驗概率的估值
最優閾值位于目標和背景兩個概率分布的交疊處最頻值法(也稱mode法)計算簡單要求直方圖具有明顯的雙峰性
使目標和背景類的類內方差最小、類間方差最大Otsu方法計算簡單、效果穩定要求目標與背景的面積值相近
圖像的某種后驗熵最大熵方法計算簡單對直方圖模型有要求
Bayes判別誤差最小最小誤差法計算簡單,適用于目標與背景很不均衡的圖像對直方圖模型有要求
分割前后圖像的矩量保持不變矩量保持法無需任何迭代和搜索穩定性不佳
2.2 基于邊緣的分割方法
這類方法主要基于圖像灰度級的不連續性,它通過檢測不同均勻區域之間的邊界來實現對圖像的分割,這與人的視覺過程有些相似。依據執行方式的不同,這類方法通常又分為串行邊緣檢測技術和并行邊緣檢測技術。
串行邊緣檢測技術首先要檢測出一個邊緣起始點,然后根據某種相似性準則尋找與前一點同類的邊緣點,這種確定后繼相似點的方法稱為跟蹤。根據跟蹤方法的不同,這類方法又可分為輪廓跟蹤、光柵跟蹤和全向跟蹤三種方法。全向跟蹤可以克服由于跟蹤的方向性可能造成的邊界丟失,但其搜索過程會付出更大的時間代價。串行邊緣檢測技術的優點在于可以得到連續的單像素邊緣,但是它的效果嚴重依賴于初始邊緣點,由不恰當的初始邊緣點可能得到虛假邊緣;較少的初始邊緣點可能導致邊緣漏檢。
并行邊緣檢測技術通常借助空域微分算子,通過其模板與圖像卷積完成,因而可以在各個像素上同時進行,從而大大降低了時間復雜度。常見并行邊緣檢測方法有如下幾種:Roberts算子,Laplacian算子,Sobel算子,Prewitt算子,Kirsh算子,LOG算子,Canny算子。
上述算法和其他邊緣檢測算法雖然在檢測的準確性和邊緣定位精度上有所差異,但是他們都有一個共同的缺點:不能得到連續的單像素邊緣,而這對于分割來說是至關重要的。因此,通常在進行上述邊緣檢測之后,需要進行一些邊緣修正的工作,如邊緣連通、去除毛刺和虛假邊緣。常用的方法包括啟發式連接、相位編組法和層次記號編組法等。與串行邊緣檢測算法一樣,邊緣修正算法的代價也非常高。
2.3 基于區域的分割方法
基于區域的分割技術有兩種基本形式:區域生長和分裂合并。前者是從單個像素出發,逐漸合并以形成所需的分割結果。后者是從整個圖像出發,逐漸分裂或合并以形成所需要的分割結果。與閾值方法不同,這類方法不但考慮了像素的相似性,還考慮了空間上的鄰接性,因此可以有效消除孤立噪聲的干擾,具有很強的魯棒性。而且,無論是合并還是分裂,都能夠將分割深入到像素級,因此可以保證較高的分割精度。
區域生長算法先對每個要分割的區域找一個種子像素作為生長的起點,然后將種子像素鄰域內與種子像素有相似性的像素合并到種子像素集合。如此往復,直到再沒有像素可以被合并,一個區域就形成了。顯然,種子像素、生長準則和終止條件是算法的關鍵。然而,種子點的選擇并不容易,有人試圖通過邊緣檢測來確定種子點,但是,由于邊緣檢測算法本身的不足,并不能避免遺漏重要的種子點。
分裂合并算法則是先從整個圖像開始不斷的分裂得到各個區域,再將相鄰的具有相似性的區域合并以得到分割結果。這種方法雖然沒有選擇種子點的麻煩,但也有自身的不足:一方面,分裂如果不能深達像素級就會降低分割精度;另一方面,深達像素級的分裂會增加合并的工作量,從而大大提高其時間復雜度。
2.4 基于統計模式分類的分割技術
模式可以定義為對圖像中的目標或其它感興趣部分的定量或結構化的描述,圖像分割可以被視為以像素為基元的模式分類過程,這一過程主要包括兩個步驟:特征提取和模式分類。閾值分割就相當于在一維(灰度)或二維(共生矩陣)特征空間進行的模式分類,它所使用的特征并沒有充分反映像素的空間信息和其鄰域像素的相關信息。為了改善分割的效果,我們自然的想到使用能夠充分利用圖像信息的高維特征來描述每一個像素。這類方法,對于無法由灰度區分的復雜的紋理圖像顯得尤為有效。由于模式分類可以借鑒模式識別技術中的成熟算法,所以這類分割技術的主要差別在于特征提取的方法。
3 圖像分割領域存在的問題
實踐證明,圖像分割問題的困難在于它既不屬于完全的圖像特征提取的問題,又不屬于完全的物體識別的問題,其主要原因可歸結如下:
(1)在簡單的情況下,可以用圖像中同一物體像素點的連通性和物體與背景的灰度差進行分割,但在有噪聲的影響下或物體互相遮擋的情況下,連通性會被破壞;在復雜背景的情況下,僅用灰度差也不能區別物體與背景,而需要更復雜的灰度統計值。
(2)不同物體所對應的圖像區域特征在一般情況下應是該區域中局部特征的統計量(例如灰度的均值、方差、相關性等),而統計量必須在己知區域邊界的情況下才能計算。這樣,就陷入一個矛盾,即要分割必須計算統計量,要計算統計量又必須己知分割結果。
4 結論
在圖像分割問題上,至今還沒有建立起完善的理論體系,對眾多的圖像分割方法沒有進行很好的歸納整理,還有大量的工作亟需完成。與之同時,將多種圖像分割方法綜合運用,發揮各自的優勢進行圖像處理將成為這一領域的發展趨勢。
參考文獻
[1]R. M. Haralick, L. G. Shaprio, “Image segmentation techniques”, Computer Vision, Graphics,and Image Processing, 1985,(29):100-132.
[2]吳一全,朱兆達.圖像處理中閾值選取方法30年(1962-1992)的進展(一)[J].數據采集與處理,1993,(3):193-201.
[3]趙榮椿,遲耀斌,朱重光.圖像分割技術進展[J].中國體視學與圖像分析,1998,(2):121-128.
[4]王愛民,沈蘭蓀.圖像分割研究綜述[J].測控技術,2000,19,(5):1-6.
[5]羅希平等.圖像分割方法綜述[J].模式識別與人工智能,1999,12(3),300-312.