侯紅英 高甜 李桃
摘要:圖像分割是圖像處理中的一項關鍵技術,并且在工業、醫學、軍事等諸多領域得到了廣泛應用。該文主要對傳統的圖像分割方法和近年來出現的一些新方法進行了綜述。介紹了傳統方法中的閾值法、區域法、邊緣檢測法以及新方法中的超像素法和語義分割法,分析了各種方法的原理及特點。
關鍵詞:圖像分割;傳統方法;語義
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2019)05-0176-02
1 引言
圖像分割是對圖像進行分析的重要步驟之一。圖像分割是根據相似性規則將一幅圖像劃分為多個子圖像區域的過程 [1]。 每個子區域中的每個像素在某些度量或計算的特征(如灰度,顏色,紋理和形狀)下是相似的。我們還可以從數學的角度來理解圖像分割:整個圖像區域用集合R來表示,那么圖像分割則是要把R分成一組連通且非空的子集
2 傳統的圖像分割方法
圖像有低級、中級和高級三種語義。傳統圖像分割方法主要是利用了圖像的低級語義,比如顏色、文理以及形狀等。常用方法主要有閾值法、區域法以及邊緣檢測法。
2.1 閾值法
閾值法的基本原理是結合圖像的灰度特征計算一個或多個灰度閾值,并將圖像中每個像素的灰度值與閾值進行比較,最后根據比較的結果將像素劃分到相應的類別[2]。 因此,閾值法的關鍵是根據一定的準則來求出最優灰度閾值。典型的全局單閾值分割方法是由Prewitt等人提出的直方圖雙峰法。該方法假設圖像具有不同的目標和背景,并且其灰度直方圖具有雙峰分布特性,選擇兩個峰值之間的谷相對應的灰度級作為閾值。通常,目標和背景之間的對比度在圖像中的每個地方都各不相同,并且難以用一個全局閾值將目標與背景分離。因此,有必要根據圖像的局部特征使用不同的閾值進行圖像分割。在處理過程中,需要根據實際問題將圖像劃分為若干個子區域來求解閾值,從而進行圖像分割。 閾值分割的優點是計算簡單、快速。然而,由于閾值的確定取決于灰度直方圖,沒有考慮圖像像素的空間位置關系,因此如果圖像的背景復雜且目標和背景灰度值差別不大時,部分邊界信息很容易丟失。
2.2 區域法
區域分割是具有相似屬性像素的連接,以形成所需的分割區域。該方法結合了圖像的局部空間信息,可有效地克服圖像分割時空間不連續的缺點,但同時也會造成圖像的過分割。區域法主要包括區域生長法和區域分裂合并法。區域生長法的基本思想如下:從能夠表示每個生長區域的一組種子像素開始,將滿足條件的種子像素鄰域內的像素合并到由種子像素表示的生長區域中,并將合并的新像素作為種子像素繼續之前的合并過程,直到找不到符合條件的新像素時停止合并操作[3]。所以,區域生長法的關鍵點在于選擇恰當的初始種子像素并確定有效的生長規則。通常還要受到具體問題的限制和影響,初始種子像素和生長準則決定了最后形成的分割區域,對這兩個因素的不恰當處理可能會導致過度分割或者欠分割的問題。區域分裂合并算法有分裂與合并兩個步驟,可以先進行分裂,再進行合并,也可以分裂和合并同時進行,在連續的分裂和合并之后,獲得圖像的分割結果。該方法是結合圖像中的區域特征指定分裂準則,如果區域的特征不一致,則會繼續分裂成四個相鄰的區域,然后再對分裂后的每個區域進行相同的操作,直到不再滿足給定的分裂準則。
2.3 邊緣檢測法
邊緣是圖像中兩個不同區域的邊界線上連續像素點的集合,體現了圖像特征的變化,如灰度、顏色、紋理。邊緣檢測則是檢測圖像的結構或灰度級突然變化的位置,這通常是一個區域的開始和另一個區域結束的地方。由于邊緣灰度值會產生屋頂型和階躍型兩種變化,基于邊緣的分割方法則是基于灰度值的邊緣檢測。圖像的灰度級變化可以通過圖像灰度分布的梯度來表示,可以使用微分算子進行邊緣檢測[4]。其中比較常用的有Roberts算子、Sobel算子、Prewitt算子、Laplace算子和Canny算子等。 在實際的應用中,微分算子常用小區域模板加以表示,微分運算則是利用小區域模板與圖像進行卷積來實現的。這些算子對噪聲敏感,適用于低噪聲且不太復雜的圖像。因為邊緣和噪聲都具有灰度不連續性,所以一般會在使用微分算子檢測邊緣之前,對圖像先進行平滑濾波處理。
3 圖像分割的新理論
在利用低級語義信息對圖像進行分割時,如果只是針對一些簡單場景中的物體,該方法是可行的,但如果是場景較為復雜的圖像,僅采用低級語義進行圖像分割的效果則不是很理想。此時,可以結合圖像的中、高級語義來提高分割效果。
3.1 超像素法
在2000年左右,研究者將圖論的理論引入到圖像分割,將待分割圖像映射為帶權無向圖,根據圖的頂點以及邊的信息構造代價函數,并對其進行優化。圖像分割轉換為圖的頂點標注,頂點標號相同像素屬于同一個圖像塊,這些圖像塊則稱為超像素[5]。另一種方法是根據圖像中單個像素的信息以及像素之間的相互關系,借鑒無監督學習的思想,結合聚類算法,將具有相似特征的相鄰像素劃分到同一超像素。在超像素方法中,主要有NCut、Graph Cuts、Meanshift等經典算法,這類算法的時間復雜度較高。針對不足之處,在上述經典算法的基礎上加以改進,產生了SEEDS、LSC、SLIC等算法,改進后的算法在生成圖像塊的質量和算法的時間復雜度上都有著更好的表現[6]。
3.2 語義分割法
采用高級語義的圖像分割稱為語義分割,Ohta等人于1978年最早提出圖像語義分割的概念,認為語義分割是為圖像中每個像素分配一個預先定義的表示其語義目標類別的標簽[7]。語義分割分為兩種形式:自頂向下和自底向上。自頂向下則是使用物體的形狀模型在待分割圖像中做匹配搜索,由于每種物體的形狀差異性很大,所以這種方法的適應性不理想。自底向上的方法不需要物體形狀的先驗知識,先從圖中生成候選區域,然后對候選區域進行分類預測[8]。在自底向上方法中的另一種思路是直接以圖像像素或超像素為處理單位,提取其本身及領域的特征用于語義分割。該方法是以大量帶有像素級標注的圖像為樣本,訓練諸如支持向量機、神經網絡等的分類器[9],然后對圖像中每個像素進行分類。
隨著圖像分割應用范圍的不斷擴大,對圖像分割的質量要求也越來越高。但到目前為止,還沒有任何的分割算法可以適用于所有的圖像,而且隨著應用的不斷深入,算法的復雜性越來越高,需要解決的問題也會越來越多。因此應該把圖像分割方法的研究與新理論、新技術相結合,圖像分割技術將會向著更精確、快速的方向發展。
參考文獻:
[1] 羅希平,田捷,諸葛嬰,等.圖像分割方法綜述[J].模式識別與人工智能,1999,12(3):300-312.
[2] Otsu N. A threshold selection method from gray-level histograms. IEEE Trans. on Systems Man and Cybernetics, 1979,9(1):62-66.
[3] Adams R, Bischof L. Seeded region growing. IEEE Trans. on Pattern Analysis and Machine Intelligence, 1994,16(6):641-647.
[4] Ziou D, Tabbone S. A study of edge detection techniques for segmentation computing approaches. Intl Journal of Computer Applications, 2010,CASCT(1):35-41.
[5] Ren X, Malik J. Learning a classification model for segmentation. In: Proc. of the 10th Intl Conf. on Computer Vision. IEEE, 2003:10-17.
[6] 姜楓,顧慶,郝慧珍,等.基于內容的圖像分割方法綜述[J].軟件學報,2017,28(1):160-183.
[7] Csurka G, Perronnin F. An efficient approach to semantic segmentation. Intl Journal of Computer Vision, 2011,95(2):198-212.
[8] Todorovic S, Ahuja N. Learning subcategory relevances for category recognition. In: Proc. of the IEEE Conf. on CVPR.Washington: IEEE Computer Society, 2008. 1-8.
[9] Bai X, Wang W. Saliency-SVM: An automatic approach for image segmentation. Neurocomputing, 2014,136(8):243-255.
【通聯編輯:代影】