





摘 要:隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,圖像處理技術(shù)在各個(gè)領(lǐng)域都得到了廣泛應(yīng)用,如產(chǎn)品質(zhì)量檢測(cè)、醫(yī)學(xué)圖像處理、軍事目標(biāo)的定位與跟蹤等。作為圖像處理技術(shù)和計(jì)算機(jī)視覺(jué)技術(shù)的研究基礎(chǔ),圖像分割技術(shù)目前已出現(xiàn)了大量不同類型的算法,并在各個(gè)領(lǐng)域的應(yīng)用中發(fā)揮著重要的作用。其中,基于閾值的圖像分割算法因具有簡(jiǎn)單有效、計(jì)算量小、性能穩(wěn)定等優(yōu)點(diǎn)而受到了人們的普遍青睞。首先,對(duì)圖像分割技術(shù)按照不同的劃分方式進(jìn)行了簡(jiǎn)單的分類;其次,對(duì)閾值分割算法的基本原理、分類及最典型的Otsu算法的基本思想進(jìn)行了詳盡的介紹;最后,對(duì)閾值分割算法目前存在的問(wèn)題進(jìn)行了闡述,并對(duì)算法未來(lái)的發(fā)展趨勢(shì)進(jìn)行了展望。研究工作可為圖像處理技術(shù)的進(jìn)一步發(fā)展提供理論借鑒。
關(guān) 鍵 詞:圖像處理; 閾值分割; 閾值選取; 算法
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A
doi:10.3969/j.issn.1673-5862.2023.06.007
A review of threshold-based image segmentation algorithms: Principles, classification and typical algorithms
YANG Linjiao
(College of Chemistry and Chemical Engineering, Shenyang Normal University, Shenyang 110034, China)
Abstract:With the rapid development of computer technology, image processing technology has been widely used in various fields, such as product quality detection, medical image processing, military target positioning and tracking. As the basis of image processing technology and computer vision technology, a large number of different types of algorithms has emerged, and these algorithms play an important role in various fields of application. Among them, threshold based image segmentation algorithm has been welcomed because of its advantages of simple,effective, little computation and stable performance. Firstly, the image segmentation technology is simply classified according to the different partitioning ways. Secondly, the basic principle, classification, and the basic idea of the most typical Otsu algorithm of threshold segmentation algorithm are introduced in detail. At last, the existing problems of threshold segmentation algorithm are described, and the future development trend of this algorithm are forecasted. This work can provide theoretical reference for the further development of image processing technology.
Key words:image processing; threshold segmentation; threshold selection; algorithm
圖像處理技術(shù)一般是指利用計(jì)算機(jī)對(duì)圖像進(jìn)行分析,以達(dá)到所需結(jié)果的技術(shù),又可稱為影像處理。圖像處理技術(shù)主要包括圖像的數(shù)字化、圖像的增強(qiáng)和復(fù)原、圖像的分割和識(shí)別、圖像的數(shù)據(jù)編碼等。其中,圖像分割在計(jì)算機(jī)視覺(jué)中起著至關(guān)重要的作用,是圖像處理技術(shù)的基礎(chǔ)。圖像分割的目的是使圖像得到簡(jiǎn)化或改變圖像的表示形式,圖像經(jīng)過(guò)分割后會(huì)形成一些特定的、具有獨(dú)特性質(zhì)的區(qū)域,這里的獨(dú)特性質(zhì)一般指像素的灰度、顏色和紋理等。其過(guò)程就好比把圖像中的每一個(gè)像素打上一個(gè)特定的標(biāo)簽,使得具有相同標(biāo)簽的像素具有相同的視覺(jué)特性,從而用來(lái)定位圖像的物體和邊界。
圖像分割技術(shù)一直是計(jì)算機(jī)視覺(jué)研究的熱點(diǎn)之一,歷經(jīng)數(shù)十年的發(fā)展,大量的分割算法被人們相繼提出并得到廣泛應(yīng)用[1]。其中,基于閾值的圖像分割算法因具有實(shí)時(shí)、有效、自動(dòng)、應(yīng)用廣泛等優(yōu)點(diǎn)而受到人們的廣泛關(guān)注。
本文首先對(duì)現(xiàn)有的圖像分割技術(shù)進(jìn)行了簡(jiǎn)單的劃分,接著對(duì)基于閾值的分割算法的原理、分類及最典型的Otsu算法進(jìn)行了系統(tǒng)的介紹,以期為圖像處理技術(shù)的進(jìn)一步發(fā)展提供理論借鑒。
1 圖像分割技術(shù)的分類
目前,人們對(duì)圖像分割技術(shù)進(jìn)行了大量的研究,并取得了卓有成效的研究成果,開發(fā)出了很多算法。如圖1所示,如果按照?qǐng)D像類型劃分,圖像分割技術(shù)可分為灰度圖像分割和彩色圖像分割,灰度圖像分割主要用于處理非自然圖像,彩色圖像分割則主要用于處理自然圖像;按照是否存在用戶交互,可將圖像分割技術(shù)分為監(jiān)督式分割和非監(jiān)督式分割,監(jiān)督式分割主要用于對(duì)圖像和視頻進(jìn)行編輯,非監(jiān)督式分割則主要用于處理圖像背景較為單一的文本圖像、工業(yè)圖像等;按照表示方式的不同,圖像分割技術(shù)又可分為基于像素級(jí)的分割和超像素級(jí)的分割,目前大多數(shù)的分割算法屬于基于像素級(jí)的分割技術(shù),其通常具有較高的處理精度;按照?qǐng)D像的另一種表示方式,圖像分割技術(shù)則分為單一尺度的分割和多尺度分割,單一尺度的分割是在原始尺度空間上構(gòu)建相關(guān)的分割模型,而多尺度分割則可充分挖掘圖像的基本信息;從屬性來(lái)劃分,圖像分割技術(shù)可分為單一屬性的分割和多屬性分割,前者只對(duì)灰度、顏色、紋理等特征中的一種屬性進(jìn)行分割,后者則能綜合運(yùn)用圖像的多種屬性;從操作空間來(lái)劃分,圖像分割技術(shù)可分為利用圖像特征信息的分割和利用空間位置信息的分割,其中前者主要包括閾值分割算法和聚類算法等,后者主要包括水平集分割算法、活動(dòng)輪廓算法等;從驅(qū)動(dòng)方式劃分,圖像分割技術(shù)可分為基于邊緣的分割和基于區(qū)域的分割。
2 閾值分割算法
閾值分割算法主要利用圖像的特征信息對(duì)圖像進(jìn)行分割,目前已有上百種算法被陸續(xù)提出。其主要思想是不同的目標(biāo)具有不同的諸如顏色、灰度、輪廓等特征,根據(jù)特征間的細(xì)小差別,通過(guò)選取特定的閾值將目標(biāo)物與背景劃分開來(lái),進(jìn)而實(shí)現(xiàn)快速的圖像分割。
2.1 閾值分割算法的基本原理
閾值法的基本原理是先確定一個(gè)閾值[2],然后將所有像素按照其特征值與閾值的大小關(guān)系劃分為2個(gè)類別。當(dāng)特征值大于閾值時(shí),該像素被歸為目標(biāo)類;反之,被歸為背景類。通過(guò)選擇合適的閾值,可以實(shí)現(xiàn)對(duì)圖像目標(biāo)與背景的有效分離。
設(shè)原始圖像為f(x,y),在f(x,y)中找出特征值T,將原始圖像分割為2個(gè)部分,得到分割后的圖像為
若取b0=0(黑),b1= 1(白),即為圖像的二值化。
2.2 閾值分割算法的分類
根據(jù)利用信息種類的不同,可將閾值分割算法分為以下幾類:
1) 基于直方圖形狀的方法。該類方法主要根據(jù)直方圖的形狀屬性來(lái)劃分像素,其又可分為“凸殼”法、“峰谷”法和形狀建模法3類。1997年,Carlotto[3]對(duì)圖像的概率密度進(jìn)行了多尺度分析,并以此估計(jì)最佳閾值;1998年,Cai和Liu[4]利用Prony譜分析法得到了圖像多重指數(shù)信號(hào)能量譜的近似值;之后,Guo和Pandit[5]提出了一個(gè)全極模型。
2) 基于熵的方法。該類方法利用灰度分布的熵信息來(lái)劃分像素。Johannsen和Bille[6]最早對(duì)熵算法進(jìn)行了研究。之后,很多學(xué)者對(duì)這一算法進(jìn)行了改進(jìn),如Pal[7]在交叉熵的基礎(chǔ)上建立了一種對(duì)前景和背景后驗(yàn)概率密度的模型;Sun[8]依靠“模糊事件熵”的最大化,采用了Zadeh的S隸屬度函數(shù)。
3) 基于聚類的閾值分割方法。該類方法又可分為迭代法、聚類法、最小誤差法和模糊聚類4類,其主要通過(guò)對(duì)灰度數(shù)據(jù)進(jìn)行聚類分析來(lái)獲取閾值。其中,聚類法是通過(guò)將前景和背景的加權(quán)方差最小化來(lái)獲得最佳閾值,是閾值分割算法中較為經(jīng)典的算法之一。Liu和Li[9]將聚類法擴(kuò)展到了二維,景曉軍等[10]將聚類法擴(kuò)展到了三維。
4) 基于對(duì)象屬性的方法。該類方法通過(guò)度量原始圖像與二值圖像間的諸如灰度片段、形狀緊密性、紋理等的屬性特性來(lái)選取閾值。基于對(duì)象屬性的方法可分為片段保存法、邊緣匹配法、模糊相似法、拓?fù)涔潭☉B(tài)法、最大信息法和模糊緊密性增強(qiáng)法6類。
5)基于空間的方法。該類方法又可分為同現(xiàn)方法、高次熵法、基于隨機(jī)集合的方法和二維模糊劃分法4類,其選取閾值的方式是度量灰度分布和鄰域內(nèi)像素的相關(guān)性。Chang等[11]在確保源圖像與二值圖像的同現(xiàn)概率以最低程度發(fā)散的條件下建立了閾值;Brink[12]認(rèn)為空間熵可由二元熵在所有可能間隔的總和來(lái)計(jì)算。
6)局部自適應(yīng)方法。局部自適應(yīng)方法可以克服其他閾值算法的許多缺陷,受到了人們的普遍關(guān)注,其主要的2種形式分別為鄰域法和分塊法。鄰域法一般會(huì)受到鄰域范圍的制約,因而對(duì)文字等狹長(zhǎng)目標(biāo)比較敏感,但對(duì)平坦的大塊前景或背景容易造成誤分;分塊法的適用范圍會(huì)更廣,但分塊之間結(jié)果的不連續(xù)是該方法的缺陷之一。
2.3 典型閾值分割算法介紹
Otsu閾值分割算法,也可稱為最大類間方差算法,是最常用的一類閾值分割算法,也是閾值分割領(lǐng)域各類文獻(xiàn)中被引用數(shù)量最多的算法之一。該算法選取使得類間方差最大的灰度值作為劃分背景和前景的最佳閾值,其基本思想如下:
用σ2B表示類間方差,其表達(dá)式為
最佳分割閾值t*即為使得類間方差σ2B最大的閾值t:
上述Otsu算法又稱一維Otsu算法,它在不對(duì)概率密度函數(shù)做出假設(shè)的情況下,以均值和方差的概率密度為基礎(chǔ)對(duì)圖像的分割狀態(tài)進(jìn)行描述,可以在很大程度上提高算法的運(yùn)算速度。后來(lái),人們又發(fā)展了二維Otsu閾值分割方法,它是在原來(lái)一維算法灰度值的基礎(chǔ)上加入了像素鄰域平均灰度作為第二維,因而提高了一維算法的抗噪聲能力。Otsu閾值分割算法的分割效果如圖2所示。
2.4 閾值分割算法目前存在的問(wèn)題
雖然閾值分割算法在國(guó)內(nèi)外研究者們數(shù)十年的努力下已經(jīng)取得了長(zhǎng)足的進(jìn)步,但目前仍然存在著如不均勻光照、噪聲干擾、文本圖像“劣化”等問(wèn)題亟待解決。其中,不均勻光照會(huì)使直方圖中的目標(biāo)波峰與背景波峰混雜在一起,從而降低直方圖閾值法的效果;噪聲對(duì)圖像處理的整個(gè)過(guò)程都有影響,去噪已成為圖像分割領(lǐng)域的一個(gè)研究重點(diǎn);長(zhǎng)時(shí)間保存的紙質(zhì)文檔會(huì)出現(xiàn)背面字跡浸透、字跡污染等現(xiàn)象,從而造成分割時(shí)產(chǎn)生大量的誤分。
3 結(jié)論與展望
圖像分割是計(jì)算機(jī)視覺(jué)的基礎(chǔ)技術(shù),分割效果將直接影響如目標(biāo)定位、目標(biāo)識(shí)別、目標(biāo)跟蹤、場(chǎng)景分析等的后續(xù)處理。在眾多的圖像分割算法中,閾值分割算法一直以其實(shí)時(shí)、高效等特點(diǎn)受到人們的普遍關(guān)注。但從目前來(lái)看,閾值分割算法仍面臨著許多難以解決的困難,可行的解決方法是從更高的圖像語(yǔ)義出發(fā),對(duì)圖像內(nèi)容進(jìn)行抽象分析,然后指導(dǎo)低層次的圖像分割,重復(fù)這樣的操作若干次,可以逐步提高分割的精度。目前,對(duì)該種分割方式的研究仍處于探索階段。
參考文獻(xiàn):
[1]SEZGIN M,SANKUR B. Survey over image thresholding techniques and quantitative performance evaluation[J]. J Electron Imaging, 2004,13(1):146-168.
[2]陰國(guó)富. 基于閾值法的圖像分割技術(shù)[J]. 現(xiàn)代電子技術(shù), 2007(23):107-108.
[3]CARLOTTO M J. Histogram analysis using a scale-space approach[J]. IEEE Trans Pattern Anal Mach Intell, 1997,9(1): 121-129.
[4]CAI J,LIU Z Q. A new thresholding algorithm based on all-pole model[C]∥Proceedings of the 14th International Conference on Pattern Recognition. Bribane: IEEE, 1998:34-36.
[5]GUO R,PANDIT S M. Automatic threshold selection based on histogram modes and a discriminant criterion[J]. Mach Vision Appl, 1998,10:331- 338.
[6]JOHANNSEN G,BILLE J. A threshold selection method using information measures[C]∥Proceedings of the 6th International Conference on Pattern Recogn. Munich: Germany, 1982:140-143.
[7]PAL N R. On minimum cross-entropy thresholding[J]. Pattern Recogn, 1996,29(4):575-580.
[8]SUN C Y. A novel fuzzy entropy approach to image enhancement and thresholding[J]. Signal Process, 1999,75:277-301.
[9]LIU J Z,LI W Q. The automatic thresholding of gray-level pictures via two-dimansional Otsu method[J]. Acta Automatica Sin, 1993,19:101-105.
[10]景曉軍,李劍峰,劉郁林. 一種基于三維最大類間方差的圖像分割算法[J]. 電子學(xué)報(bào), 2003,31(9):1281-1285.
[11]CHANG C,CHEN K,WANG J,et al. A relative entropy based approach in image thresholding[J]. Pattern Recogn, 1994,27(9):1275-1289.
[12]BRINK A D. Minimum spatial entropy threshold selection[J]. IEEE Proceedings, 1995,142(3):128-132.