林國宇
(廣州工商學院,廣東廣州 510850)
如今計算機視覺和圖像識別技術在很多領域都發揮著重要的作用,比如智慧醫療[1]、自動駕駛[2]、農業生產[3]等。圖像分割是當今各領域研究的熱點問題,同時也是進行圖像處理的關鍵步驟。對圖像目標的提取和測量都離不開圖像分割技術。所謂圖像分割就是把圖像分割成不同的區域,分割的依據是圖像的某種特征,區域內的特征相似性高,區域間的特征相似性低。傳統上有基于閾值的分割方法[4]、基于區域的分割方法[5]還有基于邊緣檢測的分割方法[6]。隨著圖像技術的廣泛應用,研究的不斷進展,近年來基于聚類分析的圖像分割方法被提出,本文將主要介紹K-means算法、Mean Shift算法、DBSCAN算法的基本思想和分割效果。
聚類算法是一種無監督的機器學習方法,在沒有標記的前提下可以發現共同的簇類,對于算法的評價可以從伸縮性、是否能發現任意形狀的簇、初始參數、維度等幾個方面展開。常見的聚類算法可概括為三類,分別是基于距離的算法、基于密度的算法、基于連通性的算法。
K-means算法通過計算距離作為數據相似性衡量的標準,即距離越小屬于同一簇的可能性越高,相對距離越遠屬于同一簇的可能性越低。K-means算法中k是指k個不同的簇,根據不同的使用場景取不同的k值。以下是K-means算法的具體步驟:
1)選擇初始化的k個樣本,并確定為初始聚類中心a=a1,a2,…ak;
2)統計k個聚類中心點與數據集中每個樣本xi的距離,再通過距離的大小來劃分簇;
3)針對每個類別aj,對聚類中心再次計算;

4)重復步驟2、3直到k個中心點趨于穩定。
當K-means算法在凸形簇聚類時,簇與簇之間區別較明顯,并且樣本規模相近時,聚類效果較為理想。但算法中除了參數k需要事先指定,同時對初始聚類中心和孤立點也比較敏感。
在彩色圖像的分割過程中,分割的依據不僅有明暗關系,還包括色彩飽和度。因為選擇的特征向量為圖像中全部像素點的GRB或者是灰度,所以就將整個圖像構成一個特征向量空間,就完成了圖像分割任務的轉換,也就是將圖像任務轉換為數據任務,在數據集合中使用K-means算法對數據進行聚類,達到圖像分割的目的。但是當數據樣本體量過大、特征點過多時,聚類的質量較差。
Mean Shitf算法是非參數的聚類算法,在不同簇類數據集處于不同概率密度分布的條件下,在區域內將樣本點由低密度區移動到高密度區,這樣該區域內一定存在分布的最大值,最后樣本點會在局部密度最高處收斂,且收斂到相同局部最大值的點就會被劃分為同一簇中。
Mean Shift算法的具體步驟如下:
1)分別計算樣本的均值漂移向量mh(x);
2)對每個樣本點以mh(x)進行平移,即:xi=xi+mh(x);
3)重復以上兩步,直到樣本點收斂,即:mh(x)=0;
4)收斂到同一位置的樣本點被劃分為同一簇中。
Mean Shitf算法作為一種非參數估計方法,在聚類中心的個數未知的情況下,能夠適應任何形狀的聚類,并且對初始化具有魯棒性,對噪聲點不敏感等特點。但是Mean Shitf算法中帶寬參數h的選擇對結果有較大的影響,h過小收斂速度慢,h過大聚類的效果不理想。
Mean Shitf算法在圖像分割的過程中,首先進行模點搜索,目的是搜索到中心點周圍的每個數據點,再用中心點的顏色替代這些點,從而平滑圖像。但是如果搜索到的模點過多,模點又比較近,可能會造成過分割現象。在這種情況下,有必要進行模點的合并。進行聚類后的分割區域中,如果像素點過少,就需要進行二次合并。
DBSCAN作為一種基于密度的空間聚類算法,有能力對異形狀數據進行聚類。該算法能夠有效地根據數據的相對密度來進行簇類的歸類,在帶有噪聲的空間中有效地發現任意形狀的簇。DBSCAN算法中簇的數量不需要事先確定,但是算法中有兩個參數需要提前給出,分別是鄰域半徑Eps和鄰域中數據對象數目閾值MinPts,來描述樣本分布的密度。
DBSCAN算法的具體步驟如下:
1)從數據集中任意選取一個數據對象點p。
2)計算到p點的距離小于或等于鄰域半徑的所有點。如果距離起始點的鄰域半徑之內的數據點個數小于或等于數目閾值MinPts,那么這個點將被確定為噪聲點,如果距離在鄰域半徑之內的數據點數量大于數目閾值MinPts,則該點被確定為核心對象,并被分配一個新的簇標簽。
3)訪問該點在鄰域半徑之內的所有點,如果這些點沒有被劃分到一個簇,新的簇標簽就會被分配這個點,如果是核心對象,依次訪問其鄰居,直到在簇內點的鄰居半徑內沒有核心對象為止。
4)選取未被遍歷過的點,并重復2、3步操作。
由于DBSCAN算法在同一個數據集內使用了同一的Eps和MinPts,在處理數據分布密度不均勻的數據時,如果選取Eps過小,密度小的簇可能會被過度劃分,而Eps選取過大,會使距離較近并且密度較大的簇被合并成為一個簇,所以Eps和MinPts兩個參數的選取至關重要。
DBSCAN算法在圖像分割過程中直接讀取一維數組中的數據,然而圖像分割中,必須對連續的像素區域進行劃分,需要將一維數組轉換為一個矩陣的形式,對灰度值數據進行聚類,最后進行染色。如果處理的圖像簇數較多或者背景色彩較為豐富的情況下,分割的效果不佳,并且運算時間也較長。
圖像分割就是將圖像劃分為多個區域,分割出來的區域與圖中的實體基本能夠對應,其實質是依據某種規則對圖像中的像素點進行劃分,使得同區域內像素點的相似度較高,不同區域內像素點的相似度較低。因此,基于聚類的圖像分割算法就是依據圖像的像素點,通過已有的聚類算法將像素點劃分為不同的簇。
評價指標是評價圖像分割質量的關鍵,評價指標中用會用到TP、TN、FP、FN,其中TP表示被模型預測為正類的正樣本,TN表示被模型預測為負類的負樣本,FP表示被模型預測為正類的負樣本,FN表示被模型預測為負類的正樣本。四者的關系如表1所示。

表1 四種樣本類型關系
對于圖像分割效果的評價主要有以下四個指標:
1)Precision(精確率)
圖像分割中的精確率是指圖像正確分類的像素所占的百分比,也就是分類正確的像素占總像素的比例。具體公式如下:

2)Dice(相似系數)
Dice相似系數也稱為F1值,是一種集合相似度量指數,樣本間的相似度值在(0,1)之間,越接近于1說明分割的效果越好,越接近于0說明分割的效果越差。具體公式如下:

3)IOU(重疊度)
IOU值是圖像分割領域的典型指標。在一組圖像中,重疊度量確定了在這組圖像中存在的對象預測范圍和真實范圍的相似性,具體公式如下:

圖像分割作為圖像處理過程中最重要的環節,一直受到人們的高度重視,并提出了多種方法。本文針對幾種常用的基于聚類的圖像分割方法和常用評價指標進行了闡述,幾種算法各有其優勢,沒有一種通用的算法,只能針對不同的應用場景選用不同的算法。找到一種魯棒性更強的圖像分割的算法,能夠適用于不同的使用場景是下一步的研究方向。