彭家磊,黃成泉,覃小素,雷 歡,陳 陽,周麗華
(1.貴州民族大學 數據科學與信息工程學院,貴州 貴陽 550025;2.貴州民族大學 工程技術人才實踐訓練中心,貴州 貴陽 550025)
苗族服飾圖像具有濃厚的文化底蘊,代表了一個民族的文化傳承。隨著流行文化的沖擊,苗族服飾圖像文化逐漸流失,一些研究者采用有效的分割方法對其進行保護和傳承,如基于主動輪廓[1]和深度學習[2]的苗族服飾圖案分割方法。然而,基于模糊C均值[3](Fuzzy C-Means,FCM)聚類算法的苗族服飾圖案分割方法幾乎沒有。
圖像分割是數字圖像領域中的一項關鍵技術,其分割的質量對后續的特征提取、圖像識別具有重要的作用,并廣泛應用于交通[4]、醫學[5-6]和遙感圖像[7-8]等領域。聚類算法是實現無監督模式識別的一種方法,目的是將一個數據集根據特定的規則劃分為多個子數據。近年來,FCM算法被廣泛運用于圖像分割領域,但傳統的FCM算法對圖像進行聚類時,沒有考慮圖像像素的空間位置關系,僅對像素點的灰度值進行聚類,致使該算法對噪聲點敏感,難以取得較好的分割效果,同時具有收斂速度慢等問題。為此,Zhu等[9]根據競爭學習的思想,在FCM的目標函數中引入隸屬度競爭懲罰項,提出廣義FCM(Generalized FCM,GFCM)聚類算法,有效提升了運行效率和聚類性能。隨著模糊聚類算法的逐漸成熟,隸屬度單一的局限性也漸漸浮現。
Zadeh[10]提出的模糊集理論是描述像素點歸屬哪一類的肯定程度,而事物發展不僅是支持或者反對,還有介于二者之間的不確定性。直覺模糊集是模糊集的拓展,其增加的猶豫度給不確定性的信息提供了新的思路。Chaira[11]將直覺模糊集與FCM結合提出直覺模糊(IFCM)聚類算法,該算法解決了傳統模糊集隸屬度單一的局限性問題,但IFCM算法同FCM算法一樣,過分依賴于樣本的數據結構,缺乏空間信息,對噪聲和圖像的偽斑點較為敏感。為了解決這個問題,Lei等[12]通過核函數的思想,提出核距離的直覺模糊(Kernel Intuitionistic FCM,KIFCM)聚類算法,核方法將輸入空間中的非線性問題轉化為高維特征空間中的線性問題,用核距離替代歐氏距離,提高了聚類性能,但由于未考慮空間信息,導致對噪聲圖像的分割質量較差。Arora等[13]將空間信息納入直覺模糊集,提出增強空間直覺模糊(Spatial Intuitionistic FCM,SIFCM)聚類算法,該算法使用新的模糊補計算非隸屬度,克服了噪聲或異常值的影響。
綜上所述,與主流醫學和遙感圖像相比,苗族服飾圖案具有色彩鮮艷、紋理復雜、樣式多元化等特征,容易導致圖案的偽斑點增多。在噪聲的干擾下,現有的模糊聚類算法分割圖像會存在邊緣模糊和破損等問題。因此,本文結合直覺模糊集與空間信息,引入隸屬度約束懲罰項,同時采用核距離度量替代歐氏距離,提出一種隸屬度修正的空間核直覺模糊(Spatial Kernel Intuitionistic FCM,SKIFCM)聚類苗族服飾圖案分割算法。與經典FCM、IFCM、SIFCM和KIFCM算法相對比,用于驗證本文算法的分割效果和聚類性能。
FCM算法是一種迭代算法,用模糊隸屬度為其類別分配像素。設X={x1,x2,…,xn},FCM最小化約束目標函數如下:
(1)
FCM算法應滿足式(2)的約束條件:
(2)
式中:c表示聚類數目;n表示總像素數目;m是加權指數,控制結果分區的模糊性,一般將m設置為2;μki表示第i個像素xi到第k個聚類中心的隸屬度值;‖xi-vk‖2表示像素xi到聚類中心vk的歐氏距離。
通過拉格朗日乘子法對目標函數式(1)求解,得到隸屬度和聚類中心的更新公式如下:
(3)
(4)
在模糊集的假設中,FCM算法只生成隸屬度。然而,單一的隸屬度并不能準確的描述事物所存在的不確定性。因此,Atanassov將模糊集推廣至直覺模糊集,在隸屬度的基礎上引入了非隸屬度和猶豫度。設X={x1,x2,…,xn}表示一個有限論域,則D在X中的直覺模糊集被定義為:
D={(x,μD(x),vD(x))|x∈X}
(5)
式中:μD(x)→[0,1]、vD(x)→[0,1]分別表示x到D的隸屬度函數和非隸屬度函數,并且每一個x∈D都滿足0≤μD(x)+vD(x)≤1。對于集合D中的每一個x,當μD(x)=1-vD(x)成立時,直覺模糊集就退化成傳統模糊集。
為了更好地描述數據之間的不確定性,Atanassov也指出了一個猶豫度:
FD(x)=1-μD(x)-vD(x),0≤FD(x)≤1
(6)
在現有的直覺模糊集中,Maheshan等[14]通過Yager生成函數,得到非隸屬度如下:
vD(x)=[1-μD(x)β]1/β,β∈(0,+∞)
(7)
因此,將式(7)代入式(6),猶豫度變為:
FD(x)=1-μD(x)-[1-μD(x)β]1/β
(8)
直覺模糊熵是模糊集中模糊性的度量,許多學者以不同的方式來定義。其中,Pal等[15]分析了經典的香農信息論,引出了指數熵。對于一個概率分布:p=pi(i=1,2,…,n),指數形式的香農熵可定義如下:
(9)
將指數香農熵與直覺模糊集相結合,得到直覺模糊熵如下:
(10)
IFCM聚類算法在傳統FCM算法的基礎上引入了猶豫度函數,其目標函數可表示為:
(11)

對目標函數式(11)進行最優化求解,得到隸屬度函數和聚類中心的更新公式如下:
(12)
(13)
近年來,核方法被廣泛應用于聚類算法中,其基本思想是將低維空間中的非線性問題轉變為高維空間中的線性問題,使原來的非凸數據變得線性可分,從而讓數據點的分類更加合理。根據文獻[12],高維特征空間中的核距離被定義如下:
‖Φ(xi)-Φ(vk)‖2=
K(xi,xi)+K(vk,vk)-2K(xi,vk)=
2[1-K(xi,vk)]
(14)
式中:Φ表示數據空間到特征空間的非線性映射。
本文使用高斯核函數來計算核距離,其定義如下:
K(xi,vk)=exp(-‖xi-vk‖2/h2)
(15)
式中:h表示核寬度。而參數h的選擇往往能影響圖像分割質量的好壞[16],并且需要大量的實驗。
本文為了解決h的取值問題,采用均方誤差來估計h2,具體形式如下:
(16)
為充分利用圖像的空間鄰域信息,本文從競爭學習的角度出發,將直覺模糊集和空間鄰域信息相結合,并采用核距離替代歐式距離構造出新的目標函數如下:
(17)

利用拉格朗日乘子法對目標函數式(17)求最優解,得到隸屬度函數和聚類中心的更新公式如下:
(18)
(19)

由于圖像的相鄰像素具有高度相關的性質,且屬于同一類的概率較大,所以考慮周圍像素點的隸屬度有利于提高算法的聚類性能。本文利用局部像素特征來修改式(18)所得的隸屬度函數。定義空間函數如下:
(20)
式中:NB(xi)表示空間域中以xi為中心的l×l正方形窗口,本文實驗取5×5的窗口;hki與隸屬度一樣,表示像素xi到第k個類的概率。
在不改變目標函數式(17)的情況下,將式(20)與式(18)相結合,得到更新隸屬度函數和聚類中心如下:
(21)
(22)
式中:p和q是2個參數,控制2個函數的貢獻程度。
在同質區域內,空間函數對圖像的作用不大,僅僅簡單的加強初始隸屬度函數。然而,對于噪聲點,利用像素鄰域信息降低噪聲點的權重,從而達到消除噪聲的影響。因此,圖像的噪聲或偽斑點能夠被糾正。
SKIFCM算法的步驟如下:
①設置聚類數目c,加權指數m,最大迭代次數T和終止條件ε,鄰域大小w。
②隨機初始化聚類中心V,隨機初始化模糊隸屬度矩陣U。
③設置迭代計數i=0。
④根據式(21)更新模糊隸屬度。
⑤根據式(22)更新模糊聚類中心。
⑥當‖Ji+1-Ji‖<ε或者i>T時,終止迭代過程,否則轉向④,直至迭代結束。
為了驗證本文算法對苗族服飾圖案分割的有效性,本文設計2組實驗進行驗證,即含噪聲的苗族服飾圖案分割和彩色苗族服飾圖案分割。為了進一步驗證本文算法的有效性,還設計了織物疵點圖像分割的實驗。苗族服飾圖案的數據集來源于北京服裝學院民族服飾博物館(http://www.biftmuseum.com/),選取博物館內的苗族服飾局部圖像(蠟染、刺繡、混合與簡單繡線)作為本次實驗的數據集。
參數的選取往往能決定圖像分割質量的好壞。為了獲得良好的分割效果,本文實驗選取的參數如下。固定參數:加權指數m=2,終止條件ε=1e-5,最大迭代次數T=200,聚類數目c=2,鄰域窗口大小w=5,猶豫度指數β=0.85;可變參數:模糊指數α,貢獻程度指數p和q都需要根據圖像的性質進行相應的調整,對比算法參考原文的參數設置。實驗環境為MatLab R2018a,Windows 10操作系統,處理器為Intel(R) Core(TM) i5-7200U CPU @ 2.50 GHz 2.71,運行內存為8 GB。
為了客觀評估本文算法的聚類性能,采用劃分系數(Partition Coefficient,VPC)、劃分熵(Partition Entropy,VPE)對5種分割算法進行定量評價[17],VPC和VPE反映劃分矩陣的模糊程度,VPC的值越接近1,VPE的值越接近0,聚類性能就越好,分割效果就越明顯。定義VPC和VPE如下:
(23)
(24)
為了進一步驗證本文算法相對于其他算法的有效性,采用有效性指數(Xie and Beni Index,VXB)作為評價指標[18],VXB測量特征域內的緊致度,VXB越接近0,同類像素點之間的緊密性越強,聚類效果越好,表達式如下:
(25)
為了測試本文算法對噪聲的魯棒性,本節挑選樣式單一和樣式多元化的2類苗族服飾圖像作為實驗對象,分別對2類圖像添加10%的椒鹽噪聲、高斯噪聲和混合噪聲,其測試的噪聲圖像如圖1所示。分割結果如圖2、3所示,分割性能指標如表1、2所示。圖2、3中所有圖像的實驗參數α、p和q均分別設置為0.9、5和0。

表1 不同算法在圖像1~6中的VXBTab.1 VXB of different algorithms of image 1~image 6 %

圖1 測試圖像Fig.1 Test image. (a)10% Pepper Salt Noise image 1;(b)10% Gaussian Noise image 2;(c)10% Mixed Noise image 3;(d)10% Pepper Salt Noise image 4;(e)10% Gaussian Noise image 5;(f)10% Mixed Noise image 6

圖3 樣式多元化的苗族服飾圖案分割結果Fig.3 Segmentation results of Miao costume patterns with diversified styles
從圖2、3可以看出,FCM、IFCM和KIFCM算法分割的圖像中存在大量的噪聲點,圖像分割的質量較差,達不到理想的分割效果,而SIFCM和SKIFCM算法利用空間鄰域信息對原隸屬度函數進行修正,消除了噪聲對圖像的影響,且SKIFCM算法的圖像細節信息更清晰。
從表1可以看出,當對苗族服飾圖案添加不同類型的噪聲時,FCM、IFCM和KIFCM算法的VXB相對較低,而IFCM和KIFCM算法的VXB相對較高。原因是他們通過最小化特征域中的度量差來實現劃分,而SIFCM和SKIFCM算法在空間分布的基礎上修改了空間特征,從而致使特征域內的緊致性惡化,造成VXB增大。與SIFCM算法相比,SKIFCM算法的VXB降低約4.18%。然而,從表2可以看出,SKIFCM算法的VPC最高、VPE最優,分別對應為95.49%和7.44%,明顯優于其他改進算法。實驗結果表明,本文算法不僅能平衡噪聲和邊緣細節信息之間的關系,而且還具有較好的聚類性能。

表2 不同算法在圖像1~6中的VPC和VPETab.2 VPC and VPE of different algorithms of image 1~image 6 %
苗族服飾圖案種類繁多,每種圖案所代表的意義都不相同,對于色彩鮮艷、紋理復雜、樣式多元化的圖案,通常難以取得較好的分割效果。為了驗證本文算法的優越性,選取4幅不同類型的彩色苗族服飾圖案進行實驗。分割結果如圖4所示,其紅色方框表示圖像細節的差異,性能指標如表3所示。圖像7與圖像8的實驗參數α、p和q均分別設置為0.9、1和1。圖像9的實驗參數α、p和q分別設置為0.9、4和1,圖像10的實驗參數α、p和q分別設置為0.45、3和1。

表3 不同算法在圖像7~10中的VPC與VPETab.3 VPC and VPE of image 7~image 10 for the different algorithms %

圖4 彩色苗族服飾圖案分割結果Fig.4 Segmentation results of color Miao costume patterns
從圖4可以看出,對于圖像7,各算法都取得了不錯的分割結果。對于圖像8,FCM、IFCM、SIFCM算法的分割效果較差,且SIFCM出現了過分割的現象,而KIFCM和SKIFCM算法的分割效果較好。這是因為采用歐氏距離對圖像進行聚類時,要求每一類中的成員必須要靠近聚類中心,但事實上遠離聚類中心的點容易被錯誤分類。KIFCM和SKIFCM算法采用核距離替代歐式距離,重新計算像素點到聚類中心的距離,所以提高了聚類的準確性。對于圖像9和圖像10,FCM、IFCM和KIFCM算法的分割效果較差,這是由于未考慮空間信息所致,而SIFCM和SKIFCM算法考慮了空間信息,對原隸屬度進行修正,提高了聚類性能,視覺效果較好。
由表3可知,SKIFCM算法的VPC和VPE最優,約為97.91%和3.42%;SIFCM算法次之,約為96.56%和5.75%;FCM算法最差,約為89.96%和17.20%。實驗結果表明,本文算法整體上提高了其他改進算法的聚類性能,其分割所產生的區域具有更強的連續性,能得到清晰的圖像邊緣。
為了進一步說明本文算法的有效性,選擇帶有油污、竹節、漿斑和褶子等常見的織物疵點的4幅圖像,對其添加2%的椒鹽噪聲進行實驗,分割結果如圖5所示,分割指標如表4所示。其紅色方框表示該織物圖像的疵點,本節實驗中的參數α、p和q均分別設置為0.9、5和1。

表4 不同算法在圖5中的VPC與VPETab.4 VPC and VPE in Fig.5 for the different algorithms %

圖5 織物疵點圖像分割結果Fig.5 Segmentation results of fabric defect images
從圖5可知,對于4種類型的織物疵點圖像,SIFCM和本文算法的視覺效果較清晰,基本上不存在噪聲點,但SIFCM在分割褶子圖像時,產生了較為嚴重的誤分割,僅SKIFCM算法大致分割出了褶子圖像的疵點。從表4可看出,SIFCM在分割竹節圖像時的性能指標最好;其余3幅織物疵點圖像中,SKIFCM算法的性能指標最好,且VPC和VPE的平均值分別為99.76%和0.40%,這是由于SIFCM和SKIFCM算法引入了空間信息,從而增強了對噪聲的魯棒性。
核函數的引入有利于將低維空間中的非線性問題轉變為高維空間中的線性問題,從而提高算法的聚類性能。然而,核函數的引入增加了計算復雜度,導致運行效率降低。由于FCM、IFCM和SIFCM算法均使用歐氏距離,故在此不做比較。
為了驗證本文算法的運行效率,選取圖像7~10對KIFCM和SKIFCM算法的運行效率做比較,結果如表5所示。可見,SKIFCM算法的迭代次數與運行時間都有所降低。這是由于本文在目標函數中引入隸屬度約束懲罰項,通過競爭學習的思想,即加強最大隸屬度,同時抑制其他隸屬度,從而達到快速收斂的結果。

表5 不同算法在圖4中分割時間與迭代次數Tab.5 Segmentation time and number of iterations in Fig.4 using different algorithms
本文提出一種隸屬度修正的空間核直覺模糊聚類苗族服飾圖案分割算法。該算法利用鄰域空間信息,對局部像素分配權值,以提高像素聚類的準確性;同時引入隸屬度約束懲罰項,加強最大隸屬度,抑制其他隸屬度,并使用核距離度量代替歐氏距離完成圖像分割。含噪聲的苗族服飾圖案、彩色苗族服飾圖案和織物疵點圖像的分割結果表明,對比SIFCM、KIFCM、IFCM和FCM算法,所提算法具有良好的聚類性能,能正確分類像素點,去除圖像的噪聲和偽斑點,還能保留圖像的邊緣,得到清晰的圖像;在色彩鮮艷、紋理復雜、樣式多元化的苗族服飾圖案分割中具有廣闊的應用前景。與使用核距離的KIFCM算法相比,運行效率有一定提升,但所提算法分割彩色苗族服飾圖案的時間仍然較長,如何提高算法的運行效率仍需連續研究改進。