姜圣濤,穆學文
JIANG Shengtao,MU Xuewen
西安電子科技大學 數學與統計學院,西安 710126
School of Mathematics and Statistics,Xidian University,Xi’an 710126,China
圖像分割在圖像分析和圖像識別中具有很大作用,其研究一直受到學者們的廣泛關注,尤其閾值分割方法在實際問題中應用十分廣泛。
基于模糊熵的圖像閾值分割[1]是一種常用的方法,模糊熵描述了一個模糊集的模糊性程度。傳統的模糊熵使用了Zadeh[2]給出的模糊集上的標準正交、并和補運算,其中補運算為c()x=1-x,由于其不動點位于0.5處,再加上傳統補運算不能與傳統的模糊熵表達式建立起自然的聯系,這就限制了它在很多實際工程中的應用。鑒于此西安郵電大學的范九倫教授給出了廣義模糊熵方法[3],廣義模糊熵是模糊熵在廣義模糊補[4]意義下的推廣,用隸屬度恒取m(0<m<1)時模糊集上的模糊熵最大取代模糊熵中隸屬度恒取定值0.5,然后依據圖像質量評價準則[5],最終確定出最好的m,這樣有一定的效果,但不能實現參數m的自動選取。目前研究者給出了部分優化算法應用于廣義模糊熵圖像分割,例如文獻[6]給出的粒子群算法(Particle Swrarm Optimization,PSO),此方法對光照不均勻圖像具有不錯的分割效果,但對其他圖像仍有局限性。
本文提出通過優化算法在(0,1)區間對m進行全局尋優,在圖像分割時選用的隸屬度函數是經典的S型函數[7],它涉及到3個參數(a,b,d)的確定,采用自適應差分進化算法來求解,自適應地選取最優參數,以此來獲得最優分割結果。本文將ADE算法應用于廣義模糊熵圖像閾值分割上,實驗表明:多數情況下,針對不同的圖像此方法能獲得比文獻[6]方法更好的分割效果,分割結果背景信息更少,目標信息更清晰,此方法不僅相對更具通用性,而且通過全局尋優來確定參數,克服了窮舉搜索費時的缺點。
(3)若A*是A的分明修改,則,其中A*滿足

c表示廣義補函數,使用最廣泛的補函數是Zadeh[2]提出的基本補運算c()x=1-x,其特點是0.5是唯一不動點。廣義補運算[4]中c具有唯一的不動點m,即。對于m∈(0,1)且以m為唯一不動點的補函數記作cm。當m=0.5,c0.5(x)=1-x時,上述定義即為傳統模糊熵的表述。因此上述廣義模糊熵定義是傳統模糊熵的自然而合理的推廣。
日本學者Sugeno曾給出了一個補函數[8]:


將式(2)帶入式(1)得到Sugeno補[8]的等價變形為:

將式(3)代入如下廣義模糊熵表達式即可得到含有參量m的廣義模糊熵公式[9-10],如式(4)所示:


設Q={q(x,y),μQ(q(x,y)),x=1,2,…,M;y=1,2,…,N}表示大小為M×N的圖像,G={0,1,…,L-1}表示圖像所有灰度的集合是坐標處的像素灰度值表示(x,y)處像素在圖像Q中具有某種特性的隸屬函數。目前,在廣義模糊熵方法中,通常采用如式(5)的S型函數[7]作為隸屬度函數:

式中q表示圖像Q的灰度值,a、b、d是S型隸屬函數的3個參量,變化范圍為:0≤a<b<d≤L-1,對每一組參量(a,b,d)可以求得對應的圖像的廣義模糊熵。然后根據最大廣義模糊熵原則[3]對圖像進行分割。該原則的內容是:在空間Ln(L為隸屬度函數中參數的取值范圍,n為隸屬度函數中的參數個數,本文L的取值范圍是[0,255]中任意整數值,n取值為3,搜索一組含n個參數的組合參數,使得圖像在此參數確定的模糊劃分下保留原圖像的信息量最大。此時圖像分割問題就是尋找使得廣義熵取最大值的參數a、b、d的問題[3],即:

將式(6)所求的組合參數帶入式(5)即可求得最佳閾值,即最優閾值選取在,獲得圖像分割閾值后,就可以對像素重新歸類,得到分割后圖像f(x,y)。

由上面的分析可知,廣義模糊熵閾值分割法的分割閾值與一組參量相對應,如何尋找一組合適的參量使得廣義模糊熵最大是確定閾值的關鍵。對于灰度圖像,參量a、b、d的變化范圍為0≤a<b<d≤L-1,且 a、b、d 僅取整數。這樣尋找合適a、b、d的最簡單方法就是窮舉法,但這種方法運算量太大,時間復雜度過高(O(L4))。對于參量m,其取值為(0,1)區間上的任意實數,如何合理選取參量m,是使用廣義模糊熵閾值化法最為關鍵的一步。
本文對參量的選取采用以下思路 :利用優化搜索算法在參量空間搜索。搜索過程為嵌套的過程以廣義模糊熵最大為準則在空間Ln尋找合適的參量a、b、d,同時以自適應差分進化(DE)為優化算法在(0,1)區間尋找最佳的參量m。
在利用廣義模糊熵法進行圖像閾值分割時,選取優化參數時的優化算法采用自適應差分進化算法,該算法基本原理步驟同差分進化算法(DE)[11-15]一致,不同點在于本文引入了自適應變異算子來代替基本差分進化算法中的變異算子F,還提出了交叉概率自適應函數,通過進化迭代步數動態改變交叉概率CR的值。通過以上操作,本文所提的自適應差分進化算法即是在差分進化算法基礎上再添加自適應過程所得,因此必須先詳細介紹差分進化算法。
差分進化算法[11-15]是一種基于進化思想的最優化算法,具有記憶個體最優解和種群類信息分享的特點。它通過種群內個體之間互相合作和競爭來完成優化問題的求解,采用實數編碼方式在整個解空間并行地搜索問題的解決方案,其基本執行過程同遺傳算法一樣,包括變異、交叉、選擇等主要步驟。
設當前進化代數為t,群體規模為NP,個體長度為D,當前種群為為種群中的第i個個體。在進化過程中,對每個個體依次進行下面3種操作[16]。
(1)變異操作

(2)交叉操作

其中,rand[0,1]是[0,1]間的隨機數;CR是交叉因子,取值區間為[0,1],CR值越大,發生交叉的可能性就越大;j_rand是在[1,D]隨機選擇的一個整數,它保證了對于試驗個體至少要從變異個體中獲得一個元素。以上的變異操作和交叉操作統稱為繁殖操作[17]。
(3)選擇操作

其中,fitness()為適應度函數,一般以所要優化的目標函數為適應度函數。本文的適應度函數如無特殊說明均為目標函數且為求函數極小值。
DE算法在搜索過程中變異算子為實常數,若變異率過小,則種群多樣性降低,易造成局部收斂,若變異率過大,則搜索效率低,所求的最優解精度就低,在實施中變異算子較難確定。選擇適當的交叉概率也尤為重要,若交叉概率越高,群體中個體的更新就越快。但若是過高,算法就變成隨機搜索失去優越性。反之交叉率過低,群體的進化得不到保證,很難收斂到最優解。為了采用自適應方法更新算法參數值來確定最優閾值,本文引入了一個自適應變異算子F'以及提出了交叉概率自適應函數CR,具體如下:
(1)引入自適應變異算子F'來替代基本差分進化算法中的變異算子F。

(2)提出CR自適應函數式(12)根據進化迭代步數動態改變CR的值。

其中,CR0為開始時交叉概率;CR1為交叉概率的穩定值;G為當前迭代步數;Gmax為最大迭代步數開始時交叉概率CR0比較小,隨著進化的進行,個體開始逐步收斂,CR的值不斷增大,變異個體基因選入新個體的概率也增大,則收斂速度不斷提高,但很可能形成局部收斂。為防止局部收斂產生,當CR=CR1時,CR值不再增加保持穩定。
雙自適應的目的是為了讓算法的全局開發能力更強,自適應地控制F和CR的值在[ ]0,1內處于最佳,使進化參數在進化的不同階段能夠相互補充。因為在進化過程中每一個新個體如果F值沒取最佳,值若偏大,盡管種群多樣性提高但擾動量大,搜索步長在一個很大的范圍內波動,從而降低局部搜索性能;值若偏小擾動量也小,使得新個體與基準個體變化不大,不利種群進化。如果交叉概率CR值不是最佳,值若較小,可能只有少數幾維來自變異向量,不利于全局尋優;若值較大使得新個體與原個體相差太大,無法保證種群進化的有效性。因此將F和CR值控制在最佳狀態這樣才可以保障種群更加有效、迅速地向最優值進化,從而得到圖像最優分割結果。
不同縮放因子和交叉概率展示了相互不同的特性,本文期望參數在進化的不同階段能夠相互補充而不相互矛盾,則必須采用測試函數進行測試。鑒于大部分圖像灰度直方圖為多峰圖,本文實驗所選取的圖像也皆為多峰圖[18],其直方曲線圖見圖1,所以可用經典適應度評價函數Griewank多峰函數[19]來測試算法性能。

圖1 實驗原圖直方曲線圖
由于雙自適應性存在,為平衡全局搜索能力和局部搜索能力以及避免參數出現矛盾的情況要對算法反復試驗,代入多組數據,在迭代步數不是特別高的情況下,范圍為,只要使交叉概率初始值CR0以及交叉概率的穩定值CR1選定合適值即可,反復試驗可取CR0=0.3,CR1=0.9,具體測試過程參照文獻[15]。
本文主要將文獻[3]中傳統圖像質量評價準則模糊熵圖像閾值分割算法以及文獻[9]中PSO廣義模糊熵圖像閾值分割算法同本文所提出的ADE廣義模糊熵圖像閾值分割法來進行實驗比較。文獻[3]根據評價函數確定圖像閾值不涉及進化迭代,因此為驗證算法的收斂性只對比PSO法和ADE法迭代步數和適應度之間關系即可。
測試實驗時對兩種算法設置相同的操作參數,測試參數為:NP=100,CR0=0.3,CR1=0.9變異算子F和交叉算子CR的值依次按照自適應公式(11)式和(12)式來選取。避免參數相互矛盾進化代數不宜過大([1,1 000]),又測試樣本不大,故可設定最大進化代數為Gmax=100,粒子位置限制在[0,255]之間,算法終止條件為,其中為全局最優個體xbest的適應值,f(Vi)為迭代終止前當代個體Vi的適應值,兩種算法的進化曲線見圖2。圖像分割仿真實驗時,根據所選圖像樣本大小,在范圍內再重新設定最大迭代步數。
由圖2可知,20代之前PSO法效果要略好于ADE法,尤其是10代之前收斂速度要略快于ADE法,但10代以后容易形成局部收斂,不利種群進化發展。20代后ADE法明顯更好,并且隨著進化代數的增大最終進化曲線達到收斂。總的來說PSO法盡管在10代以前收斂速度更快,但存在局部收斂并且在有限的迭代次數內無法達到收斂效果,ADE法在100代之內就可收斂,收斂效果良好,所以本文利用雙自適應得到的算法整體上降低了局部收斂的幾率,并且算法穩定性相對較好,收斂速度也相對較快。

圖2 PSO和ADE算法進化曲線
本文實驗所選取的圖像為灰度范圍是0~255的二維灰度圖像,為達到圖像自動選取閾值的目的,首先對初始種群個體數NP進行編碼,設個體長度為D,每個個體對應一條染色體,其向量為對應灰度計算值如式(13):

ADE求廣義模糊熵最優組合參數步驟為:
步驟1輸入圖片獲取種群數NP,給出交叉概率初始值和穩定值CR0=0.3,CR1=0.9,以及個體長度D,變異算子F初值和交叉算子CR初值。指定變量搜索范圍指定最大迭代次數Gmax,令迭代計數器G=1,進化代數t=0。
步驟3 WhileG≤Gmax//或其他指定終止條件。
步驟4 Fori從1到NP
步驟5 用式(11)生成F'取代F,令F=F'。
步驟6 IfCR<CR1Then
根據式(12)得到新CR。
Else根據式(12)得到新CR。
End If
步驟10 End For
Else
迭代計數器G=G+1。
Return步驟3
步驟12 End While
步驟14將最優的參量組合代入式(6)得到最佳的圖像分割閾值。
End
利用廣義模糊熵對圖像閾值分割最大的難點就在于如何求補函數的參數,本文采用自適應差分進化的算法來進行優化求解。對于256色灰度圖像,一般的優化算法需要搜索256×256個候選閾值向量,算法運行效率非常低,自適應差分進化算法具有較好的尋優性能和效率,利用上述求解步驟得到最優解進而代入式(6)就可得到最佳的圖像分割閾值。
為了檢測算法的性能,在Matlab R2016a環境下進行仿真實驗,處理器為Intel Core 2.30 GHz,運行內存為4 GB,選用cameraman.jpg、lenna.jpg、fingerprint.jpg和barbara.jpg這四種不同細節的圖片進行實驗,圖片的尺寸均為252×252。分別采用傳統圖像質量評價準則模糊熵圖像閾值分割算法[3]、PSO廣義模糊熵圖像閾值分割算法[9]以及本文所提出的ADE廣義模糊熵圖像閾值分割法來進行實驗比較。
圖3為實驗所選取的四幅原圖像,經過多次試驗,由三種方法得到的四幅不同細節圖像的最優參數組合以及最佳閾值見表1,三種算法的實驗仿真結果見圖4~圖7,圖表中所提到的算法1、算法2和本文算法依次為傳統圖像質量評價準則模糊熵圖像閾值分割算法、PSO廣義模糊熵圖像閾值分割算法和本文的ADE廣義模糊熵圖像閾值分割法。

圖3 原圖像
由表1可看出:對于同一幅圖像,本文算法所得的最優閾值同算法2所得到的最優閾值相近,這也從側面驗證了本文算法具有可行性。
由圖4~圖7可以看出:針對不同圖像,對比各種算法分割效果,整體直觀上算法2同本文算法所得結果背景信息更少,分割結果更加接近,這也同表1得到的最優閾值數值相近保持一致。算法1分割結果存在一定的背景信息且目標信息不是特別理想,算法2進行了很大的改良,而本文算法其分割所得目標中明顯含背景信息更少且目標信息更清晰,大多數情況下效果更好。

表1 三種算法得到的最優參數組合及閾值
進一步比對三種算法分割結果,由圖4和圖6可明顯看出本文算法分割結果更好,這兩類圖像采用本文算法得到的結果背景信息較少且目標信息更清晰完善,其中圖6中本文所得結果指紋紋理更清楚更平滑更接近目標信息;由圖5和圖7可看出 算法2和本文算法分割結果差異不是特別明顯,通過對比還是本文算法分割所得背景信息更少,分割情況略好于算法2結果。同時發現,圖7(b)和圖7(c)中所得結果目標信息都有所丟失,比如lenna的嘴唇信息部分缺失,而圖7(a)嘴唇信息卻完整地保留下來了,但背景信息過多,整體上遠遠沒有算法2和本文算法分割效果理想。對比發現:總體上利用本文算法大部分圖像的分割結果還是比較理想的。這也說明了本文算法不能適用于所有類型的圖像分割也存在一定的不足,但可以適用于多數圖像。

圖4 cameraman三種算法分割結果

圖5 barbara三種算法分割結果

圖6 fingerprint三種算法分割結果

圖7 lenna三種算法分割結果
為了更定量比較幾種算法分割效果的優劣,實驗中除了比較算法運行時間外,再采用分類錯誤(Misclassification Error,ME)[20]來評價算法的優劣。分類錯誤ME的取值范圍為[0,1]。ME取值越小,則分割錯誤越小,表明分割后圖像的效果越接近理想分割。分類錯誤的計算公式[20]如下:

式中,G0和F0分別表示原圖像中理想分割時的目標和背景區域,G*和F*分別表示分割后圖像中的目標和背景區域。
表2給出了文中三種算法對實驗中四幅圖像分割后的分類錯誤以及算法運行時間。由表2可知,針對不同細節的圖片本文算法整體運行時間較短,ME值除了lenna圖像中算法2的為0.112略小于本文的0.129,其余均為本文算法ME值最小,這也定量地說明了整體上本文算法針對四種不同細節圖片都有較好的結果,即本文算法適用性更廣,并且能有效、穩定地找到一幅圖像的最佳熵閾值進而進行分割。

表2 三種算法ME值和運行時間
由于圖像來源千差萬別,導致圖像的細節具有多樣性。迄今,盡管給出了一些研究成果,但目前尚無通用的分割理論提出,現已提出的算法大都是針對具體問題。本文在仿真實驗時,也依然存在lenna圖像目標信息有所丟失的狀況,這也說明了本文算法同樣不能適用于所有類型的圖像分割。不過總體來說本文通過四種不同細節的圖片進行仿真實驗,結果也驗證了本文所提出的算法具有良好的效果,間接說明了本文所給的算法相對實用性更廣,實驗證明此算法是一種較實用的閾值分割算法。
參考文獻:
[1]符翔,張劍,王維.一種新的局部閾值分割算法[J].計算機應用與軟件,2015,32(4):195-198.
[2]Zadeh L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.
[3]范九倫,趙鳳.基于Sugeno補的廣義模糊熵閾值分割方法[J].電子與信息學報,2008,30(8):1865-1868.
[4]張旭慧,辛小龍.廣義模糊熵與包含度的相互誘導關系[J].模糊系統與數學,2011,25(6):16-22.
[5]雷博,范九倫.二維廣義模糊熵圖像閾值分割法[J].光子學報,2010,39(10):1907-1914.
[6]張新娟,雷秀娟.改進PSO算法在二維最佳閾值圖像分割中的應用[J].計算機工程與應用,2011,47(26):207-209.
[7]Li H,Yang H S.Fast and reliable image enhancement using fuzzy relaxation technique[J].IEEE Transactions on Systems,Man and Cybernetics,1989,19(5):1276-1281.
[8]Sugeno M.Fuzzy measures and fuzzy integrals:A survey[C]//Fuzzy Automata and Decision Processes,1977:89-102.
[9]雷博,范九倫.廣義模糊熵閾值法中基于粒子群優化的參數選取[J].控制與決策,2009,24(3):446-450.
[10]曾小浩,喬明明.基于組合優化算法的圖像閾值分割[J].計算機應用與軟件,2014,31(2):207-210.
[11]劉波,王凌,金以慧.差分進化算法研究進展[J].控制與決策,2007,22(7):721-729.
[12]汪慎文,張文生,丁立新.差分進化算法中參數自適應選擇策略研究[J].計算機科學,2015,42(11):256-259.
[13]高岳林,劉軍民.差分進化算法的參數研究[J].黑龍江大學自然科學學報,2009,26(1):81-85.
[14]張莉,葉志偉,王明威.基于差分進化的二維熵圖像分割[J].應用科學學報,2016,34(1):58-66.
[15]劉華,張營,張英杰.基于自適應差分進化算法的礬花圖像分割[J].控制工程,2016,23(8):1203-1207.
[16]林志毅,李元香.一種求解函數優化的混合差分演化算法[J].系統仿真學報,2009,21(13):3885-3893.
[17]鄧澤喜,劉曉冀.差分進化算法的交叉概率因子遞增策略研究[J].計算機工程與應用,2008,44(27):33-36.
[18]Griewank A O.Generalized descent for global optimization[J].Journal of Optimization Theory and Applications,1981,34:11-39.
[19]Tsai D M.A fast thresholding selection procedure for multimodal and unimodal histograms[J].Pattern Recognition Letters,1995,16(6):653-666.
[20]Sezgin M,Sankur B.Survey over image thresholding techniques and quantitative performance evaluation[J].Journal of Electronic Imaging ,2004,13(1):146-165.