







摘要:文章驗證了人工蜂群算法(ABC) 在無監督分類中的有效性,并探討其處理復雜數據集的優勢。通過結合ABC算法和遺傳算法(GA) ,利用歐幾里得距離度量模式相似性,實現無監督分類中聚類中心數量和位置的自動確定。實驗采用Landsat等遙感數據集,評估算法在大規模、非均勻數據上的性能,并自動調整聚類參數,以提高分類精度和效率。結果表明,ABC算法在分類精度和收斂速度方面均優于GA等算法,尤其在處理復雜數據集時優勢明顯。未來研究將進一步優化算法,以滿足更多實際應用需求。
關鍵詞:遺傳算法;人工蜂群;Landsat TM圖像;聚類
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2024)32-0005-03 開放科學(資源服務)標識碼(OSID) :
0 引言
在遙感技術的推動下,無監督分類方法在土地覆蓋制圖中的應用日益重要。然而,面對復雜多變的地表覆蓋類型和大規模的數據集,傳統的分類方法往往受限于其計算復雜度和適應性,難以高效且準確地完成分類任務。因此,探索新型的人工智能優化算法以提升無監督分類的效率和精度成為當前研究的熱點。
前人研究已經在人工智能優化算法領域取得了顯著進展。例如,遺傳算法[1](Genetic Algorithm,GA) 通過模擬自然選擇和遺傳機制,實現了搜索空間中的全局優化;差分進化算法[2](Differential Evolution Algo?rithm,DEA) 則通過差分變異和交叉操作,提高了算法的收斂速度和全局搜索能力;粒子群優化[3](ParticleSwarm Optimization,PSO) 則通過模擬鳥群的社會行為,實現了對復雜問題的有效求解。這些算法均在一定程度上提高了無監督分類的性能。
然而,現有研究仍存在一定的局限性。例如,遺傳算法在處理高維數據時容易陷入局部最優;差分進化算法在參數設置上較為敏感;粒子群優化則可能因粒子間的相互作用而導致早熟收斂。針對這些問題,本研究旨在探索一種新型的人工智能優化算法——人工蜂群算法[4](Artificial Bee Colony,ABC) ,并嘗試將其應用于無監督分類問題中。
人工蜂群算法是一種模擬蜜蜂采蜜行為的智能優化算法,具有適應性強、收斂速度快、全局搜索能力強等優點。已有研究表明,ABC算法在解決復雜優化問題方面表現優異,但在無監督分類領域的應用研究尚顯不足。因此,本研究的創新點在于將ABC算法引入無監督分類領域,結合其獨特的搜索機制和優化策略,以提高分類的精度和效率。同時,本研究還將對比GA、DEA、PSO等算法在無監督分類中的表現,以驗證ABC算法的優勢和適用性。
1 方法
目標函數的目的是找到類質心與像素之間的最小距離。最小化函數定義如下:
式中:xi 是第I類像素,xj 是第j類的質心,cj 是屬于第j類的像素。在文獻中,采用了mse、kappa系數和量化誤差等不同的方法來評價聚類算法的性能。在本研究中,量化誤差作為性能標準[5]。量化誤差由公式(3)定義:
式中:p 為聚類中的每個像素,ms為類的質心,ns為聚類中的像素個數,d為距離,S為類的個數。
一般方法的定義如下:
歸一化0到1之間的所有數據重復
1-用啟發式方法(ABC, GA, DEA, PSO)生成類質心的人口
2-計算像素和類質心之間的距離以找到成本值
3-將像素分配到最近的類,直到最大迭代或期望的誤差
1.1 人工蜂群算法(ABC)
自然界中生物的智能行為引導研究人員從這些行為中獲得靈感,開發新的優化方法。Karaboga[6]通過模擬蜜蜂的覓食行為,開發了人工蜂群(Artificial BeeColony,ABC) 算法。在人工蜂群算法中,蜜蜂分為圍觀蜜蜂、偵察蜜蜂和雇傭蜜蜂三種。人工蜜蜂的工作原理如下:
1) 受雇蜜蜂根據記憶中周圍的食物來源確定食物來源。
2) 被雇傭的蜜蜂告訴蜂巢里的旁觀蜜蜂食物來源,旁觀蜜蜂選擇食物來源。
3) 被雇傭的蜜蜂,其來源被拋棄,成為一個偵察兵蜜蜂,并開始尋找新的食物來源。
ABC算法基本步驟:
產生初始食物來源位置重復
1. 將受雇的蜜蜂送到食物來源的位置
2. 計算概率,選擇使用的概率值
3. 選擇食物來源位置
4. 放棄將被放棄的源并產生偵察蜂
5. 直到最大周期或期望的誤差
1.1.1 生產食物來源位置
算法通過在搜索空間中產生與解相對應的隨機食物源位置來啟動程序。在確定下限和上限后,通過產生隨機值來產生源位置。
xij = xmin j + rand (0,1) ? (xmax j - xmin j ) (4)
這里,最小xmin j 和最大xmax j 分別為下限和上限。
1.1.2 把受雇的蜜蜂送到食物來源的位置
由于期望系統簡單,在算法設計上做了一些讓步。第一,每個來源都有一個受雇的蜜蜂。第二,受雇蜂和旁觀蜂的數量相等。受雇蜂在其負責的食物來源附近確定新的食物來源并評估其質量。如果新來源的質量更高,雇傭蜂就會把這個新來源保存在記憶中。用現有源的鄰域確定新源的公式如下:
vij = xij + θij (xij - xkj ) (5)
式中:θij 是一個隨機生成的值,范圍是[-1,1]。xij和xkj 分別是前解和后解。隨著xij 和xkj 之間的差值減小,轉換水平也自適應地減小,因為認為最優解是近似的。如果它們超過了上、下參數,則生成的vij 被設置回這些極限值,在這個范圍內生成的向量表示一個新的源。用方程計算vij矢量的質量:
方程中的fnci 是vij 源的代價函數,貪心選擇程序在xij 和vij 之間應用。記住較好的解決方案,而刪除另一個解決方案。如果xij 繼續使用,失敗計數器(fitnessi)增加一個單位;否則,它被重置為沒有找到解決方案。
1.1.3 圍觀者蜜蜂選擇程序中使用的概率值的計算
被雇傭的蜜蜂完成了他們的搜尋過程,他們將花蜜的來源信息傳遞給圍觀的蜜蜂。圍觀者蜜蜂利用這一共享信息選擇與食物花蜜信息概率成正比的來源。優化方法的選擇過程是通過輪盤賭、比賽和隨機抽樣等方法實現。在ABC算法中,輪盤賭輪被用于此過程。扇形在車輪上的角度與適應度值成正比,計算如下:
式中:SN 表示工蜂(食物源)的數量。根據這個過程,隨著適應度值的增加,選擇機會也會增加。
1.1.4 旁觀蜜蜂對食物來源位置的選擇
在[0,1]范圍內,將根據輪盤賭計算出的P值與每個源隨機生成的數進行比較。當pi值大于這個數時,圍觀者蜜蜂和受雇蜜蜂一樣,也會在這個源位置根據式(5)生成一個新的解。將新解與舊解進行比較,選擇更好的解。然后,如果新的解決方案更成功,則重置失敗計數器;否則,舊溶液將被保留,計數器I的失效將增加一個單位。
1.1.5 放棄枯竭的資源,生產偵察兵蜜蜂
在被雇傭蜂和圍觀者蜂完成搜索過程后(在一個周期結束時),失敗計數器受到控制。一個源的花蜜是否耗盡由失敗計數器控制。如果失敗計數器(i fail?ure)大于用戶為某個源設定的閾值,則放棄該源。之后,屬于這個來源的被雇傭蜜蜂變成了偵察兵蜜蜂,重新開始尋找解決方案的過程。
1.2 粒子群優化
粒子群優化是受基于種群的群體智能的啟發而發展起來的一種搜索算法。該方法考慮了魚群和魚群的社會行為。在PSO中,每一個可能的結果都被表示為群或群中的粒子。在這種方法中,尋找任何問題的解決方案被定義為種群中的個體尋找未知地點的食物,在尋找食物時,他們跟隨離食物最近的個體。每一個被定義為粒子的溶液都是群體中的一個個體。當粒子移動時,通過將粒子的坐標發送給代價函數來計算粒子的適應度值。通過這種方法,可以計算出個體與食物的距離。種群中的每個粒子都要記住它的坐標、速度、最佳適應度值、它從哪里獲得這個值以及它在搜索空間中的前進速度。
粒子群算法由一個隨機粒子群(隨機解)發起,在每次迭代中,根據兩個最優值更新粒子位置,試圖達到最優解。這兩個值中的第一個是屬于粒子在那一刻之前達到的最佳解的坐標,它通常被定義為“pbest”。對于第二個值,它是提供所有粒子在該時刻之前達到的最佳解的坐標。該值是總體中的最佳值(全局最佳值),定義為“gbest”。k維空間中由n個粒子組成的粒子矩陣如下式:
在 上 面 定 義 的 矩 陣 中 ,第 i.th 個 粒 子 為[ x11,x12,x13,...,x1k ],定義適合度值最佳的粒子位置為pbesti = [ xi1,xi2,xi3,...,xik ]。對于gbest,它在所有粒子的每次迭代中都是單一的gbest = [ p1,p2,p3,...,pk ]。第i個粒子的速度定義為vi = [ vi1,vi2,vi3,...,vik ]。用這個方程更新粒子的位置和速度:
vt (t + 1) = vi (t) + c1 ? randt1 ? ( pbesti (t) - xi (t))+c2 ? randt2 ? (gbesti (t) - xi (t)) (9)
xi (t + 1) = xi (t) + vi (t + 1) (10)
在方程(9)中,c1 和c2 是引導每個粒子到pbest 和gbest 位置的學習因子。c1 參數使粒子按照pbest 值移動,c2 參數使粒子按照gbest 值移動。通過這種方式,每個粒子都能從自己的經驗和種群中其他個體的經驗中獲益。式中的randt1 和randt2 表示在[0,1]范圍內正態分布的隨機數,t表示迭代次數。
1.3 方法參數
選取合適的參數是啟發式方法成功的重要因素。對于參數的選擇,可以根據數據和成本函數要求使用不同的變量。在本研究中,所有方法的種群/粒子數為50,循環/迭代/代數為5 000。具體參數:ABC參數為limit=1 000, MR=0.8;遺傳參數為:選擇:錦標賽,交叉:兩點,突變率:0.006;DEA參數CR=0.4, F=0.4, PSO 參數c1 = 0.5, c2 = 1.3,vmax = 12, wmax = 0.9,wmin = 0.45。
2 結果
基于ABC、DEA、GA和PSO的分類算法已被應用于Landsat TM圖像的處理。除了進行圖像分類外,我們還利用從UCI數據庫中獲取的葡萄酒數據、乳腺組織數據和圖像分割基準數據來執行聚類操作,旨在驗證所開發方法的穩定性。具體而言,葡萄酒數據有13 個屬性3類,乳腺組織數據有9個屬性6類,圖像分割數據有19個屬性7類。基準數據的測試結果見表1。我們基于ABC的方法針對不同數量的類進行了測試。Landsat影像的實驗結果見表2。
3 結束語
本研究驗證了人工蜂群算法(ABC) 在遙感圖像無監督分類中的有效性。實驗結果表明,ABC算法在分類精度和效率方面均優于GA、PSO等算法,尤其在處理復雜數據集時優勢明顯。ABC算法通過模擬蜜蜂覓食行為,有效優化了聚類中心,降低了類質心與像素間的距離。本研究的貢獻在于將ABC算法應用于遙感圖像無監督分類,并通過與其他算法的對比,驗證了其優越性。未來研究將探索ABC算法與其他方法的結合,以及在更多實際應用場景中的推廣。
參考文獻:
[1] 陸澤浩.基于遺傳算法的人工智能優化研究[J].輕工科技,2012,28(4):77-79,132.
[2] 苗曉鋒,劉志偉.引入反向學習機制的自適應差分進化算法研究[J].計算機與數字工程,2019,47(12):2953-2956,3120.
[3] 蔣文駿.基于進化性粒子群優化算法的概率潮流計算方法研究[J].科學與信息化,2020(8):187-189,194.
[4] 包婉瑩,羅小玲,潘新.基于人工蜂群與K-Means的改進混合聚類算法[J].人工智能與機器人研究, 2020, 9(2):8.
[5] TINGYUYE,JUNYE,HUIWANG,et al.結合人工蜂群優化的粗糙K-means 聚類算法[J].Journal of Frontiers of Computer Science and Technology, 2022, 16(8):1923-1932.
[6] KARABOGA D, OZTURK C.A novel clustering approach: Arti?ficial Bee Colony (ABC) algorithm[J].Applied Soft Computing,2011, 11(1):652-657.
【通聯編輯:代影】