999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

ABC聚類算法與KHM算法相結(jié)合的ABCKHM聚類算法

2017-12-19 02:52:16都興朔
東北師大學報(自然科學版) 2017年4期
關(guān)鍵詞:優(yōu)化

姜 華,胡 欣,王 崢,都興朔

(1.東北師范大學信息科學與技術(shù)學院,吉林 長春 130117; 2.東北師范大學智能信息處理吉林省高校重點實驗室,吉林 長春 130117)

ABC聚類算法與KHM算法相結(jié)合的ABCKHM聚類算法

姜 華1,2,胡 欣1,2,王 崢1,2,都興朔1,2

(1.東北師范大學信息科學與技術(shù)學院,吉林 長春 130117; 2.東北師范大學智能信息處理吉林省高校重點實驗室,吉林 長春 130117)

針對調(diào)和K均值聚類(KHM)算法存在陷入局部最優(yōu)解的問題,提出一種人工蜂群(ABC)算法與KHM算法相結(jié)合的混合聚類算法ABCKHM.實驗表明,該算法解決了KHM算法有時陷入局部最優(yōu)解的問題,并且該算法較之KHM算法及同類其他算法有更好的性能.

聚類;KHM;人工蜂群優(yōu)化;ABC

聚類分析是一大類數(shù)據(jù)挖掘方法的總稱,是數(shù)據(jù)挖掘的一個重要領(lǐng)域.聚類過程就是把事物聚集到幾類中,使得不同類中的對象盡可能的不同,同一類中的對象盡可能相似[1].調(diào)和K均值聚類(KHM)算法1999年被提出[2].KHM算法相比于K-means算法減少了對初始中心點的依賴[3-4].2005年Karaboga提出的人工蜂群(ABC)算法的優(yōu)化算法,最初是為解決多變量函數(shù)優(yōu)化問題,模擬了蜜蜂群體的采蜜行為.[5]ABC算法具有全局尋優(yōu)、收斂速度快等很多優(yōu)點,該算法經(jīng)過合理設(shè)置優(yōu)化目標函數(shù)可以應(yīng)用于聚類問題.本文提出一種混合聚類算法ABCKHM,結(jié)合了ABC聚類算法與KHM算法的思想,借助ABC聚類算法全局尋優(yōu)能力,解決KHM可能陷入局部最優(yōu)的問題.

1 KHM算法

KHM算法比K-means算法雖減輕了對中心點初始選擇的依賴,但是KHM算法仍有可能陷入局部最優(yōu)解.KHM算法相關(guān)概念和記法如下[6]:

xi(i=1,2,…,n):數(shù)據(jù)對象.

cj(j=1,2,…,k):第j簇的中心點.

KHM(X,C):KHM算法的目標函數(shù).

m(cj/xi):隸屬函數(shù),表示數(shù)據(jù)對象xi屬于第j個簇的程度.

w(xi):權(quán)值函數(shù).

KHM算法的主要步驟如下:

Step1:初始化算法參數(shù),隨機選擇初始中心點.

Step2:計算目標函數(shù)KHM(X,C),公式為

(1)

其中p是輸入?yún)?shù),通常取p≥2.

Step 3:計算隸屬度m(cj/xi),公式為

(2)

其中m(cj/xi)∈[0,1].

Step 4:計算數(shù)據(jù)對象xi的權(quán)值w(xi),公式為

(3)

Step 5:根據(jù)xi的隸屬度m(cj/xi)和權(quán)值w(xi)重新計算類的中心點

(4)

Step 6:重復(fù)Step 2—5,直至目標函數(shù)KHM(X,C)的值不再改變或達到最大循環(huán)次數(shù)MaxGen.

Step 7:分配數(shù)據(jù)對象xi到隸屬度m(cj/xi)最大的第j個簇中.

2 ABC優(yōu)化算法

ABC優(yōu)化算法模擬自然界中的蜜蜂采蜜行為,用食物源的位置表示優(yōu)化問題的解[7].蜂群有引領(lǐng)蜂、跟隨蜂和偵察蜂3種:引領(lǐng)蜂收集食物源的蜜量等信息;跟隨蜂在蜂巢等待并察看引領(lǐng)蜂的動作信號(舞蹈),從中獲取信息決定是否跟隨;偵察蜂則隨機地尋找食物源.設(shè)有SN個食物源,ABC算法規(guī)定引領(lǐng)蜂數(shù)量=跟隨蜂數(shù)量=食物源數(shù)量.優(yōu)化解集合包含SN個D維向量,第i個解為xi=(xi1,xi2,…,xiD),i=1,…,SN,食物源的花蜜量對應(yīng)適應(yīng)度值,也即解的質(zhì)量.

ABC算法在初始化過程中隨機產(chǎn)生SN個初始解,進而計算它們的適應(yīng)度值.然后,循環(huán)使用引領(lǐng)蜂、跟隨蜂和偵察蜂更新食物源位置,最終完成最優(yōu)解的搜索過程.引領(lǐng)蜂判斷附近食物源的花蜜量(適應(yīng)度值),如果新食物源高于現(xiàn)有的花蜜量,則引領(lǐng)蜂記住新食物源,放棄現(xiàn)有的食物源,否則,仍保持不變,即進行一個貪心選擇過程.引領(lǐng)蜂搜索過后,通過跳舞動作傳遞食物源信息給跟隨蜂,跟隨蜂進行評估,計算每個食物源與花蜜量相關(guān)的概率值,并優(yōu)先選取值較大的食物源,依據(jù)貪心選擇過程進一步嘗試更新.每個食物源的概率值計算公式為

(5)

其中fiti表示食物源的適應(yīng)度值.

ABC算法修正現(xiàn)有食物源xi的位置,計算公式為

vij=xij+Rij(xij-xkj).

(6)

其中:k隨機選取,k∈{1,2,…,SN}且k≠i,j∈{1,2,…,D};Rij是[-1,1]間的隨機數(shù),控制著在食物源xi附近什么位置產(chǎn)生新食物,本質(zhì)是鄰域搜索.

ABC算法中,如果在limit次循環(huán)后一個食物源還沒有被更新,那么放棄這一食物源,偵察蜂隨機尋找新食物源取代之.這個過程計算公式為

(7)

ABC算法有食物源總數(shù)SN、limit值、最大循環(huán)數(shù)MaxCycle 3個控制參數(shù).ABC優(yōu)化算法如下:

(1) 初始化MaxCycle及l(fā)imit,置cycle=1.

(2) 隨機生成各個最初的食物源xi,并計算適應(yīng)度值fiti(i=1,…,SN).

(3) 循環(huán),反復(fù)執(zhí)行下列步驟,直到cycle達到預(yù)定迭代次數(shù)MaxCycle:

(a) 派出SN個引領(lǐng)蜂,根據(jù)公式(6)更新第i(i=1,…,SN)個食物源,并計算其適應(yīng)度值newfiti,與原有食物源的適應(yīng)度值fiti比較,若newfiti>fiti則記下這個食物源,反之丟棄;

(b) 使用公式(5)計算各個食物源的概率Pi;

(c) 派出SN個跟隨蜂,根據(jù)Pi判斷是否需要再次更新食物源,更新方式同步驟(a);

(d) 記下更新后得到的更好食物源;

(e) 派出偵察蜂,重新初始化經(jīng)過limit次嘗試一直沒有得到更新的食物源;

(f) cycle=cycle+1.

(4) 輸出求得的最優(yōu)函數(shù)值及對應(yīng)的食物源,算法結(jié)束.

3 ABC聚類算法

我們對ABC優(yōu)化算法進行改進,得到一種新的ABC聚類算法[8].

ABC優(yōu)化算法的目標在于尋找k個(取決于具體問題)食物源,以使給定的目標函數(shù)值達到最小.當把ABC優(yōu)化算法應(yīng)用于聚類問題時,每一個食物源對應(yīng)一個中心點.如果度量使用歐氏距離,ABC聚類過程就將數(shù)據(jù)對象分配到與之有最短歐式距離的食物源所在的簇中,并最小化上述聚類目標函數(shù)f.

ABC優(yōu)化算法中每一個食物源的適應(yīng)度fiti定義為

(8)

其中fi是目標函數(shù)的當前值,fi越小,fiti越大.把ABC優(yōu)化算法用于聚類問題時,則目標函數(shù)f值越小,食物源的適應(yīng)度值越大,聚類效果越好.

4 ANCKHM聚類算法

以ABC聚類算法對數(shù)據(jù)集進行初始聚類,將得到的k個中心點作為KHM算法的初始聚類中心,再運行KHM算法獲得最終聚類結(jié)果.由于ABC聚類算法的全局尋優(yōu)特點,新算法能有效地減少KHM算法陷入局部最優(yōu)的問題.新的ABCKHM聚類算法如下:

(ABC聚類算法優(yōu)化中心點階段)

(1) 初始化MaxCycle及l(fā)imit,置cycle=1.

(2) 隨機生成初始食物源xi,并計算其適應(yīng)度值fiti(i=1,…,SN).

(3) 循環(huán),反復(fù)執(zhí)行下列步驟,直到cycle達到預(yù)定迭代次數(shù)MaxCycle:

(a) 派出SN個引領(lǐng)蜂,根據(jù)公式(6)更新第i(i=1,…,SN)個食物源,并計算其適應(yīng)度值newfiti,與原有食物源的適應(yīng)度值fiti比較,若newfiti>fiti則記下這個食物源,反之丟棄;

(b) 使用公式(5)計算各個食物源的概率Pi;

(c) 派出SN個跟隨蜂,根據(jù)Pi決定是否需要再次更新食物源,更新方式同步驟(a);

(d) 記下SN個更好的食物源,把數(shù)據(jù)點劃分到離它最近的食物源所在的簇中;

(e) 派出偵察蜂,重新初始化經(jīng)過limit次嘗試仍未更新的食物源;

(f) cycle=cycle+1.

(4) 輸出SN個簇最好的食物源.

(KHM聚類算法階段)

(5) 將ABC聚類算法的食物源作為KHM算法初始中心點.

(6) 根據(jù)公式(1)—(3)計算目標函數(shù)KHM(x,c)、隸屬度m(cj/xi)、權(quán)值w(xi).

(7) 根據(jù)公式(4)重新計算類的中心點cj,cycleKHM=cycleKHM+1.

(8) 循環(huán)執(zhí)行步驟(6)和(7),直至目標函數(shù)KHM(X,C)的值不再改變或達到最大循環(huán)次數(shù)MaxGen.

(9) 分配數(shù)據(jù)對象xi到隸屬度m(cj/xi)最大的簇中.

5 實驗部分

本文實驗在Pentium (R) CPU 2.5 GHZ+512 MB RAM平臺上進行,采用C++編碼.為了測試ABCKHM混合聚類算法的性能,使用3個標準數(shù)據(jù)集Iris、Glass和Wine.ABCKHM聚類算法使用的初始參數(shù)見表1.

5.1 數(shù)據(jù)集

實驗使用的3個數(shù)據(jù)集Iris、Glass和Wine的信息見表2.

表1 ABCKHM算法設(shè)置的參數(shù)初值

表2 數(shù)據(jù)集特征

數(shù)據(jù)集詳細描述:

Iris(n=150,d=4,k=3)是機器學習領(lǐng)域一個經(jīng)典的數(shù)據(jù)集.這個數(shù)據(jù)集包括Iris Setosa、Iris Versicolour和Iris Virginica三類數(shù)據(jù)對象.每類都有50個4維的數(shù)據(jù)對象,4維屬性分別是sepal length、sepal width、petal length和petal width.

Glass(n=214,d=10,k=7)是另一個常用的機器學習數(shù)據(jù)集,包含214個數(shù)據(jù)對象、維數(shù)10個、7類數(shù)據(jù)對象.

Wine(n=178,d=13,k=3)是一個著名的用于機器學習的數(shù)據(jù)集,描述3種不同的意大利酒,包括178個數(shù)據(jù)對象、維數(shù)13、3大類數(shù)據(jù)對象.

5.2 性能評估方法

本文用F-Measure函數(shù)來評估算法聚類效果[9].F-Measure度量包括精確率(p(i,j))和召回率(r(i,j))兩個組成部分,分別定義為

其中:ni是聚類算法求得的第i類中的數(shù)據(jù)點數(shù);nj是數(shù)據(jù)集第j類中真實的數(shù)據(jù)點數(shù);nij是前述2個集合交集的數(shù)據(jù)點數(shù);p(i,j)代表算法的準確性;r(i,j)代表算法的查全率.F-Measure定義為

其中取b=1,使得p(i,j)和r(i,j)的權(quán)值相等.如果數(shù)據(jù)集的大小為n,整體的F-Measure定義為

F-Measure的值越大,算法的聚類效果越好.

5.3 實驗結(jié)果及分析

圖1 ABCKHM聚類算法在3個數(shù)據(jù)集上10次運行的準確率

本文進行了2組實驗:(1)研究了ABCKHM聚類算法的穩(wěn)定性;(2)ABCKHM聚類算法與同類其他算法(KHM算法、FKH算法、KHM-SAPSO算法、KHM-CPSO算法)進行了對比.

首先,為驗證ABCKHM聚類算法的穩(wěn)定性,分別在3個數(shù)據(jù)集(Glass、Iris、Wine)上運行10次,聚類的準確率如圖1所示,結(jié)果非常穩(wěn)定.ABCKHM聚類算法的準確率表明其有效避免了KHM算法有時會陷入局部最優(yōu)解的問題.

為進一步驗證ABCKHM聚類算法的效果,把ABCKHM聚類算法與已有的KHM算法、FKH算法、KHM-SAPSO算法、KHM-CPSO算法進行對比,分別在3個數(shù)據(jù)集上運行10次,再分別取準確率(Accuracy)的平均值及F-Measure的平均值.當p=3.5時的實驗結(jié)果見表3.

表3 KHM、FKH、KHM-SAPSO、KHM-CPSO 和ABCKHM聚類算法的結(jié)果(p=3.5)

結(jié)果顯示:ABCKHM聚類算法的準確率及F-Measure值均優(yōu)于同類其他算法.

6 結(jié)束語

本文把ABC算法改寫為聚類算法,將其求得的聚類中心作為KHM算法的初始中心點并運行KHM算法求得最后聚類結(jié)果.本質(zhì)是借助ABC聚類算法的全局尋優(yōu)特性來克服KHM的固有缺點.實驗結(jié)果表明,本文提出的ABCKHM聚類算法的性能優(yōu)于傳統(tǒng)KHM算法及其他同類算法.但是對于Iris和Wine這樣維數(shù)較高的數(shù)據(jù)集而言,聚類效果還有很大提升空間,將是后續(xù)研究的重點.

[1] XU RUI,DONALD WUNSCH,Survey of clustering algorithms[J].IEEE Transactions on Neural Networks,2005,16(3):645-678.

[2] JIANG HUA,YI SHENGHE,LI JING,et al.Ant clustering algorithm with K-harmonic means clustering [J].Expert Systems with Applications,2010,37(12):8679-8684.

[3] GRIGORIOS TZORTZIS,ARISTIDIS LIKAS.The minmax K-means clustering algorithm[J].Pattern Recognition,2014,47(7):2505-2516.

[4] KRISBNA K,NARASIMHA MURTY M.Genetic K-means algorithm [J].IEEE Transactions on Systems,Man,Cybernetics,Part B,1999,29(3):433-439.

[5] YURTKURAN ALKIN,EMEL ERDAL.An adaptive artificial bee colony algorithm for global optimization [J].Applied Mathematics and Computation,2015,271(15):1004-1023.

[6] GüNG?R Z,üNLER A.K-harmonic means data clustering with tabu-search method [J].Applied Mathematical Modelling,2008,32(6):1115-1125.

[7] SONG X Y,YAN Q F,ZHAO M.An adaptive artificial bee colony algorithm based on objective function value information [J].Applied Soft Computing,2017,55(7):384-401.

[8] KARABOGA D,OZTURK C.A novel clustering approach: artificial bee colony (ABC) algorithm [J].Applied Soft Computing,2011,11(1):652-657.

[9] MARATEA A,PETROSINO A,MANZO M.Adjusted F-measure and kernel scaling for imbalanced data learning [J].Information Sciences,2014,257(1):331-341.

AhybridclusteringalgorithmABCKHMcombiningABCandKHM

JIANG Hua1,2,HU Xin1,2,WANG Zheng1,2,DU Xing-shuo1,2

(1.School of Information Science and Technology,Northeast Normal University,Changchun 130117,China;2.Key Laboratory of Intelligent Information Processing of Jilin Province,Northeast Normal University,Changchun 130117,China)

It is still possible that K-harmonic means clustering algorithm reach local minimal value.Artificial bee colony optimization algorithm has good performance in global optimization,so the clustering algorithm derived from artificial bee colony optimization algorithm ought to overcome the problem of trapping in local optimization.This article proposes a hybrid clustering algorithm (ABCKHM) combining artificial bee colony algorithm and K-harmonic means algorithm.Our algorithm has better global searching capability,faster speed,and stability.

clustering; K-harmonic means clustering; artificial bee colony optimization; artificial bee colony clustering

1000-1832(2017)04-0066-05

10.16163/j.cnki.22-1123/n.2017.04.013

2017-09-29

國家自然科學基金資助項目(71473035).

姜華(1964—),男,碩士,副教授,主要從事數(shù)據(jù)挖掘研究.

TP 31學科代碼520·10

A

(責任編輯:石紹慶)

猜你喜歡
優(yōu)化
超限高層建筑結(jié)構(gòu)設(shè)計與優(yōu)化思考
PEMFC流道的多目標優(yōu)化
能源工程(2022年1期)2022-03-29 01:06:28
民用建筑防煙排煙設(shè)計優(yōu)化探討
關(guān)于優(yōu)化消防安全告知承諾的一些思考
一道優(yōu)化題的幾何解法
由“形”啟“數(shù)”優(yōu)化運算——以2021年解析幾何高考題為例
圍繞“地、業(yè)、人”優(yōu)化產(chǎn)業(yè)扶貧
事業(yè)單位中固定資產(chǎn)會計處理的優(yōu)化
4K HDR性能大幅度優(yōu)化 JVC DLA-X8 18 BC
幾種常見的負載均衡算法的優(yōu)化
電子制作(2017年20期)2017-04-26 06:57:45
主站蜘蛛池模板: 热思思久久免费视频| 在线免费a视频| 亚洲欧美日韩动漫| 久久综合亚洲鲁鲁九月天| 九月婷婷亚洲综合在线| 99在线观看国产| 欧美19综合中文字幕| 色婷婷成人网| 日韩在线成年视频人网站观看| 亚洲精品动漫| 在线色综合| 久久精品午夜视频| 中文字幕久久精品波多野结| 71pao成人国产永久免费视频| 亚洲国产中文综合专区在| Jizz国产色系免费| 五月天福利视频| 国产亚洲高清视频| 国产麻豆精品久久一二三| 18黑白丝水手服自慰喷水网站| 99草精品视频| 亚洲第一成年网| 九九香蕉视频| 91精品情国产情侣高潮对白蜜| 国外欧美一区另类中文字幕| 亚洲欧美日韩中文字幕一区二区三区 | 欧美 亚洲 日韩 国产| 国产www网站| 亚洲第七页| 亚洲高清无码久久久| 日本在线免费网站| 亚洲高清无码久久久| 国产av无码日韩av无码网站| 亚洲第一黄片大全| 看你懂的巨臀中文字幕一区二区| 在线色综合| 狠狠色婷婷丁香综合久久韩国| 亚洲精选无码久久久| 久久精品国产电影| 成人午夜在线播放| 免费看av在线网站网址| 黄色网址免费在线| 婷婷六月在线| 日韩欧美综合在线制服| 成人福利在线观看| 欧美成人一区午夜福利在线| 国产精品欧美在线观看| 中国毛片网| 91成人在线免费视频| 中文无码精品a∨在线观看| 六月婷婷综合| 国产精品性| 国产主播在线观看| 亚洲第一区欧美国产综合| 国产91av在线| 欧美性精品| 亚洲最新网址| 极品国产在线| 国产精品手机在线观看你懂的| 亚洲精品爱草草视频在线| 啪啪啪亚洲无码| 国产成年女人特黄特色大片免费| 免费人成网站在线高清| 亚洲伊人电影| 欧美一区二区三区欧美日韩亚洲| 久久人与动人物A级毛片| 国产肉感大码AV无码| 国产乱人伦AV在线A| 中文无码日韩精品| 国产成人亚洲毛片| 欧美啪啪精品| 亚洲第一天堂无码专区| 日本不卡免费高清视频| 欧美日一级片| 欧美伦理一区| 亚洲a级毛片| 黄色在线不卡| 欧美笫一页| 毛片久久久| 中文天堂在线视频| 国内精品免费| 日本欧美在线观看|