999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種基于模糊數(shù)學思想的K均值算法

2016-05-14 15:48:59張昌明
軟件導刊 2016年5期

張昌明

摘要:隨著云計算、移動計算等互聯(lián)網技術的快速發(fā)展,海量數(shù)據(jù)分析已成為企業(yè)戰(zhàn)略決策、營銷推廣的基礎,海量數(shù)據(jù)挖掘愈顯重要。傳統(tǒng)的K均值算法作為一種硬聚類算法存在諸多問題,例如數(shù)據(jù)劃分武斷、準確率較低等。引入模糊數(shù)學思想,提出了一種模糊K均值算法,基于隸屬度關系對數(shù)據(jù)進行了有效的聚類分析,以提高數(shù)據(jù)挖掘的準確度。

關鍵詞:模糊數(shù)學;K均值;硬聚類;隸屬度

DOIDOI:10.11907/rjdk.161041

中圖分類號:TP312

文獻標識碼:A 文章編號:1672-7800(2016)005-0041-03

0 引言

隨著互聯(lián)網技術的快速發(fā)展,多媒體圖像、Web文檔、影像視頻等海量數(shù)據(jù)大量涌現(xiàn),在豐富人們生活的同時,也給檢索帶來了巨大的工作量。采用自動化、智能化、模式化的聚類分析方法,已經成為海量數(shù)據(jù)應用研究的熱點。K均值作為一種聚類算法,其思想和應用執(zhí)行過程較為方便,一直以來受到互聯(lián)網企業(yè)青睞,在入侵檢測、圖像處理、視頻聚類、文本數(shù)據(jù)挖掘、電子商務推薦、遙感信息識別、軟件聚類等領域得到了廣泛應用,取得了較好的效果[1-3]。隨著對K均值算法研究的深入,算法得到了極大的改進。

王敞等[4]分析了K均值聚類算法存在中心設置容易陷入局部最優(yōu)化等問題,提出了一種基于遺傳算法的K均值聚類算法,能夠有效結合遺傳算法尋找全局最優(yōu)。在自適應交叉和變異操作中引入K均值操作,克服了傳統(tǒng)K均值算法的局部性和敏感性,能夠實現(xiàn)較好的聚類效果。陳宗海等[5]分析了聚類算法強化學習過程中,連續(xù)狀態(tài)空間對自適應劃分方法存在的缺點,提出了一種基于節(jié)點生長的K均值聚類算法,分別給出了離散動作和連續(xù)動作下強化學習方法的執(zhí)行步驟,實驗結果顯示,該方法可以自動調整劃分的精確度、優(yōu)化學習最佳策略。高瀅等[6]提出了一種半監(jiān)督K均值多關系數(shù)據(jù)聚類算法,該算法在K均值算法的基礎上,改進了類簇的選擇方法和數(shù)據(jù)對象之間的相似性度量方法,將其應用于多關系的半監(jiān)督學習過程中,充分利用標記數(shù)據(jù)、對象屬性,提高了K均值算法的準確度。陶新民等[7]詳細地分析了K均值算法存在的缺點,提出了一種改進的粒子群優(yōu)化的K均值混合聚類算法。該算法引入小概率隨機變異操作,以便能夠增強種群的多樣性,提高混合聚類算法的全局搜索能力;根據(jù)群體適應度方差確定K均值算法操作的時機,增強局部精確搜索能力,縮短算法的收斂時間。王莉等[8]分析了粗k均值聚類算法易受隨機初始聚類中心和離群點的影響,導致出現(xiàn)一致性和無法收斂的問題,提出了一種改進的粗K均值聚類算法。該算法能夠選擇潛能最大的K個對象作為聚類中心,基于其它數(shù)據(jù)對象和中心之間的距離判定數(shù)據(jù)歸屬類簇,提高了算法準確度,克服了離群點的不利影響。胡偉等[9]分析了K均值算法隨機指定不同的聚類個數(shù)而導致聚類錯誤率較高的問題,集合層次劃分算法,提出了一種改進的層次K均值聚類算法,能夠自底向上聚類分析,形成一棵樹型結構,并且在樹形結構上自動選擇聚類。實驗結果表明,該聚類提高了數(shù)據(jù)分析的準確度。趙冬玲等[10]整合網格聚類和K均值聚類算法優(yōu)勢,提出一種基于網格的K均值聚類算法,改進了算法中計算密度閾值的函數(shù),可以有效降低算法的低凝聚度,提高數(shù)據(jù)聚類分析效率。

傳統(tǒng)聚類算法對初始化的聚類中心比較敏感,并且隨著初始化聚類中心的不同,具有不同的聚類結果,因此需要根據(jù)經驗設置聚類中心,很容易陷入局部最優(yōu)化。另外,傳統(tǒng)的K均值算法屬于硬劃分,每個對象都歸屬于一個具體的類簇,降低了算法的準確度。為了解決上述問題,本文引入模糊聚類思想,提出一種模糊K均值聚類算法。實驗結果表明,該算法能夠有效提高聚類的準確度。

1 背景理論

在聚類算法執(zhí)行過程中,可以對公式(9)和公式(10)進行迭代執(zhí)行,得到一個具體的模糊K均值聚類算法,在實際的數(shù)據(jù)集劃分過程中使用。

本文基于模糊思想的K均值聚類算法描述如下:算法輸入:簇數(shù)目K,參數(shù)b,包含N個數(shù)據(jù)對象的數(shù)據(jù)集。

算法輸出:K個簇。

算法步驟:①采用隨機初始法為數(shù)據(jù)集設定K個簇,并指定每個簇的中心為mi;②計算數(shù)據(jù)集中每個數(shù)據(jù)對象的隸屬函數(shù),計算方法為公式(10);③基于步驟②的隸屬度函數(shù),計算各個簇的中心值mi,計算簇中心采用公式(9);④遍歷數(shù)據(jù)集中每個數(shù)據(jù)對象,當隸屬度不再發(fā)生變化時,算法終止;否則返回步驟②。

3 實驗與結果分析

3.1 實驗數(shù)據(jù)與環(huán)境

系統(tǒng)實驗工具為Matlab2012程序處理平臺,實驗環(huán)境采用的服務器為一臺酷睿雙核PC,CPU型號為i3-2310M,其主頻為2.10GHz,內存為4G,操作系統(tǒng)為Win7。

算法實驗數(shù)據(jù)采用Lang收集的20-NG數(shù)據(jù)集,使用BoW工具對數(shù)據(jù)集進行預處理,從中選擇4 500篇文檔,將這些文檔分成9個子數(shù)據(jù)集,每個數(shù)據(jù)集包含的文章數(shù)量為500篇,具體如下:數(shù)據(jù)集Binary_1、Binary_2、Binary_3分別包含2個檔類別,分別是talk.politics.mideast和talk.politics.misc,每個類別包含250篇文檔;數(shù)據(jù)集Multi5_1、Multi5_2、Multi5_3分別包含5個文檔類別,分別是comp.graphics、rec.motorcycle、rec.sport.baseball、sci.space和talk.politics.mideast,每個類別包含100篇文檔;數(shù)據(jù)集Multi10_1、Multi10_2、Multi10_3分別包含10個文檔類別,分別是sci.electronics、comp.sys.mac.hardware、rec.sport.hockey、misc.forsale、alt.atheism、talk.politics.guns、rec.autos、sci.crypt、sci.med和sci.space,每個類別包含50篇文檔。

4 結語

傳統(tǒng)K均值算法屬于硬劃分,并且算法的初始中心節(jié)點需要人為指定,容易降低算法的執(zhí)行效率及準確度。本文基于模糊聚類思想提出了一種新的K均值聚類算法,將每個數(shù)據(jù)對象按照隸屬度劃分到真實的類別中,提升了算法的準確度。未來工作的方向主要是:①改進模糊聚類隸屬度函數(shù),以便能更有效地提高算法準確度;②基于遺傳算法、粒子群算法、模擬退火算法等,改進K均值初始中心的設置,提高初始設置的準確度,進一步改進算法劃分效果。

參考文獻:

[1]胡艷維, 秦拯, 張忠志. 基于模擬退火與K均值聚類的入侵檢測算法[J]. 計算機科學, 2010, 37(6):122-124.

[2]吳永芳, 楊鑫, 徐敏,等. 基于K均值聚類的醫(yī)學圖像分割算法[J]. 計算機工程, 2011, 37(5):232-234.

[3]楊宏宇, 常媛. 基于K均值多重主成分分析的App-DDoS檢測方法[J]. 通信學報, 2014, 35(5):16-23.

[4]王敞, 陳增強, 袁著祉. 基于遺傳算法的K均值聚類分析[J]. 計算機科學, 2003, 30(2):163-164.

[5]陳宗海, 文鋒, 聶建斌,等. 基于節(jié)點生長k-均值聚類算法的強化學習方法[J]. 計算機研究與發(fā)展, 2006 (4):661-666.

[6]高瀅, 劉大有, 齊紅,等. 一種半監(jiān)督K均值多關系數(shù)據(jù)聚類算法[J]. 軟件學報, 2008,19 (11):2814-2819.

[7]陶新民, 徐晶, 楊立標,等. 一種改進的粒子群和K均值混合聚類算法[J]. 電子與信息學報, 2010, 32(1):92-97.

[8]王莉, 周獻中, 沈捷. 一種改進的粗K均值聚類算法[J]. 控制與決策, 2012,27 (11):1711-1714.

[9]胡偉. 改進的層次K均值聚類算法[J]. 計算機工程與應用, 2013,49 (2):157-159.

[10]趙冬玲, 馮艷若, 潘正運. 基于網格的K-均值聚類分析算法研究[J]. 科技通報, 2014, 30(7):175-179.

(責任編輯:杜能鋼)

主站蜘蛛池模板: 青草娱乐极品免费视频| 国产精品午夜电影| 国产精品蜜臀| 国产精品观看视频免费完整版| 亚洲国模精品一区| 亚洲第一成年免费网站| 亚洲AV人人澡人人双人| 亚洲综合狠狠| 免费xxxxx在线观看网站| 蜜臀AV在线播放| 日本精品视频一区二区| 久久婷婷五月综合97色| 国产sm重味一区二区三区| 国产激情无码一区二区APP| 亚洲精品中文字幕午夜| 免费精品一区二区h| 看看一级毛片| 国产爽妇精品| 丁香婷婷激情综合激情| 久久狠狠色噜噜狠狠狠狠97视色| 久久国产拍爱| 日韩精品高清自在线| 一本色道久久88综合日韩精品| 国产无码性爱一区二区三区| 日本午夜精品一本在线观看| 蜜桃视频一区二区三区| 99re在线免费视频| 亚洲乱亚洲乱妇24p| 国产精品白浆在线播放| 人妻精品全国免费视频| 国产视频 第一页| 中文字幕日韩久久综合影院| 狠狠色狠狠综合久久| 欧美在线视频a| 国产玖玖视频| 国产丝袜精品| 亚洲精品制服丝袜二区| 国产精品成人AⅤ在线一二三四| 亚洲AⅤ波多系列中文字幕| 91口爆吞精国产对白第三集| 91精品国产情侣高潮露脸| 日韩第一页在线| 欧美一级夜夜爽www| 国产亚洲精品自在线| 亚洲中文久久精品无玛| 欧美激情首页| 2024av在线无码中文最新| 亚洲无码精品在线播放| 欧美五月婷婷| 亚洲无码日韩一区| 热99re99首页精品亚洲五月天| 一区二区三区毛片无码| 99这里只有精品在线| 久久婷婷五月综合97色| 日韩欧美国产成人| 色哟哟国产成人精品| 欧美19综合中文字幕| 亚洲成aⅴ人片在线影院八| 国产色图在线观看| 色哟哟国产精品| 亚洲精品日产AⅤ| 日本免费a视频| 91青青视频| 日本a∨在线观看| 久久视精品| 3344在线观看无码| 亚洲成A人V欧美综合| 91年精品国产福利线观看久久 | 中文字幕日韩视频欧美一区| 国产丝袜精品| 十八禁美女裸体网站| 九九香蕉视频| 高清久久精品亚洲日韩Av| 亚洲动漫h| 久久精品亚洲中文字幕乱码| 青青草91视频| 尤物精品视频一区二区三区| 制服无码网站| 波多野结衣视频一区二区| 97人人模人人爽人人喊小说| 麻豆国产原创视频在线播放| 六月婷婷激情综合|