999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘的聚類分析算法研究

2019-11-30 05:41:21劉衛華廣東司法警官職業學院史婷婷仲愷農業工程學院信息科學與技術學院
數碼世界 2019年8期
關鍵詞:數據挖掘融合

劉衛華 廣東司法警官職業學院 史婷婷 仲愷農業工程學院 信息科學與技術學院

前言

在互聯網科技飛速發展的背景下,尤其是大數據技術的不斷發展和數據量的快速增加,其技術的使用率和使用效果以及數據挖掘能力都顯著提升。只有在大量的數據中得到有利信息,找出發展的趨勢,研究數據海洋中存在的規則和規律,才能找到存在數據內的知識和特點。因此,數據挖掘(Data Mining,DM)新技術誕生。

一、主要聚類分析算法介紹

(一)分層聚類方法

分層聚類算法是利用完善系統圖形的方式實施分類的,在不同的葉結點中都有相符的樣本,不同的樹結點也會對應不同的分類,聚類算法依據使用者的需求在不同環節進行分析。在分層聚類算法中包含了凝聚算法與分裂算法。凝聚算法和分裂算法的區別就在于一個是自底向上,而另一個是自頂向下。凝聚算法是把樣本視為一個整體,之后依據有關條件把附樣本進行融合變成全新的一類,按照這種規律進行,一直循環到全部樣本融合變成一個整體類為止;若是想使用分裂算法就有很大不同,首要進行的是把全部樣本視為一個整體類,之后在其中選取距離比較遠的樣本實施分裂,一直開展到全部中只有一個樣本的時候為止。

(二)分割聚類算法

在聚類算法中,分割聚類算法(PartitionalClustering,PC)是當前使用最為廣泛的一種算法,在一般情況下使用數據樣本進行板塊的劃分,之后在針對不同的評價指標對板塊數據實施掌控,對于不符合板塊中的數據分類到其他板塊中,使用不間斷聚類方法完成過程。比較常見的方法有K-Medoids 以及K-Means 等。其中K-Means 是利用隨機和數據收集的方式進行板塊分割的,分割完成后的板塊是K 塊,根據類中不同的權均值,來分別表示此類特點,并且計算其中的距離,把集中的數據分別調至附近的類中,針對M 實施重新計算,計算完后和之前計算結果進行對比,最終完成聚類過程。K-Medoids 在整個算法中屬于類的代表項,在樣本選取之后,把樣本附近的子集融合變成一個類,目標函數指的是樣本附近的距離有著相似性。

(二)大規模聚類方案

BIRCH 是利用分支因子調控來設置B 與門檻值T,在根點出發不斷對數據和節點進行分析,依據符合門檻值數據的狀況來完成吸收與構造修正,得出CF 數值而且通過有關聚類算法對有關數據進行聚類分析。這種算法只具備一次的掃描數據,在時間算法方面有著比較復雜的性質,所以在數據量比較的情況下得到了比較廣泛的應用。CURE 算法基本使用的都是數據抽樣的方式,對相關數據進行樣本分析,把不同的類和附近距離較短的類型聯合起來,建立一個較大的heap。如果類的數值在大于k 的情況下,要使用較小的類進行融合使用,一直到滿足需求條件為止。CURE 算法使用的基本上都是抽樣技術,所以時間的難度是O(K2),其中K 是抽樣中的樣本數量。

(三)模糊聚類

模糊聚類是使用點和類的數值來完成衡量的,點在類中屬于一種程度的表達,該表達對于類界限不清楚具有非常良好的應用效果。在這種算法中,比較常見的類型有PCM 和FCM(Fuzzy c-means) 等。其中PCM 算法是對每個數據點進行計算與比較,只要是數值在滿足條件的基礎上,還要在產生隸屬度的過程中符合基本公式,在這種基礎上就沒有歸一化的約束條件了。利用這種方式形成了每個類之間有了相互獨立的特點。FCM 算法是利用迭代計算聚類來完成目標函數不斷變化的,在新函數和函數之間出現了不一樣的情況時,當新的目標函數與上一次目標函數值之差小于或迭代次數大于T,若是沒有發生上述情況就要對矩陣運算進行修正。

(四)基于柵格的聚類

在柵格聚類算法的基礎上對拓撲構造進行繼承,把點的處理變成空間方面的處理,利用空間劃分來實現聚類的效果,其中最大的優勢就在于數據排序方面和敏感程度,能對屬性不同的數據進行處理和挖掘。STING 算法主要針對的是區域查詢,利用數據構造和信息存放,將每個節點劃分到分層數中。對STING 算法不斷完善與改進,得到STING+算法,兩者在分層構造上有著很多相似之處,主要應該在動態變化和數據挖掘方面。在信號處理部分使用Wave Cluste 算法比較便捷,其對數據和數字的結構識別方面有著較強的分辨率,突出的優勢有:(1)可以對高維空間數據進行處理;(2)具有較強的抗干擾性;(3)聚類效果非常好。柵格的分層構造可以通過Fractal Clustering 算法,此計算方法的優勢在于:(1)可以找出不規則的類;(2)使用的處理方式符合在線處理要求。

二、新發展的聚類算法

在當今時代中,機器學習和人工智能等技術都不斷涌現,因此,聚類算法變成了數據挖掘方面的熱門算法。要想不斷提升數據處理的范圍和能力,部分研究人員對聚類開展了更加深入的分析,從而產生了很多新的聚類計算方式。其中使用較為廣泛的有:聚類集成算法、核聚類算法、不確定聚類算法、基于熵的聚類算法、包括模糊聚類、粗糙聚類、譜聚類算法、球殼聚類算法、基于粒度的聚類算法以及量子聚類算法等。為了得到大量的聚類數據,馬文萍等人在這種背景下,把差分免疫克隆聚類中的硬聚類變成模糊聚類。為了實現非規則程序的不斷劃分,李遠成等人研究出一種模糊聚類形式的劃分方法。由于在時間方面有著很多限制,為了使其在時間算法方面具有簡單性質,劉解放等針對此問題,在貝葉斯模糊聚類中引入加權機制,提出了加權貝葉斯模糊聚類算法,提升了此方法的有效性。

三、結論

聚類算法在完善與創新過程中,不斷融合機器學習、數據挖掘、程序識別等方面的知識。在未來的發展中,智能聚類會與支持向量機、模糊邏輯以及神經網絡等先進技術融合的更加緊密,把聚類分析和群智能兩者實施更好融合將是未來研究的重點。

猜你喜歡
數據挖掘融合
一次函數“四融合”
村企黨建聯建融合共贏
今日農業(2021年19期)2022-01-12 06:16:36
融合菜
從創新出發,與高考數列相遇、融合
探討人工智能與數據挖掘發展趨勢
寬窄融合便攜箱IPFS500
《融合》
現代出版(2020年3期)2020-06-20 07:10:34
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 国产区福利小视频在线观看尤物| 亚洲欧美在线综合图区| 久久久国产精品无码专区| 国产激情无码一区二区免费| 无码人妻免费| www.91在线播放| 亚洲中久无码永久在线观看软件| 免费高清自慰一区二区三区| 国产欧美在线观看精品一区污| 少妇精品网站| 欧美午夜视频| 男人的天堂久久精品激情| 欧美激情第一区| 综合成人国产| 日韩东京热无码人妻| 久久久久久久久亚洲精品| 亚洲首页国产精品丝袜| 中文字幕免费在线视频| 欧美日韩第三页| 日韩欧美中文字幕在线精品| 亚洲三级视频在线观看| 男女猛烈无遮挡午夜视频| 亚洲国产成人自拍| 精品撒尿视频一区二区三区| 99久久无色码中文字幕| 成人日韩视频| 婷婷综合亚洲| 精品无码国产自产野外拍在线| 欧美精品xx| 精品国产成人av免费| 国产精品观看视频免费完整版| 一区二区三区高清视频国产女人| 日韩精品欧美国产在线| 40岁成熟女人牲交片免费| 婷婷中文在线| 国产理论精品| 色哟哟色院91精品网站| 国产成人欧美| 亚洲精品图区| 看看一级毛片| 国产精品免费露脸视频| 狠狠色丁婷婷综合久久| 欧美成人精品一级在线观看| 99色亚洲国产精品11p| 亚洲欧美不卡中文字幕| 国产精品林美惠子在线观看| 影音先锋丝袜制服| 国产麻豆福利av在线播放| 九九这里只有精品视频| 成人午夜久久| 小说区 亚洲 自拍 另类| 一区二区三区成人| 亚洲首页在线观看| 成人国产小视频| 原味小视频在线www国产| 亚洲成人77777| 亚洲男女在线| 成人午夜视频在线| 亚洲人成在线免费观看| 一本综合久久| 高清无码一本到东京热| 国产成人精品一区二区免费看京| 亚洲永久色| 成人精品午夜福利在线播放| 国产办公室秘书无码精品| 欧美精品三级在线| 无码'专区第一页| AⅤ色综合久久天堂AV色综合| 亚洲人成电影在线播放| 成人免费午夜视频| 2021精品国产自在现线看| 精品综合久久久久久97超人| 欧美日韩国产成人高清视频| 亚洲av综合网| 2018日日摸夜夜添狠狠躁| 欧美午夜理伦三级在线观看| 国内精品一区二区在线观看| 99视频在线免费观看| 亚洲日韩精品无码专区| 一区二区在线视频免费观看| 欧洲亚洲欧美国产日本高清| 四虎影视永久在线精品|