999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的聚類數據劃分算法的研究

2021-09-26 13:12:57馬宏艷,楊保銀,彭仁杰
電腦知識與技術 2021年20期
關鍵詞:機器學習

馬宏艷,楊保銀,彭仁杰

摘要:聚類算法是一種典型的無監督學習算法。本文分析了樣本度量算法及類間的度量方法,機器學習中的聚類數據劃分算法有k-平均算法、k-中心點算法,分析了兩種算法的優缺點,最后說明算法在scikit-learn中的應用。

關鍵詞:機器學習;聚類;劃分方法

中圖分類號:TP301? ? ? 文獻標識碼:A

文章編號:1009-3044(2021)20-0009-02

Research on Clustering Data Partition Algorithm Based on Machine Learning

MA Hong-yan

(Information Engineering College, Longdong University, Qingyang 745000, China)

Abstract: Clustering Algorithm is a typical unsupervised learning algorithm. This paper analyzes the sample measurement algorithm and the measurement method between classes, The clustering data partition algorithm in machine learning includes k-something average algorithm and k-something central point algorithm. The advantages and disadvantages of the two algorithms are analyzed.

Key words: machine learning; clustering; partition method

機器學習分為四大塊,分別是classification (分類),clustering (聚類), regression (回歸), dimensionality reduction (降維)。對于一個樣本特征x,預測其對應的屬性值y,如果y是離散的,那就是分類,如果y是連續的實數,就是回歸。對于一組樣本特征S={x∈RD},沒有對應的y, 要發掘這組樣本在D維空間的分布,就是聚類問題。如果想用維數更低的子空間來表示原來高維的特征空間, 那么就是降維問題。

聚類分析在市場銷售研究、模式識別、大數據分析以及圖形圖像處理等方面被廣泛應用。在醫療中,聚類能夠幫助醫生分析已有患者病例從中發現不同的患者群;在精準扶貧的大數據中,根據已脫貧人員的實例獲得對有相同致貧原因的貧困人員定制準確的脫貧措施。

聚類是一種重要的人類活動,也是數據挖掘中用來發現數據分布和模式的一項重要技術。將物理或抽象的集合分成相似的對象類的過程稱為聚類[1](Clustering),同一類數據也稱其為簇(Cluster),這些數據對象在簇內相似,簇間相異。

定義:給定一數據集合D={P1,P2,...,Pn},其中Pi(i=1,2,...,n)稱為數據點(或對象),根據數據點間的相似程度將數據集合分成k組Ci(i=1,2,...,k)(也稱為簇)的過程稱為聚類。

1 聚類中樣本度量方法

相異性度量標準的選擇是一個聚類分析質量的關鍵,聚類算法是通過計算樣本特征空間中的距離來衡量兩個樣本間的相異度[2],當兩個樣本相異較小(相似較大)時,距離值小,反之則大。

假設a和b是相應的特征向量,m是特征的維數,則計算距離度量常用的函數有幾種:

(1) 明可夫斯基距離

a和b的明可夫斯基距離度量:

[d(a,b)=i=1m|ai-bj|r1r]? ? ? ? ? ? ? ? ? ? ? ? ?(1)

當r=1時,轉化為明可夫斯基距離的絕對值距離:

[d(a,b)=i=1m|ai-bj|]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (2)

當r=2時,轉化為明可夫斯基距離的歐氏距離:

[d(a,b)=i=1m|ai-bj|212]? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?(3)

當r趨向于無窮大時,轉化為切比雪夫距離:

[d(a,b)=max|ai-bi|(1≤i≤n)]? ? ? ? ? ? ? ? ?(4)

在以上三種距離中,經常用的距離是歐氏距離,是因為對坐標系進行平移和旋轉變換之后,其值不變,對象的結構和原來相似。

(2) 二次距離

二次型距離測度的形式:

[d(a,b)=(a-b)TA(a-b)12]? ? ? ? ? ? ? ? ? ? ? ?(5)

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網絡搜索數據的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數據分析研究
基于Spark的大數據計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統
基于圖的半監督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 一区二区三区在线不卡免费 | 91蜜芽尤物福利在线观看| 国产1区2区在线观看| 亚洲午夜福利精品无码| 国产高清在线观看91精品| 亚洲人视频在线观看| 亚洲制服中文字幕一区二区| 婷婷中文在线| 亚洲男人天堂久久| 波多野结衣久久高清免费| 色综合狠狠操| 色香蕉网站| 亚洲首页国产精品丝袜| 第一区免费在线观看| 亚洲久悠悠色悠在线播放| 欧美亚洲香蕉| 国产成人福利在线| 五月婷婷综合色| 在线观看91香蕉国产免费| 久草性视频| 91区国产福利在线观看午夜| 五月激情婷婷综合| 国产精品女主播| 欧美日韩国产精品va| 亚洲第一视频网| 色婷婷在线播放| 欧美影院久久| 2022国产无码在线| 国产人成乱码视频免费观看| 国产成人亚洲欧美激情| 欧美精品导航| 国产成人啪视频一区二区三区| 国产亚洲精品资源在线26u| 国产成人免费| 91在线播放免费不卡无毒| 久久不卡国产精品无码| 亚洲无码免费黄色网址| 超薄丝袜足j国产在线视频| 亚洲成人在线免费| 精品福利网| 伊人久久久大香线蕉综合直播| 欧美、日韩、国产综合一区| 四虎国产精品永久在线网址| 亚洲无码在线午夜电影| 国产高清又黄又嫩的免费视频网站| 欧美一级一级做性视频| 伊大人香蕉久久网欧美| 欧美区一区二区三| 国产精品久久自在自线观看| 波多野结衣一区二区三区AV| 色综合狠狠操| 色成人亚洲| 在线视频亚洲色图| 手机永久AV在线播放| 四虎亚洲国产成人久久精品| 亚洲中文字幕国产av| 欧美成人h精品网站| 欧美视频二区| 沈阳少妇高潮在线| 国产精品久久久久久久久kt| 久久99国产乱子伦精品免| 国内精品视频| 免费视频在线2021入口| 免费在线一区| 精久久久久无码区中文字幕| 国内精品小视频福利网址| 免费毛片全部不收费的| 高清无码手机在线观看| 夜夜高潮夜夜爽国产伦精品| 久久婷婷人人澡人人爱91| 国产在线视频福利资源站| 国产午夜不卡| 网友自拍视频精品区| 国模私拍一区二区| 国产原创演绎剧情有字幕的| 亚洲精品国产综合99| 四虎影视库国产精品一区| 国产美女视频黄a视频全免费网站| 久热re国产手机在线观看| 亚洲 成人国产| 国产成人综合网在线观看| 在线精品视频成人网|