999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于K- Means 聚類算法的數據分析

2021-08-23 07:15:44邵小青賈鈺峰章蓬偉
科學技術創新 2021年23期
關鍵詞:分類特征

邵小青 賈鈺峰 章蓬偉 丁 娟

(新疆科技學院信息科學與工程學院,新疆 庫爾勒 841000)

1 概述

機器學習中有兩類大問題:一個是聚類,另一個是分類。聚類是統計學的概念,屬于非監督機器學習(unsupervised learning),應用中數據挖掘,數據分析等領域,根據數據不同特征,將其劃分為不同的數據類,屬于一種無監督學習方法。它的目的是使得屬于同一類別個體之間的密度盡可能的高,而不同類別個體間的密度盡可能的低[1]。分類是用已知的結果類別訓練數據,對預測數據進行預測分類,屬于有監督學習(supervised learning),常見的算法如邏輯回歸、支持向量機、深度學習等。聚類也是對數據進行歸類,不過聚類算法的訓練數據只有輸入,事先并不清楚數據的類別,通過特征的相似性對文本進行無監督的學習分類。聚類試圖將數據集中的樣本劃分為若干個通常不相交的子集,每個子集稱為一個簇(cluster)[2]。K-means 屬于經典聚類算法,根據樣本間的距離或者相異性進行聚類,把特征相似的樣本歸為一類,相異的樣本歸為不同的簇。

2 理論基礎

While(t) t 為迭代次數

For i in range(n+1): #n 為樣本點個數。

For j in range(k+1): #k 為簇的數目。

For i in range(k+1): #計算樣本i 到每個簇質點j 的距離。

找出屬于這個簇中的所有數據點,計算這類的質心。重復以上步驟,直到每類質心變化小于設定的閾值或者達到最大的迭代次數。設置最大特征數,設置分類的組K 值,訓練特征數據進行數據分析。

本文將數據過濾清洗,去除停用詞轉化為向量模型,使用TF-IDF 算法對詞頻進行權重計算,TF 是詞頻,IDF 是逆文檔頻率,TF-IDF 反應了一個詞在文本中的重要性它的值是TF×IDF。 使 用 Python 中 的 sklearn 模 塊 的 TfidfTransformer、CountVectorizer 方法計算TF-IDF 值,轉化為空間向量模型,選用K-means 聚類算法對數據進行挖掘與分析。

3 實驗結果與分析

本文選擇新疆科技學院某專業期末作為分析對象,選取大學信息技術基礎和C 語言程序設計成績作為實驗數據。利用Python 聚類模塊K-means 構建聚類模型并實例化,設置分類K=5 值。其中K 值選取直接影響K-means 算法的準確性,選取K值常見的方法有手肘法、Gap statistic 方法。下一步訓練特征數據,查看聚類結果labels,對數據進行聚類分析,部分代碼如下。

4 結論與不足

通過對數據聚類分析表明成績可以大致分為4 類,其中大學信息技術基礎學生成績較好,C 語言程序設計對學生有一定難度,想要提高總體成績,需要重點放到在C 語言程序設計這門課上,建議優化教學設計,采取任務驅動式教學,分層次因材施教,培養好學生的計算思維能力,為后面的專業課打好基礎。

K-means 具有實現簡單,應用廣泛等優點,但由于需要指定K 值簇,直接影響分類的準確性,聚類結果可能會收斂到局部最小值。對于不規則形狀的數據效果差。在現實生活中,簇并不總是均勻分布的,并且特征的權重很少相等。本文對期末成績數據進行聚類分析是cluser 設置成5,有一定的滿目性,通過迭代9 次各組數據達到收斂。下一步要提高數據集的數量,選擇學生所有的成績數據,合理選擇K 值,高維映射等,優化K-means 算法,更客觀地進行數據分析。

猜你喜歡
分類特征
抓住特征巧觀察
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
新型冠狀病毒及其流行病學特征認識
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
抓住特征巧觀察
主站蜘蛛池模板: 久久毛片网| www亚洲天堂| 99热这里只有精品久久免费 | 国产va视频| 国产成人综合网| 国产成人啪视频一区二区三区| 欧美不卡在线视频| 精品久久蜜桃| 99re热精品视频国产免费| 欧美激情视频一区二区三区免费| 一本大道香蕉久中文在线播放| 中文字幕无码中文字幕有码在线| 日韩第一页在线| 成人午夜天| www.91在线播放| 亚洲第一国产综合| 国产免费羞羞视频| 国产精品福利一区二区久久| 亚洲成人网在线观看| 一区二区三区毛片无码| 亚洲第七页| 国产麻豆精品在线观看| 精品一区二区三区无码视频无码| 欧洲免费精品视频在线| 欧美亚洲欧美| 国产精女同一区二区三区久| 99热这里都是国产精品| 国产sm重味一区二区三区 | 伊人婷婷色香五月综合缴缴情| 久久天天躁狠狠躁夜夜2020一| 亚洲无码电影| 91蝌蚪视频在线观看| 91国语视频| 国产在线一二三区| 一级毛片免费观看不卡视频| 国产永久免费视频m3u8| 午夜免费视频网站| 欧美日韩国产精品va| 92精品国产自产在线观看| 亚洲国产AV无码综合原创| 91精品国产自产在线观看| 欧美一区二区三区不卡免费| 91无码人妻精品一区二区蜜桃| 欧美黄网站免费观看| 自拍亚洲欧美精品| 午夜天堂视频| 亚洲精品无码av中文字幕| 国内精品视频在线| 亚洲最大在线观看| 国产精品片在线观看手机版| 亚洲视频在线观看免费视频| 中国一级特黄视频| 国产在线精品香蕉麻豆| 免费看黄片一区二区三区| 无码精油按摩潮喷在线播放| 香蕉久人久人青草青草| 99在线视频免费| 99精品欧美一区| 国产午夜无码片在线观看网站| 一级片免费网站| 四虎亚洲国产成人久久精品| 日韩欧美国产成人| 天天做天天爱天天爽综合区| 欧美日韩国产在线观看一区二区三区 | 亚洲精品色AV无码看| 波多野结衣AV无码久久一区| 欧美国产日产一区二区| 亚洲五月激情网| 97se亚洲综合不卡 | 久久午夜夜伦鲁鲁片不卡| 狠狠色综合网| 波多野结衣爽到高潮漏水大喷| 欧美爱爱网| 亚洲第一中文字幕| 91国内在线观看| 女人18毛片一级毛片在线| 91无码人妻精品一区二区蜜桃| 久久婷婷六月| 亚洲天堂久久久| 欧美一道本| 91色爱欧美精品www| 欧美日韩国产在线人成app|