999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于SVM算法的學生學習行為聚類分析

2018-10-19 16:09:22楊子恒
科學與財富 2018年25期
關鍵詞:數據挖掘特征分析

摘要:針對數據挖掘算法以及在解決在線學習領域中解決復雜問題的優勢及不足,本文提出一種基于支持向量機SVM算法的學生學習行為聚類算法,并將基于隨機森林模型下的基尼指標特征加權的支持向量機方法應用于學生學習行為分析中。從而改善了SVM算法在分類識別方面性能,并且驗證了采用數據挖掘算法應用到分析學生學習行為是可行的,并且具有較高的準確性。

關鍵詞:SVM;學習行為聚類

1 引言

隨著計算機網絡技術的不斷發展和互聯網應用的普及,信息技術正在不斷地改變我們傳統的教育教學模式。數據挖掘于2003年正式開啟開發和研究工作,美國的七所頂尖院校的研究人員共同提出了“數據挖掘VGrADS和網格虛擬化”的項目,之后Amazon、Giftag、Saleforce.com以及IBM都使用數據挖掘來提高自己在業界的競爭力。例如,Google以企業搜索、應用托管等形式向企業提供Google開放云,而Microsoft推出了Live Mesh這種網絡管理和數據存儲軟件來與Google競爭。在2006年Amazon推出了彈性計算云和簡單存儲服務,是建立在2004年Amazon提出了MechanicalTurk、簡單隊列服務等數據挖掘服務雛形之上的。在2008年,IBM提出了公有云和私有云的定義。而Apple公司近年來也相繼推出iTunes服務以及MobileMe服務等,標志向數據挖掘開始進軍。從而采用數據挖掘技術進行學生學習行為分析將十分有必要,并且會迅速掀起了一場全球范圍的教育技術革命,得到了教育界、高校教師和學生以及社會受眾的普遍歡迎。

2 改進的支持向量機SVM

特征加權支持向量機由核函數經特征加權構造的支持向量機。并且特征加權核函數的定義為:

若Kp是定義在X*X(X∈Rn)上的核函數, p是已知的待輸入集的n階線性變換矩陣,其中n為待輸入集的維數。特征加權核函數Kp定義為

(1)

由于在隨機森林(RandomForest)模型中可以根據Gini指標來確定每個樣本自變量對應變量的影響程度,即確定樣本量中特征屬性的重要性,并且本文將特征加權核函數的 值進行優化,用此Gini指標確定樣本特征的重要性之后,構造了在RandomForest模型下的Gini指標特征加權的支持向量機,即為改進的支持向量機SVM。

改進支持向量機SVM算法的詳細步驟如下:

Step1.確定樣本集S,即為:

其中x(i)為特征變量,y(i)為類別量。

Step2.在隨機森林模型下計算各個特征變量的Gini指標,標準化各個指標參數,并以所得指標參數對其相應的特征屬性加權,構造加權的特征向量: 來優化核函數中的原始特征內積。

Step3.構造待輸入空間的線性變換矩陣 (也可以是一個數據向量或者是一稀疏矩陣),以p建立特征加權的核函數Kp。

Step4.對所建立的核函數Kp進行有效性判定;如果假設K是正定的,則根據定義有:

(2)

Step5.應用所構造的特征加權的核函數 在程序設計中替換傳統的支持向量機SVM模型中的線性核函數,并且輸出核心的SVM構造分類器,與此同時,對構造的改進的支持向量機SVM算法進行性能測試。

3 實驗與結果分析

為了驗證所提出方法的可行性及實用性,本文學生進行了實驗,該數據集的原始樣本共有699行數據,10列特征屬性,在 R語言的R-Studio環境中對其進行數據清洗預處理,消除了其中缺失以及不完整的樣本,得到683行10列數據集。然后在隨機森林模型中用VarImpPlot()函數包對清洗后的數據進行特征分析。本文將以上三種算法在學生數據庫中的多個在線學習學生學習行為分析數據集上進行了實驗,將數據集分別應用前面所提到的SVM, FWSVM, 改進的支持向量機SVM三種算法在MATLAB 2014a環境中進行仿真實驗,其統計結果如圖1所示:

UCI在線學習學生學習行為分析數據集對比實驗結果的分析如圖1所示,在這五個分析數據上,可以看出本文所提出的改進的支持向量機SVM算法算法平均的識別性能相對最高,而經典的SVM算法的識別性能最差,但總體而言,本文所提出的改進的支持向量機SVM算法在在線學習中識別的正確率最高,效果最為明顯。

綜上實驗數據可知,本文提出的基于隨機森林模型下Gini指標的特征加權支持向量機算法的的正確率相對更高,分類性能相對更具優勢。

4總結

本文通過分析數據挖掘算法以及在解決在線學習領域中復雜問題的優勢及不足,提出一種基于支持向量機SVM算法的學生學習行為聚類算法,并將基于隨機森林模型下的基尼指標特征加權的支持向量機方法應用于學生學習行為分析中。從而改善了SVM算法在分類識別方面性能,而且驗證了采用數據挖掘算法應用到分析學生學習行為的可行性以及準確性,實驗結果表明,本文所提出的改進的支持向量機SVM算法在在線學習中識別的正確率最高,效果最為明顯。

參考文獻:

[1] 黃晟. 基于變電站為中心的配電網電壓態勢圖片圖形特征的態勢評估模型及算法[D]. 杭州電子科技大學, 2017.

[2] 許國棟. 半監督學習框架下基于圖的SVM分類算法研究[D]. 北方民族大學, 2017.

楊子恒(1986.9-),男,漢族,原籍湖南常德,香港中文大學信息工程系碩士研究生,現任天津華泰克數碼科技有限公司總經理,主要從事政府和企事業單位信息化建設方面的工作。歷經公安、大型醫院、高職院校等多處的重大信息化建設項目的管理工作,對大數據、虛擬現實、網絡及音視頻、安全防范技術等方向有較深的設計及實施經驗。

猜你喜歡
數據挖掘特征分析
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
抓住特征巧觀察
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統及其自動化發展趨勢分析
一種基于Hadoop的大數據挖掘云服務及應用
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
主站蜘蛛池模板: 国产一二视频| 久久国产精品麻豆系列| 色窝窝免费一区二区三区| 亚洲一区二区成人| 国产精品美女在线| 日本免费一级视频| 国产成人无码久久久久毛片| 国产91透明丝袜美腿在线| 久久青草免费91线频观看不卡| 亚洲va欧美va国产综合下载| 国产精品欧美激情| 国产精品无码一二三视频| 国产精品久久自在自线观看| 91麻豆国产视频| 91精品在线视频观看| 91久久精品国产| 亚洲天堂久久新| 久久久久亚洲AV成人人电影软件 | 精品伊人久久久大香线蕉欧美| 26uuu国产精品视频| 亚洲第一视频网站| 91 九色视频丝袜| 国产免费久久精品44| 日本一本在线视频| 中文字幕亚洲综久久2021| 91在线一9|永久视频在线| 一级做a爰片久久免费| YW尤物AV无码国产在线观看| 亚洲精品制服丝袜二区| 亚洲色图综合在线| 2020最新国产精品视频| 美女国产在线| 亚洲无码高清免费视频亚洲 | 亚洲国产天堂久久综合226114| 1769国产精品免费视频| 亚洲精品少妇熟女| 精品国产Ⅴ无码大片在线观看81| 高清无码一本到东京热| 国产永久在线观看| 97超级碰碰碰碰精品| a毛片在线播放| 国产无套粉嫩白浆| 四虎影视无码永久免费观看| 好吊色妇女免费视频免费| 国产va在线观看| 91精品国产一区自在线拍| 手机精品视频在线观看免费| 日韩精品免费一线在线观看| 欧美不卡二区| 亚洲人成影视在线观看| 亚洲一级毛片在线观| 91视频青青草| 18禁黄无遮挡免费动漫网站| 2020精品极品国产色在线观看| 亚洲精品日产精品乱码不卡| 在线观看91精品国产剧情免费| 青青热久麻豆精品视频在线观看| 天堂岛国av无码免费无禁网站| 欧美国产日韩在线| 久久一本日韩精品中文字幕屁孩| 在线观看无码av免费不卡网站| 欧美日韩免费观看| 精品国产香蕉伊思人在线| 亚洲综合婷婷激情| 日韩欧美国产三级| 国产免费一级精品视频| 福利姬国产精品一区在线| 中文字幕在线日本| 不卡视频国产| 福利一区在线| 中日韩一区二区三区中文免费视频| 一级高清毛片免费a级高清毛片| 亚州AV秘 一区二区三区| 真人免费一级毛片一区二区| 亚洲无码日韩一区| 日本欧美中文字幕精品亚洲| www.亚洲一区| 蝌蚪国产精品视频第一页| 亚洲色欲色欲www在线观看| 香蕉99国内自产自拍视频| 天天综合网在线| 亚洲伦理一区二区|