999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于關聯規則Apriori算法的學生成績分析

2018-01-24 21:27:22王成勇
價值工程 2018年5期
關鍵詞:數據挖掘

王成勇

摘要:關聯規則挖掘是數據挖掘領域研究的熱點問題,其中Apriori算法是經典的關聯規則算法。將關聯規則Apriori算法應用到學生成績分析中,挖掘出課程與課程之間的相互關系,尋找各方面影響學生成績的因素,發現隱藏在數據背后有價值的信息,從而為學生選課和教師教學以及教學管理工作等提供輔助性的建議與決策。

Abstract: Association rule mining is a hot topic in the field of data mining. Apriori algorithm is a classical association rule algorithm. This paper applies the association rule apriori algorithm to analyze student achievement data, digs out the relationship between the course and the curriculum, finds out the factors that affect the student achievement in all aspects, and finds the hidden information behind the data, so as to provide supplementary advice and decision-making for student course selection, teacher teaching and teaching management.

關鍵詞:學生成績分析;數據挖掘;關聯規則技術;Apriori算法

Key words: student achievement analysis;data mining;association rule technique;Apriori algorithm

中圖分類號:TP311.1 文獻標識碼:A 文章編號:1006-4311(2018)05-0171-03

0 引言

近年來隨著信息技術的飛速發展,數據資源變得越來越豐富,在高校的教學管理系統中存儲了大量的學生成績數據信息,但由于缺乏必要的技術手段,因此只能對這些數據信息進行簡單的統計、備份和查詢。隱藏在這些大量成績數據背后的信息不能得到有效的利用,不利于人才的培養和教學質量的提高,因而迫切需要有更新的技術方法對這些數據進行處理分析。

關聯規則挖掘[1-2]就是一門從歷史數據集中發現隱含模式,從海量數據集中發現潛在的有價值信息的技術方法,它反映了一個事件與其他事件直接依賴或關聯的知識,這幾年已經成為數據挖掘技術研究領域的熱門話題[3]。本文運用關聯規則Apriori算法挖掘學生成績數據,可以挖掘出課程與課程之間的相互關系、影響學生成績的因素等一些有價值的信息,這些信息可為教學及管理工作提供支持性的建議,同時也為更加合理的制定人才培養方案和提高教育教學質量提供科學依據。

1 關聯規則基本理論

2 關聯規則挖掘算法

2.1 尋找頻繁項目集

在對學生成績數據進行關聯規則分析時,這里采用了Apriori算法來尋找全部的頻繁項目集。Apriori算法是一種重要的關聯規則挖掘算法,它使用了一種被稱為逐層搜索的迭代算法,k-項集用于搜索(k+1)-項集。首先需要掃描事物數據庫,累積每個項的計數,然后收集滿足最小支持度的項,從而找出頻繁1-項目集的集合L1。L1用于尋找頻繁2-項目集的集合L2,而L2用于尋找頻繁3-項目集的集合L3,如此下去,直至不能找到頻繁k-項目集Lk為止[4]。

運用頻繁k-項集用于搜索(k+1)-項集是Apriori算法的核心,該步驟分為連接步和剪枝步:

①連接步驟:為了尋找Lk,在k(k>1)次掃描數據庫時,通過Lk-1與自身連接產生候選k-項集的集合Ck。

②剪枝步驟:由于Ck是Lk的超集,即Ck的成員可能是也可能不是頻繁的。需要掃描全部的事務數據庫,確定Ck中每個候選的計數,判斷是否大于或者等于最小支持度計數,如果是,那么便認為該候選是頻繁的。為了壓縮Ck,可以運用Apriori性質:任何一個頻繁項集的全部非空子集也一定是頻繁的,若某個候選的非空子集不是頻繁的,那么該候選項集肯定也不是頻繁的,從而可以將其從Ck中刪去。

Apriori算法描述如下[5-6]:

輸入:數據庫D;最小支持度min_Support

輸出:D中的頻繁項目集L

方法:

L1=find_frequent_1-itemsets(D);;

for(k=2;Lk-1≠Φ;k++){

Ck=apriori_gen(Lk-1,min_Support)

for each transaction t∈D{

Ct=subset(Ck,t);

for each candidate c∈Ct

c.count++;

}

Lk={c∈Ck|c.count?叟min_Support}

}

return L=UkLk

2.2 生成強關聯規則

對于上面得到的每個頻繁項目集L,生成強關聯規則的步驟如下:

①生成L的所有非空子集;

②對于L的每個非空子集S,令R=L-S。

如果有

?叟Min_Confidence

即S?圯R滿足最小置信度閾值,那么輸出關聯規則S?圯R。又因為這個規則是從頻繁項目集L中生成的,因此一定滿足最小支持度閾值,所以這個規則為強關聯規則。根據上面的兩個步驟,就可以得出事物數據庫D的全部強關聯規則。endprint

3 應用Apriori算法分析學生成績

3.1 挖掘目標與流程

關聯規則挖掘必須具有針對性,也就是說挖掘目標要明確,本文希望通過對學生成績數據信息進行研究,找到滿足最小支持度和最小置信度的強關聯規則,挖掘出課程與課程之間的相互關系,并期望以此結果來指導教育教學工作。其中關聯規則挖掘的具體過程如圖1所示。

3.2 數據采集

關聯規則挖掘需要豐富的數據信息作為基礎。本研究選取學生成績數據庫中8門專業課程作為研究對象,選取1000條數據,用以挖掘課程之間的關聯性。學生成績信息數據如表1所示。其中Xuehao為學號,A~H分別代表8門課程。

3.3 數據的處理

通過對原始數據進行簡單的泛化處理,可以得到更加豐富的數據信息[7-8]。在這部分將對成績數據進行離散化,成績達到90分及以上的代表“優秀”、成績在80分(包括80分)到90分之間的代表“良好”、成績在70分(包括70分)到80分之間的代表“中等”、成績在60分(包括60分)到70分之間的代表“及格”、成績在60分以下的代表“不及格”,其中“優秀、良好、中等、及格、不及格”分別用數字“1、2、3、4、5”表示,離散化后的數據如表2所示。

3.4 挖掘關聯規則

這一步的關鍵是選擇恰當的關聯規則挖掘算法對數據進行分析處理。這里采用關聯規則Apriori算法對離散化后的學生成績數據信息進行挖掘。設定最小支持度為25%、最小置信度為60%。運行關聯規則Apriori算法程序后,得到的部分實驗結果如表3所示。

3.5 結果分析

對于挖掘得到的強關聯規則,需要對結果進行分析。根據表3可知,規則1和2說明了學好B課程對于學好G課程有著重要的影響,在安排課程的時候,要將B課程排在前面,同時教師在教學過程中要督促學生學好B課程。

規則3說明如果A課程和C課程學的好,那么F課程也就學的好一些。從規則3的置信度來分析,其置信度為87%,說明A、C課程與F課程的關聯程度比較強。在課程的設置方面,A、C課程需要排在F課程的前面。

規則4和5說明了D、E、H三門課程關聯比較緊密,并且D課程是最關鍵的,教師在講解時要仔細講解,讓學生打好基礎。從表3中還可以得出,這三門課程的開課順序應該為D、H、E,同時盡量要將課程安排在連續的三個學期。其它規則的分析方法也是如此,決策者可以根據具體的實際情況借鑒參考。

4 結論

關聯規則挖掘技術是一種非常有用的技術工具,可以廣泛的應用于教學管理過程中,它能夠挖掘出學生各門課程成績之間的影響程度,找到教學中各方面影響學生學習成績的因素,發現隱藏在成績背后的潛在規律,幫助我們更好地了解課程的設置順序以及課時安排是否科學合理,從而為提高學校的教學管理和人才培養質量起到積極的促進作用。

參考文獻:

[1]梁循.數據挖掘算法與應用[M].北京大學出版社,2006.

[2]Liu J, Liu B, Liu J. Association Rule Mining Algorithm Based On Fuzzy Association Rules Lattice and Apriori[J]. Journal of Convergence Information Technology, 2013, 8(8):399-406.

[3]Chen W, JiaNan. Teaching analysis based on association rule mining[C]// Conference Anthology, IEEE. IEEE, 2013:1-3.

[4]韓天鵬.關聯規則挖掘算法研究及其應用[D].中南民族大學,2008.

[5]Cheng M, Xu K, Gong X. Research on audit log association rule mining based on improved Apriori algorithm[C]// IEEE International Conference on Big Data Analysis. IEEE, 2016:1-7.

[6]Yang Q. The Application of Apriori Algorithm in the Analysis of Excel Skill Test Results[J]. Guide of Science & Education, 2013.

[7]李忠嘩,王鳳利,何丕廉,等.關聯規則挖掘在課程相關分析中的應用[J].河北農業大學學報,2010,33(3):116-119.

[8]黃秋勇.基于關聯規則挖掘的課程設置合理性分析[J].智能計算機與應用,2010(5):57-59.endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 亚洲乱码视频| 三级视频中文字幕| 国产波多野结衣中文在线播放| 2022国产91精品久久久久久| 四虎永久免费地址| 2021国产精品自产拍在线观看 | 青草视频久久| 99精品视频在线观看免费播放| 六月婷婷激情综合| 一级不卡毛片| AV不卡在线永久免费观看| 欧美日韩成人在线观看| 国产成人高精品免费视频| 国产精品视频白浆免费视频| 国产人在线成免费视频| 天堂中文在线资源| 欧美在线一二区| 欧美人人干| 九九线精品视频在线观看| 亚洲精品高清视频| 亚洲精品日产精品乱码不卡| 22sihu国产精品视频影视资讯| 97在线国产视频| 免费一级α片在线观看| 国产一区自拍视频| 精品少妇人妻无码久久| 久久这里只有精品66| 亚洲日韩每日更新| 99精品国产自在现线观看| 天天综合网站| 99热国产这里只有精品无卡顿"| 美女一区二区在线观看| 91精品国产麻豆国产自产在线| 亚洲欧美另类色图| 亚洲一区二区三区麻豆| 欧美日韩动态图| 精品天海翼一区二区| 尤物亚洲最大AV无码网站| 国产午夜福利在线小视频| 97色伦色在线综合视频| 99久久精品国产麻豆婷婷| 国产麻豆91网在线看| 婷婷在线网站| 波多野结衣一二三| 久久久噜噜噜| 精品福利视频网| 99视频只有精品| 久久中文电影| 国产视频a| 亚洲色成人www在线观看| 国产福利在线免费观看| 免费无码AV片在线观看国产| 一级毛片免费不卡在线视频| 色综合久久综合网| 91色在线视频| 国产无遮挡猛进猛出免费软件| 欧美在线导航| 国产丝袜无码一区二区视频| 国产日韩久久久久无码精品| 在线播放91| 狠狠ⅴ日韩v欧美v天堂| 午夜精品久久久久久久无码软件| 久青草免费在线视频| 日韩黄色精品| 成年女人a毛片免费视频| 免费 国产 无码久久久| 精品五夜婷香蕉国产线看观看| 亚洲码一区二区三区| 永久成人无码激情视频免费| 亚洲av无码成人专区| 大香伊人久久| 99re在线视频观看| 欧美日本在线观看| 国产美女91视频| 5388国产亚洲欧美在线观看| 色婷婷电影网| 国产成人无码综合亚洲日韩不卡| 久久久国产精品无码专区| 亚洲欧美日本国产专区一区| 欧美成人手机在线观看网址| 亚洲成人精品在线| 最新国产网站|