999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于決策樹(shù)算法在學(xué)生成績(jī)上的應(yīng)用

2019-04-10 07:01:16薛亞楠楊曉東
科技資訊 2019年36期
關(guān)鍵詞:數(shù)據(jù)挖掘

薛亞楠 楊曉東

摘 ?要:決策樹(shù)是從一組無(wú)規(guī)則并且無(wú)次序的數(shù)據(jù)集中求解分類(lèi)問(wèn)題的重要技術(shù)。決策樹(shù)不僅是從數(shù)據(jù)集中生成分類(lèi)器的有效方法,同時(shí)也是數(shù)據(jù)挖掘技術(shù)中一個(gè)活躍的研究領(lǐng)域。通過(guò)決策樹(shù)挖掘可以對(duì)數(shù)據(jù)進(jìn)行分類(lèi)。該文以學(xué)生學(xué)習(xí)態(tài)度、完成作業(yè)情況、考勤等為因素,利用決策樹(shù)技術(shù)分析影響學(xué)生成績(jī)的因素,對(duì)學(xué)生成績(jī)的影響因素加以探討。

關(guān)鍵詞:數(shù)據(jù)挖掘 ?決策樹(shù)方法 ?學(xué)生成績(jī)

中圖分類(lèi)號(hào):G64 ? 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2019)12(c)-0083-02

在數(shù)據(jù)挖掘和數(shù)據(jù)分析中,決策樹(shù)起著非常重要的作用,其可以構(gòu)建一個(gè)決策系統(tǒng),對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。決策樹(shù)的結(jié)構(gòu)類(lèi)似樹(shù)型結(jié)構(gòu),利用樹(shù)的結(jié)構(gòu)將記錄進(jìn)行分類(lèi),樹(shù)的一個(gè)葉結(jié)點(diǎn)就代表某個(gè)條件下的一個(gè)記錄集。并根據(jù)記錄字段的不同取值建立分支,以此重復(fù),便可生成決策樹(shù)。根據(jù)決策樹(shù)的結(jié)構(gòu)對(duì)數(shù)據(jù)集中的屬性值進(jìn)行測(cè)試可以對(duì)未知數(shù)據(jù)對(duì)象進(jìn)行分類(lèi)識(shí)別。決策樹(shù)的常用算法包括:ID3算法、C4.5算法、CART算法、CHAID算法等。

1 ?決策樹(shù)方法的特點(diǎn)

決策樹(shù)因其形狀像樹(shù)。所以特點(diǎn)包括:(1)一個(gè)決策樹(shù)由一系列節(jié)點(diǎn)和分支組成。(2)節(jié)點(diǎn)和子節(jié)點(diǎn)之間形成分支,節(jié)點(diǎn)代表著決策過(guò)程中所考慮的屬性,不同屬性值形成不同分支。

基于CLS算法思想和Quinlan的ID3算法思想,改進(jìn)的決策樹(shù)學(xué)習(xí)算法如下。

(1)生成一顆空決策樹(shù)和一張訓(xùn)練樣本表。

(2)若訓(xùn)練樣本集T中的所有樣本都屬于同一類(lèi),則生成結(jié)點(diǎn)T,并終止學(xué)習(xí)算法。

(3)根據(jù)最大信息增益的原則,先從訓(xùn)練樣本屬性中選擇信息增益最大的屬性,并生成測(cè)試性結(jié)點(diǎn),即根結(jié)點(diǎn)A。

(4)若A的取值為a1,a2,…,am,則根據(jù)A取值不同,將 T劃分為m個(gè)子集T1,T2,…,Tm。

(5)對(duì)每一個(gè)Ti(1≤i≤m),轉(zhuǎn)步驟(2)。

2 ?實(shí)證分析

該研究用例是采用某大學(xué)學(xué)生期末數(shù)學(xué)成績(jī)數(shù)據(jù)作為挖掘?qū)ο螅瑪?shù)據(jù)來(lái)源于網(wǎng)絡(luò)。通過(guò)挖掘分析,找出影響學(xué)生成績(jī)的主要因素。該文采用基于ID3算法的改進(jìn)算法建立決策樹(shù)。建立決策樹(shù),應(yīng)從以下屬性考慮:(1)學(xué)生對(duì)數(shù)學(xué)課的感興趣程度;(2)學(xué)習(xí)態(tài)度;(3)出勤情況;(4)獨(dú)立完成作業(yè)情況。

如表1所示,經(jīng)過(guò)數(shù)據(jù)處理后的數(shù)據(jù)成績(jī)信息的訓(xùn)練集,將考試結(jié)果分為4類(lèi)。具體為:A(優(yōu)秀)、B(良好)、C(及格)、D(不及格)。我們的輸出結(jié)果是A、B、C、D,一共30條記錄。其中,取值為A的記錄有17個(gè),取值為B的記錄有9個(gè),取值為C的記錄有2個(gè),取值為D的記錄有2個(gè)。則樣本S記為:S1=17,S2=9,S3=2,S4=2。

根據(jù)熵的計(jì)算公式,得到:

下面計(jì)算信息增益:分別以“對(duì)數(shù)學(xué)課感興趣的程度”“學(xué)習(xí)態(tài)度”“課堂考勤”等作為根結(jié)點(diǎn),計(jì)算其信息增益。以屬性“對(duì)數(shù)學(xué)感興趣的程度”作為根節(jié)點(diǎn)。取值為感興趣的記錄有17個(gè),其中有14個(gè)A、2個(gè)B、1個(gè)C,0個(gè)D;取值為一般的記錄有11個(gè),其中有3個(gè)A,7個(gè)B,0個(gè) C,1個(gè)D;取值為不感興趣的記錄有2個(gè),其中1個(gè)D,1個(gè)C,0個(gè)A,0個(gè)B。

計(jì)算其相應(yīng)的熵:

然后計(jì)算其相應(yīng)的信息增益:

同理,我們得到了以上4個(gè)屬性相應(yīng)的信息增值Gain(對(duì)數(shù)學(xué)的感興趣程度)=0.511972,Gain(學(xué)習(xí)態(tài)度)=0.708688,Gain(課堂考勤)=0.395689,Gain(獨(dú)立完成作業(yè)情況)=0.77499。

最后按信息增益最大的原則選 “獨(dú)立完成作業(yè)情況”作為根結(jié)點(diǎn),并將樣本分成3個(gè)部分,然后對(duì)每一棵子樹(shù)按照遞歸的方法計(jì)算,并且進(jìn)行剪枝,最后得出的決策樹(shù)如圖1所示。

從研究得到的決策樹(shù)發(fā)現(xiàn),考試結(jié)果多數(shù)是A(優(yōu)秀)的學(xué)生在作業(yè)完成時(shí),獨(dú)立完成作業(yè)情況很好,對(duì)數(shù)學(xué)感興趣的學(xué)生往往考試結(jié)果也較好,多數(shù)為A(優(yōu)秀)或B(良好);而相反,獨(dú)立完成作業(yè)較差或?qū)?shù)學(xué)不感興趣的學(xué)生,往往考試結(jié)果都不理想。另外,學(xué)生的學(xué)習(xí)態(tài)度也是一個(gè)不容忽視的因素。

3 ?結(jié)語(yǔ)

該文通過(guò)一個(gè)實(shí)例表述了數(shù)據(jù)挖掘技術(shù)在學(xué)生成績(jī)分析中的應(yīng)用,通過(guò)決策樹(shù)方法能夠分析影響學(xué)生學(xué)習(xí)成績(jī)因素的原因,獨(dú)立完成作業(yè)情況,課堂考勤以及學(xué)習(xí)態(tài)度都對(duì)學(xué)生成績(jī)有著相互影響,通過(guò)分析影響學(xué)生成績(jī)的因素,從而制定相應(yīng)的措施,達(dá)到提高教學(xué)質(zhì)量的目的,同時(shí)對(duì)于學(xué)校和教師來(lái)說(shuō)可以通過(guò)決策樹(shù)分析重點(diǎn)管理學(xué)生,幫助有效提高學(xué)習(xí)成績(jī)。

參考文獻(xiàn)

[1] 朱迪茨.實(shí)用數(shù)據(jù)挖掘[M].北京:電子工業(yè)出版社,2004.

[2] 魏萍萍,王翠茹,王保義,等.數(shù)據(jù)挖掘技術(shù)及其在高校教學(xué)系統(tǒng)中的應(yīng)用[J].計(jì)算機(jī)工程,2003(11):87-89.

[3] (英)漢德(Hand,D.),著.數(shù)據(jù)挖掘原理[M].張銀奎,譯.北京:機(jī)械工業(yè)出版社,2003.

[4] 王名揚(yáng).基于數(shù)據(jù)挖掘的決策樹(shù)生成與剪枝方法[J].計(jì)算機(jī)工程與科學(xué),2005(11):19-20.

[5] 楊清.基于決策樹(shù)的學(xué)習(xí)算法[J].湘潭師范學(xué)院學(xué)報(bào),2005(3):24-25.

[6] 黃芳.基于數(shù)據(jù)挖掘的決策樹(shù)技術(shù)在成績(jī)分析中的應(yīng)用研究[D].山東大學(xué),2009.

猜你喜歡
數(shù)據(jù)挖掘
基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
數(shù)據(jù)挖掘技術(shù)在打擊倒賣(mài)OBU逃費(fèi)中的應(yīng)用淺析
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘在高校圖書(shū)館中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數(shù)據(jù)挖掘研究
利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開(kāi)發(fā)實(shí)踐
主站蜘蛛池模板: 国产色伊人| 欧美激情视频二区| 青青国产视频| 无码专区在线观看| 国产交换配偶在线视频| 亚洲首页国产精品丝袜| 国产精品久久自在自线观看| 国产色婷婷视频在线观看| 国产成人福利在线| 国产午夜一级毛片| 久久香蕉国产线看观看式| 色屁屁一区二区三区视频国产| 朝桐光一区二区| 日韩黄色大片免费看| 欧美日韩午夜视频在线观看| 日韩欧美中文| 特级毛片免费视频| 男女男免费视频网站国产| 日韩欧美成人高清在线观看| 日本精品αv中文字幕| 99热这里只有精品在线观看| AV熟女乱| 亚洲伊人天堂| 亚洲欧美在线综合图区| 国产亚洲精品无码专| 高清久久精品亚洲日韩Av| 91色在线观看| 精品国产Av电影无码久久久| 亚洲一区二区无码视频| 国产欧美另类| 国产视频欧美| 4虎影视国产在线观看精品| 国产91九色在线播放| 四虎影院国产| 在线播放精品一区二区啪视频| 国产激情无码一区二区APP| 综合久久久久久久综合网| 国产激情无码一区二区APP| 亚洲一级毛片在线观| 国产女同自拍视频| 久久这里只精品国产99热8| 亚洲一级无毛片无码在线免费视频| 激情亚洲天堂| 亚洲国产中文欧美在线人成大黄瓜| 国产亚洲精品自在久久不卡| 午夜久久影院| 成人在线视频一区| 久久国产精品电影| 国产精品手机在线播放| 欧美一区二区三区香蕉视| 国产成人1024精品下载| 亚洲国产成人在线| 久久婷婷六月| 亚洲精品国产综合99| 中文字幕无码av专区久久| 91成人在线观看| 欧美色图久久| 国产亚洲第一页| 青青青国产视频| 99激情网| 乱色熟女综合一区二区| 中国一级特黄大片在线观看| 小蝌蚪亚洲精品国产| 韩国v欧美v亚洲v日本v| 国产精品网拍在线| 久久综合亚洲鲁鲁九月天| 无码一区二区三区视频在线播放| 国产毛片片精品天天看视频| 精品国产一区91在线| 无码一区18禁| 老司国产精品视频91| 2021国产精品自产拍在线| 精品欧美一区二区三区久久久| 亚洲精品人成网线在线| 91视频免费观看网站| 国产天天射| h网站在线播放| 久久香蕉国产线看观| 中文字幕一区二区人妻电影| 色婷婷在线播放| 2021亚洲精品不卡a| 国产一级小视频|