999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

學生成績的動態預警模型

2015-05-12 11:18:50白金劉琳婧周江輝
科教導刊 2015年4期
關鍵詞:數據挖掘

白金 劉琳婧 周江輝

摘 要 通過利用高校教務管理信息儲存的教務信息,開發設計基于數據挖掘的學生成績動態預警模型;引入數據挖掘關聯規則方法和決策樹方法,利用Apriori算法和ID3算法分別對學生成績進行數據挖掘,以期找出課程間的內在聯系,并將它們分別作為關聯規則用于學生成績預警,最后比較兩種算法,選擇較優算法模型作為最后成績預警模型。該預警模型有利于對學生做出提前預警,對提高學生成績具有良好效果。

關鍵詞 數據挖掘 預警模型 關聯規則 決策樹

中圖分類號:TP315 文獻標識碼:A DOI:10.16400/j.cnki.kjdks.2015.02.074

Dynamic Warning Model of Students' Achievement

BAI Jin, LIU Linjing, ZHOU Jianghui

(Business Information College, Shanghai University of International Business and Economics, Shanghai 201600)

Abstract Through the use of the Senate Higher Educational Administration Management Information storage, development and design based on student achievement data mining dynamic warning model; the introduction of data mining association rules and decision tree method using Apriori algorithm and ID3 algorithm separately on student achievement data mining in order to find the intrinsic link between the course and they were used as association rules for student achievement warning, final comparison of the two algorithms, selecting optimum algorithm model as the final score early warning models. The warning model is beneficial for students to make early warning, to improve student achievement with good results.

Key words data mining; warning model; association rules; decision tree

0 引言

隨著高校教務管理信息系統的廣泛應用,高校擁有大量學生的考試成績和教務數據,國內已有一些研究者以數據挖掘技術為基礎面向這些信息展開了數據挖掘工作,如魏順平在《學習分析技術:挖掘大數據時代下教育數據的價值》一文中介紹了教育數據挖掘在我國的發展歷程及相關的概念,并提到了5類教育數據挖掘方法;①葉福蘭則利用數據挖掘技術在高校已有的教育數據上給出了學生成績預警的分析,尋找不及格課程間內在聯系、可能聯系和關鍵因素;②劉斌、陳依潼則利用K-均值聚類方法分析學生評價方式;③以及王璇利用Apriori算法分析大學生心理狀況。④

1 基于數據挖掘技術的成績預警模型

預警主要分為兩個部分:規則產生和規則匹配。規則產生部分,預警模型接收學生成績訓練集,從中依靠內部算法獲取符合要求的成績預警規則。規則匹配部分,預警模型接受待處理學生成績和課程,而后根據規則產生部分產生的規則,進行逐一匹配、篩選,最后輸出預警信息。

如圖1所示,基于數據挖掘的成績預警模型由數據輸入/輸出接口,數據預處理模塊、預警規則挖掘模塊、成績預警規則庫和預警模塊5部分組成。其中,預警規則挖掘模塊是該模型的核心部分,它負責從輸入的訓練集中挖掘預警規則,并將符合條件的規則儲存到預警規則庫中。預警模塊式將從數據預處理模塊里的學生成績和課程信息,與成績預警規則庫中的規則匹配,再根據已設定的預警條件比較,繼而決定是否生成預警信息。數據輸入/輸出接口、預警模塊可以實現實時的學生成績預警信息,到達動態預警的目的。

圖1 基于數據挖掘的成績預警模型

2 基于關聯規則的成績預警模型

2.1 關聯規則和 Apriori算法

設 = {,,……,}是項(Item)的集合。記為事務的集合,事務是項的集合,并且 。對應每一個事務有唯一的標識,如事務號,記作。設是一個中項的集合,如果 ,那么稱事務包含。項的集合稱為項集。包含個項的項集稱為項集。項集的出現頻率是指包含該項集的事務數,簡稱為項集的頻率或支持度計數。

定義1 ?一個關聯規則是形如 的蘊涵式,這里 , ,并且∩= 。

定義2 ?規則 在事務數據中具有支持度,表示支持度S(support)是事務集中同時包含 和的事務數與所有事務數之比,記為support( ),即:

support( ) = ∣{:∪ ,}∣/∣∣?00% = ?%

定義3 ?規則 在事務集中的置信度(confidence)是指包含和的事務數與包含的事務數之比,記為confidence( ),即:

confidence( ) =∣{:∪ ,}∣/∣: ,∣?00% = ?%

定義4 ?同時滿足最小支持度(min_sup)和最小可信度(min_conf)的規則稱為關聯規則,即S( )>min_sup且C( )>min_conf成立時,規則 稱為強關聯規則。

Apriori算法是關聯規則的重要方法,是挖掘布爾型頻繁項目集的算法。它使用一種稱為逐層搜索的迭代方法,“K-項集”用于探索“K+1-項集”。這是一個基于兩階段頻繁集思想的方法,將關聯規則算法的設計分為兩個子問題:①找到所有支持度大于min_sup的項集,即頻繁項集。②使用第一步找到的頻繁項集找到置信度大于或 最小置信度min_conf的關聯規則。

2.2 基于關聯規則的發現

2.2.1 數據預處理

由于目前高校成績數據庫中存貯的成績信息主要是百分制的成績和五分制成績為主,所以需將實驗數據進行處理、變換。本文基于關聯規則的成績預警模型方法是將學生成績變為離散的布爾類型數據(0,1)。具體為:將學生成績大于該科平均分的,記為0;小于該科平均分的,記為1。再添加輔助列“預警”,如果學生成績存在不及格科目,記為“Y”;不存在不及格科目的,記為“N”。一般而言,數據變換的過程需要經歷數據選擇、數據清洗(多次成績處理和缺失成績處理)、數據集成和變換等步驟。

2.2.2 基于關聯規則挖掘結果分析

實現本模型的軟件環境為操作系統為Windows XP,采用Oracle 數據庫管理系統提取學生成績,并使用SPSS Clementine軟件進行數據挖掘工作。根據Clementine軟件的特點,本實驗選擇處理時將低于平均成績記為“1”,高于平均成績的記為“0”。這樣的目的是使本次分析出的關聯規則方向為:對于學生成績不及格情況下,各個課程之間的關聯性。

表1 挖掘出的規則數和類規則平均預測準確率

以教務管理系統中導出信息管理與信息系統2010級和2011級部分學生3年的成績為訓練集,以其余學生3年成績為測試集Dtest,用以挖掘課程和學生成績之間的關聯關系。并最終,選擇信息管理與信息系統的10門必修課程成績作為最后實驗數據。10門課程為:數據結構,數據倉庫與數據挖掘,數據庫原理與應用,操作系統,C++面向對象程序設計,程序設計基礎(英),微積分(I),微積分(II),概率論,線性代數。

設={,,… }為類關聯規則的規則集。將已經產生的關聯規則 ,記為(,),得到類關聯規則:(,) ,為類別。記為類別為“Y”的數據集合。定義類規則:(,)的預警準確率為(),類規則集的預測準確率為()。

(公式1)P()=

(公式2)()=

經過反復試驗、驗證,分別設置最小支持度分別為0.40、0.37、0.34,最小置信度為0.90、0.87和0.84,在此參數條件設置下挖掘類規則集預警準確率。

上文所提出的模型從上述實驗結果看,準確性在60%~70%之間。實驗結果表明,該模型及其方法在實踐上是有效的。

3 基于決策樹算法的成績預警模型

3.1 決策樹算法

決策樹算法是一種典型的分類和預測方法,也是一種逼近離散函數值的方法。它具有算法思想簡單,識別樣本效率高,對噪聲數據有很好的健壯性等優點。決策樹使用樣本的自身屬性作為節點,用屬性取值作為分支的樹型結構。它的根節點是所有樣本中信息量最大的屬性。ID3算法是機器學習領域中最具有影響力的決策樹方法之一,采用自頂向下的遞歸方法C4.5是ID3算法的改進算法,它增加了:能夠對連續屬性離散化處理等變化。而C5.0是C4.5應用于大數據集上的分類算法,主要在執行效率和內存使用方面進行了改進。本文采用C5.0算法進行挖掘分析。

3.2 基于C5.0算法的發現

(1)數據預處理。將如表1所示的原始數據,將成績分為3種:“0<成績<60”記為“差”;將“60<=成績<80”記為“一般”;將“成績=>80”記為“好”。并增加一列“預警”,將學生成績存在掛科的記為“Y”;不存在掛科的記為“N”。

(2)基于C5.0算法挖掘結果分析。使用SPSS Clementine軟件進行分析,選擇將決策樹進行剪枝,將科目:數據倉庫與數據挖掘和C++面向對象程序設計和操作系統從決策樹中剪去。

最后,從決策樹中抽取的規則為(表2):

通過表2可以分析出,微積分A(I)和微積分A(II)對學生影響較大,當該科為“一般”或者“好”時,學生不屬于預警生的概率較大。當學生數據結構不及格時情況時,學生有很大可能成為預警生。因此學校在日常教學活動中,應特別關注學生這幾門課程的學習。

(3)準確性測試。設={,,… }為從決策樹中抽取的規則的規則集。設,,…,為課程名,有個取值:{,,…,}。={,,…}為類別的集合。定義規則: ? ?= ,…, ?= ,then 的預警準確率為,類規則集的預測準確率為。

(公式3)=

(公式4)()=

通過訓練集Dtest,本模型通過上述數據可達到60%的預警準確率。實驗結果也表明,基于決策樹技術的學生動態成績預警模型在實踐上是有效的。但據歷史經驗來看,C5.0算法優勢在與準確性高,而本次試驗準確率卻為60%,初步分析是由于試驗數據有限,對準確性測試過程產生了一些影響。

4 結論

在將兩種方法的輸出轉化為統一輸出后,即兩種方法輸出都為:預警類別,因此,可直接進行準確性比較。通過比較上述兩種模型和方法,發現選用Apriori算法,模型預警率較高。而且C5.0算法預警率較低。對數據的噪聲較為敏感,訓練集中的一些錯誤會對實驗結果產生較大影響。當C5.0算法訓練集增加時,C5.0的決策樹也會變化,所以當學生成績訓練集變化時,成績決策樹變化,從而使預警規則庫發生不斷變化,這對于成績預警過程來說,是不方便的。

通過設計基于關聯規則的成績動態預警模型,初步證明了基于數據挖掘的預警技術是有效的。隨著對應用領域的不斷深入開發,對基于數據挖掘的預警技術的深入研究,相信該模型、機制具有更廣闊的前景。

注釋

① 魏順平.學習分析技術:挖掘大數據時代下教育數據的價值.現在教育技術,2013(2).

② 葉福蘭.基于數據挖掘的高校學生成績預警狀況分析.長春師范學院學報(自然科學版),2013(5).

③ 劉斌,陳依潼.數據挖掘技術在學生成績分析中的應用.電腦編程技巧與維護,2014(16).

④ 王璇.改進的Apriori算法在大學生心理數據分析中的應用.中原工學院院報,2011(22).

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 亚洲精品国偷自产在线91正片| 99热这里只有精品国产99| 亚洲另类第一页| 成色7777精品在线| 久久a级片| 亚洲男人的天堂久久香蕉| 久久婷婷综合色一区二区| 久久伊人久久亚洲综合| 91毛片网| 色亚洲成人| 色屁屁一区二区三区视频国产| 国产爽歪歪免费视频在线观看| 大香伊人久久| 毛片在线播放网址| 伊人久热这里只有精品视频99| 网友自拍视频精品区| 精品久久综合1区2区3区激情| 国产丝袜精品| 欧洲高清无码在线| 波多野结衣视频一区二区| 国产欧美视频一区二区三区| 婷婷色婷婷| 亚洲中文无码av永久伊人| 久久动漫精品| 中文字幕有乳无码| 亚洲第一黄色网| 色综合天天娱乐综合网| 青青青伊人色综合久久| 亚洲第一黄片大全| 伊人久久大香线蕉影院| 国产粉嫩粉嫩的18在线播放91 | 欧美一区二区人人喊爽| 91久久精品国产| 国产精品嫩草影院视频| 午夜在线不卡| 精品福利视频网| 国产精品自在在线午夜区app| 久久黄色一级视频| 国产乱子伦精品视频| 秘书高跟黑色丝袜国产91在线 | 亚洲综合婷婷激情| 99久久国产综合精品2023| 91网红精品在线观看| 在线播放91| 人妻丰满熟妇啪啪| 国产99在线| 久久96热在精品国产高清| 国产一区二区三区日韩精品 | 国产精品永久不卡免费视频| 中文字幕天无码久久精品视频免费 | 国产后式a一视频| 青青草原国产| 538精品在线观看| 国产美女在线观看| 国产乱人伦AV在线A| 天天色综网| 就去色综合| 国产精品尤物铁牛tv | 午夜无码一区二区三区在线app| 91精品视频播放| 日日拍夜夜操| 精品视频一区在线观看| 日本一区二区三区精品视频| 国产资源免费观看| 国产99在线| 欧美日韩动态图| 久久综合AV免费观看| jizz亚洲高清在线观看| 污网站免费在线观看| 91免费在线看| 亚洲浓毛av| 色综合五月婷婷| 久久天天躁狠狠躁夜夜躁| 亚洲开心婷婷中文字幕| 中文字幕亚洲电影| 日韩无码真实干出血视频| 91在线一9|永久视频在线| 毛片网站在线播放| 国产成人久视频免费| 午夜福利亚洲精品| 中国成人在线视频| 欧美有码在线|