999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于數據挖掘技術的考試作弊風險預警研究

2017-12-16 12:59:00劉麗娜
吉林省教育學院學報 2017年9期
關鍵詞:數據挖掘

劉麗娜

摘要:采用數據挖掘技術對廣州科技職業技術學院已畢業的2009級~2013級5個年級的學生信息進行分析評估。利用SPSS Modeler挖掘工具中的Apriori關聯規則模型對預處理后的數據進行挖掘,發現潛藏其中有應用價值的規則。最后將所挖掘出的規則進行分析解釋,將其應用到教學改革當中,對具有潛在作弊風險的學生進行教育引導,形成考試作弊的預警機制,降柢學生作弊輟學風險,提高學校教育教學質量。

關鍵詞:數據挖掘;Apriori;考試作弊;預警

中圖分類號:TP311.1 文獻標識碼:A 文章編號:1671-1580(2017)09-0120-03

一、數據挖掘技術概述

數據挖掘技術是從不同的角度分析數據并將其歸總為有用信息的過程——可以利用其以增加收入,降低成本或二者兼有之。雖然數據挖掘是一個相對較新的術語,但其技術卻不然,早在數據挖掘一詞出現的很多年前就有公司利用強大的電腦來篩選大量的超市掃描儀數據,并以此來分析市場研究報告。

一談到數據挖掘應用就不得不提到經典的商業零售之啤酒與尿片關聯分析銷售規則。就是人們在大量的購物清單的分析中發現,一般購買啤酒的客戶也會同時購買尿片,這可以啟發零售商有針對性地將這兩樣東西放同一個地方或附近以增加銷售量,事實證明這是一種效果顯著的銷售決策。

數據挖掘包括多種實現算法,不同的算法適用于不同的數據及分析角度,一般較為復雜的挖掘系統會以幾種算法相結合的方式運行。數據挖掘算法技術包括以下幾種常見的算法。

(一)關聯規則

關聯規則是一種規則,它意味著(如“一起出現”或“一個事件的出現必然包含另一個事件”)在數據庫中的某些關聯關系。

(二)遺傳算法

遺傳算法依靠其模仿生物的方法,常用于為運營商解決最優化和搜索問題。

(三)神經網絡

神經網絡近年來備受關注,它以模仿動物神經網絡的行為特征運行在自學學習的數學模型基礎上,為解決大型的負責問題提供了一種相對簡單有效的方法。

(四)決策樹

它是一種決策支持工具,用類似于樹的圖形或模型表示決策或可能的輸出結果。

二、關聯規則挖掘算法Apriori

關聯規則是數據挖掘算法中發現屬性之間關聯性的基于規則的機器學習方法,它主要用于發現“一起出現”或一個事務與另一事務之間出現的必然聯系。它的目的是利用識別措施來發現數據庫中有趣的關系,發現強規則。

Agrawal等人對關聯規則挖掘問題的定義為:設數據庫即所有交易的集合為D:{t1,t2,t3…tn},n為交易記錄數。所有項目(屬性)的集合為I-{i1,i2…im},m為項目(屬性)數量。在數據庫D中,每條記錄都有唯一的m,記錄里所包含的項目(屬性)都在集合I中。而規則的定義為:X→Y,且x,Y∈I。

每條規則都由兩個或兩個以上的項目(屬性)組成,X和Y,其中X稱為規則前項,Y稱為規則后項。

例如,在超市購物時,有一個交易記錄為I={青菜,豆腐,醬油,鹽,面包},在所有交易中選擇其中5條交易記錄組成一個小的數據庫D(如表1所示),用一個表格表示該數據庫,1表示交易中有購買該項商品,0則表示沒有購買該項商品。

該數據庫中的規則為{青菜,豆腐}→{鹽},則表示如果顧客購買了青菜和豆腐,那么他們同時也會購買鹽。

為了從所有可能的規則中找出強規則,關聯規則設置了最低約束指標置信度和支持度來篩選有趣的規則。在以上規則R=X→Y中,支持度為:

Sup=(COUNT(X∧Y)/COUNT(D))*100% (1)

其中COUNT(X∧Y)為同時包含X和Y的項目(屬性)交易記錄總數,COUNT(D)為數據庫記錄數。規則的置信度為:

Conf=(COUNT(X∧Y)/COUNT(X))*100% (2)

其中COUNT(X)為包含X項目(屬性)的交易記錄總數。

在以上例子中,規則{青菜,豆腐}→{鹽}的支持度為3/5*100%=60%,置信度為3/4*100%=75%。

Apriori關聯規則通常需要滿足用戶指定的最小支持度和最小置信度約束,關聯規則的運行程序分為兩個獨立的步驟:

(一)在數據庫中找到所有符合最小支持度的頻繁項集;

(二)在所有找到頻繁項集中根據最小置信度找到強規則。

三、學生數據關聯挖掘模型設計

(一)目標分析

數據挖掘的挖掘結果雖然通過數據分析挖掘才知道具體的規則方向,然而數據挖掘也有明確的挖掘主題和挖掘目標。從所收集到的各數據源進行分析挖掘找出潛在的關聯關系,之后分析關聯結果,并將其應用于教學決策當中。

(二)數據準備

在對數據進行挖掘之前,所有數據源所提供的數據都是雜亂無章的,或數據缺失,或存在噪聲等,增加了數據的運行處理時間,降低了數據的處理效率。因此,在數據挖掘前需對數據進行整合清洗,以使挖掘效率和挖掘結果更快捷準確。

1.聯接各數據源形成學生信息總表

將所收集到的數據源整理形成電子數據表,根據各數據表的主鍵(“學號”或“身份證號”)與外鍵的關系聯接合并為一張有唯一主鍵的多屬性學生信息總表。聯接后清除與挖掘主題無關的屬性,如“姓名”“身份證號”等。

2.數據泛化

數據泛化即將數據庫中包含的數據原始概念層的細節信息從較低的概念層抽象到較高層次的過程。例如學生成績中同專業同課程的成績屬性在0至100之間有大量的不同值,不利于數據關聯挖掘,故需對數據做泛化處理。成績在泛化時可以根據范圍[90,100],[80,90),[70,80),[60,70),[0,60)依次分為優秀、良好、中等、及格和不及格5個成績段,其他屬性以此類推形成各維度的數據總表。endprint

3.噪聲及缺省值處理

信息數據在泛化后有了較統一的結構模式,然而,無論是歷史數據還是現在進行的數據都因為文件錯誤或保存不當,大多存在噪聲或缺失值。數據的不完整性將影響挖掘規則的支持度及可信度,而全部剔除不完整的數據記錄則可能會使重要規則也被一并刪除又或者縮小原本的數據庫。不完整數據的處理方式一般有人工填寫、屬性均值填充、全局常量填充、同類均值填充和忽略記錄等幾種。本研究所收集的數據來自不同的數據源具有不同的表現形式,部分屬性缺失嚴重地選擇了舍棄,而其他缺失值根據數據的性質和類型采用同類均值填充法。

四、依托數據挖掘工具SPSS Modeler的學生數據挖掘實現

本研究以廣州科技職業技術學院已畢業的2009級一2013級5個年級的學生數據為研究對象,將預處理后的17381條記錄,28個維度導入SPSSModeler中的Apriori模型當中,設最小支持度:最小置信度=0.05。

數據經過過濾之后進行類型分類,再進入Apri-ori莫型,運行之后生成各個支持度與置信度的規則分析結果。

五、挖掘結果及規則理解

經Apriori挖掘模型得出的挖掘結果需再進行進一步解釋篩選,本研究所挖掘出的結果解釋如表2。

在所有缺課超過1/3、缺考、舞弊記錄當中(如表2所示),規則“高考成績:[360-400),貧困生=是→缺考違紀=是”以及規則“貧困生=是,圖書借閱次數=0→缺考違紀=是”,支持度和置信度分別為0.063,0.538和0.075,0.436,高考成績為360~400在案例學院(3本B線)所有的錄取成績當中屬于良好層次,在此規則中的學生高考成績較好且家庭比較貧困,在學費相對較高,來之不易的上學機會卻出現缺課或缺考甚至舞弊的現象。數據顯示這批學生大部分鮮少在圖書館借閱圖書。實驗抽取符合該規則中的4名入學成績良好的貧困學生進行調研,其中有2名學生為舍友且同輔導員,經調研發現他們皆因沉迷上網(網絡游戲、電子小說)。在上大學前家庭貧困且無需購置電腦(或手機),大學期間購置之后使他們沉迷于新事物(網絡游戲、電子小說)當中,最終因擔心成績不合格愧對家人繼而鋌而走險。這4名學生其中有2名互為舍友。在了解了這一規則后,學校可以未雨綢繆,幫助并挽救這些學生,同時,這些有網癮的學生有可能會影響整個宿舍,或帶動舍友一起玩游戲或影響他人作息,學校可以根據該規則,在宿舍分配上做相應調整,比如學習好意志力強的學生中插入一些成績差的,把誤入歧途的學生引向正道。

六、結束語

本研究以廣州科技職業技術學院已畢業的5個年級的學生數據為研究對象,采用當前比較新穎的信息技術分析手段——數據挖掘技術,選取數據挖掘技術中的關聯規則Apriori算法模型,SPSS Model,er分析工具對預處理后的數據進行分析。對挖掘結果進行了分析,提出了一種基于數據挖掘的學生考試作弊風險預警機制:基于預警事件和其他事件之間存在依賴或關聯關系定義了一種預警規則知識,根據預警規則可找出存在作弊風險的學生,在學生可能實施作弊之前采取應對措施,防止其作弊。實驗顯示,該預警機制在我校實施取得了一定的效果,嚴肅考風考紀,規范學校管理,提高人才培養質量。

[責任編輯:周海秋]endprint

猜你喜歡
數據挖掘
基于數據挖掘的船舶通信網絡流量異常識別方法
探討人工智能與數據挖掘發展趨勢
數據挖掘技術在打擊倒賣OBU逃費中的應用淺析
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘在高校圖書館中的應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
利用數據挖掘技術實現LIS數據共享的開發實踐
主站蜘蛛池模板: 九色综合伊人久久富二代| 国产成人综合网| 天天色天天操综合网| 久久九九热视频| 99热这里只有免费国产精品| 久久久精品久久久久三级| 国产在线自乱拍播放| 鲁鲁鲁爽爽爽在线视频观看| 欧美亚洲国产精品久久蜜芽| 久草视频中文| 国产精品欧美在线观看| 欧美日韩精品一区二区在线线| 天天综合网色| 中国成人在线视频| 久久精品无码专区免费| 色吊丝av中文字幕| 国产91视频免费观看| av在线人妻熟妇| 制服无码网站| 日本免费一区视频| 亚洲天堂日韩av电影| 无码一区二区三区视频在线播放| 亚卅精品无码久久毛片乌克兰 | 亚洲综合色婷婷中文字幕| 亚洲欧美不卡| 欧美在线综合视频| 成人一级黄色毛片| 欧美一级片在线| 亚洲视频一区| 久久精品国产精品国产一区| 欧美亚洲欧美| 国产精品久久久久久影院| 真实国产乱子伦高清| 亚洲无码视频喷水| 免费视频在线2021入口| 色丁丁毛片在线观看| 欧美午夜理伦三级在线观看| 在线观看的黄网| 最新国产精品第1页| 亚洲国产中文欧美在线人成大黄瓜| 色噜噜久久| 狠狠色综合网| 人妻无码中文字幕一区二区三区| 亚洲黄色激情网站| 久久无码av三级| 欧美综合在线观看| 国产乱子伦精品视频| 亚洲一区二区黄色| 欧美一区精品| 伊伊人成亚洲综合人网7777| 无码久看视频| 成人午夜天| 国产精品免费久久久久影院无码| 亚洲人成在线免费观看| 伊人AV天堂| 日韩毛片在线播放| 中文字幕在线一区二区在线| 中文字幕久久波多野结衣| 久久综合色视频| 亚洲视频影院| 国产激情在线视频| 久爱午夜精品免费视频| 日韩视频精品在线| 四虎精品国产永久在线观看| 麻豆精选在线| 国产精品成人久久| 四虎成人精品在永久免费| 亚洲av无码久久无遮挡| 欧美在线一二区| 国产亚洲精久久久久久久91| 久久久久久久久亚洲精品| 亚洲中文字幕久久精品无码一区| 99久久精品久久久久久婷婷| 中文字幕亚洲综久久2021| 久久鸭综合久久国产| 无码av免费不卡在线观看| 久精品色妇丰满人妻| 狠狠色成人综合首页| 免费一级无码在线网站 | 人妻精品久久无码区| 色妞www精品视频一级下载| 99久久人妻精品免费二区|