999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Apriori算法的學生成績與洗浴時間關聯性分析

2020-06-08 10:47:56李海洋李忠李瑩孫可可
中國教育技術裝備 2020年4期
關鍵詞:數據挖掘大學生

李海洋 李忠 李瑩 孫可可

摘? 要 為了有效地指導學生的日常生活行為,幫助學生提高學習成績,采集某高校學生洗浴數據和成績數據,利用Apriori算法建立關聯分析挖掘模型,通過SPSS Clementine軟件計算得到若干條關聯規則。分析結果說明,當學生在白天洗澡次數多于晚上洗澡次數時,該生的成績明顯表現得不太理想;而當學生在晚上洗澡次數多于白天時,該生在成績方面的表現也是比較優異的。這種關聯關系對高校學生管理工作具有指導意義。

關鍵詞 數據挖掘;Apriori算法;大學生;洗浴時間;學生成績

中圖分類號:G645? ? 文獻標識碼:B

文章編號:1671-489X(2020)04-0038-03

1 引言

隨著我國高校推行信息化,各種各樣的學生信息被記錄下來[1],如上網信息、就餐數據、洗浴數據、進出圖書館時間等,這為深入挖掘學生的生活規律和學習習慣等日常行為特征提供了豐富的數據基礎[2-5]。數據挖掘技術的出現,為從海量數據中找出數據之間的聯系和規律性知識,提供了很好的思路[6]。很多研究者在這方面的研究多集中在圖書館的學習行為[7]、上網行為習慣[8]、日常的體育鍛煉行為[9-10]分析上,很少將洗浴時間與成績進行關聯分析。

本文以防災科技學院學生為例,以2011~2014級學生四年的洗浴數據與教務成績數據為樣本,分析學生成績與洗浴時間之間的關系,試圖發現大學生日常生活行為與學習成績之間的關聯性,給高校學生管理、教學等工作提供參考,指導學生更加合理有效地利用時間,提高學習成績[1]。

2 數據源與預處理

數據來源? 本文收集了防災科技學院2011~2014級的四屆學生的日常洗浴相關數據和各科考試成績數據,其中洗浴數據達到1596萬條,記錄了大學生在校期間每次洗浴的開始時間、結束時間,據此可以計算出每次的洗浴時間長度。

數據預處理? 數據預處理就是在數據挖掘前,對原始數據進行必要的清洗、集成和轉換等一系列的處理工作。大量的實踐表明,在數據挖掘工作中,數據預處理所占的工作量達到整個工作量的60%~80%,所以數據預處理在數據挖掘整個工作中的地位是極其重要的。

數據清洗? 數據清洗的目的是將原始數據中的“臟數據”消除,其中包括填補缺失值、消除噪聲數據和刪除重復數據等[4-5]。在洗浴數據中,需要計算有效時間內的數據,因此無效時間如寒暑假、小長假等時間段內的數據需要剔去;有些數據嚴重偏離正常值,對計算結果容易產生偏差,需要刪除。在學生成績數據中,因留級導致當年成績缺失或者為0,這些數據對結果的分析意義不大,也要刪除[6]。

本文結合浴室開放時間以及上課作息時間,決定選用12—18點的下午時間段以及18—22點的晚上時間段這兩個區間的洗浴數據信息作為研究對象,分析洗浴時間與成績的關系。這兩區間數據統計如圖1所示。從圖1中可以看出,在區間0~100這個范圍內,18—22點的分布少于12—18點;而在100~200這個范圍內,18—22點的洗澡次數明顯多于12—18點的次數,而且18—22點的最大值要遠遠大于12—18點的最大值。這表明大部分學生還是在選擇在晚上洗澡。

數據集成? 對清洗后的洗浴區間對應的洗浴次數表和成績數據,按照學生序號合并為一個數據表,如表1所示。從表1中可以看出,學生晚上洗浴次數普遍多于下午的洗浴次數,且不同的學生洗浴次數差距也比較明顯,如表中18—22點的數據中最大值為151,最小值為7。

數據轉換? 關聯分析挖掘算法Apriori的輸入參數為類別數值,因此需要對成績數據和洗浴數據進行類別劃分。

本文結合本實驗實際需求將成績數據分為三個檔次:將成績由大到小排列,成績前20%的數據段為A檔,可以理解為學習成績優秀;最后20%的數據段為C檔,可以理解為學習成績較差;中間的數據段為B檔,學習成績中等。

本文經過多次實驗檢驗發現,將洗浴次數按照從小到大的順序排列后,取前25%的數據段為Ⅰ類,25%~50%的數據段為Ⅱ類,50%~75%的數據段為Ⅲ類,剩余數據段為Ⅳ類,這樣的劃分規則實驗效果最佳。由于數據源采用的是除去小長假、寒暑假時間的數據,因此有效時間為九個月,將對應的洗澡次數區間轉化為“周/次”數據。洗澡區間12—18點的Ⅰ、Ⅱ、Ⅲ和Ⅳ對應的“周/次”數據分別為1.11、2.05、3.2和14.2;區間18—22點對應的“周/次”數據分別為1.5、2.6、4和17.6。變換后的洗浴數據類與成績數據類的對應關系如表2所示。

3 關聯分析挖掘模型構建

Apriori算法原理? Apriori算法是一種挖掘布爾關聯規則的頻繁項集的數據挖掘算法,使用逐層搜索的迭代策略,K-1項集用于搜索“K項集”,逐步搜索出高可信度的規則。算法的核心思想是連接步和剪枝步。連接步是自連接,原則是保證前K-2項相同,并按照字典順序連接。剪枝步是使任一頻繁項集的所有非空子集也必須是頻繁的。反之,如果某個候選的非空子集不是頻繁的,那么該候選肯定不是頻繁的,從而可以將其從CK中刪除。

利用Apriori算法建立關聯挖掘模型? Apriori算法通過多次掃描數據庫來尋找所有的頻繁項集。對經過處理的學生的洗浴數據來說,每個事務包含有Ⅰ、Ⅱ、Ⅲ和Ⅳ這四個項;對于處理好的成績而言,每個事務包含有A、B和C這三個項,設置最小支持度為min_sup。具體操作如下。

輸入:數據集合D,支持度閾值,最小置信度值。

輸出:強關聯規則。

1)掃描整個數據集,得到所有出現過的數據,作為候選頻繁1項集。K=1,頻繁0項集為空集。

2)挖掘頻繁K項集。

①掃描數據計算候選頻繁K項集的支持度。

②去除候選頻繁K項集中支持度低于閾值的數據集,得到頻繁K項集。如果得到的頻繁K項集為空,則直接返回頻繁K-1項集的集合作為算法結果,算法結束。如果得到的頻繁K項集只有一項,則直接返回頻繁K項集的集合作為算法結果,算法結束。

③基于頻繁K項集,連接生成候選頻繁K+1項集。

3)令K=K+1,轉入步驟2。

4)以此類推,得到頻繁K-項集。

4 關聯規則生成與結果分析

利用Clementine軟件的Apriori算法,將分類數據文件導入軟件。經過反復實驗,確定最小支持度為15%,最小置信度為65%。計算結果如表3所示。從表3中可以看出,學生在下午洗浴次數越多,其成績普遍不理想;在晚上洗浴次數較多時,成績普遍優秀:當學生在晚上洗浴次數為Ⅰ和在下午洗浴次數為Ⅳ時,成績為C;與之相對的是當學生在下午洗浴的次數多,在晚上洗浴次數較少時,成績更好,為A檔;當學生在下午洗浴次數=Ⅰ,在晚上洗浴次數=Ⅱ,和在下午洗浴次數=Ⅰ,在晚上洗浴次數=Ⅲ時,成績都為B,但是后者的支持度和置信度都高于前者,從另一方面也說明了在晚上洗浴多時成績更偏優;從下午和晚上洗浴的次數都特別少、成績為C的這條規則中可以看出,不注重個人衛生的學生可能對學習也不太上心。

5 結語

本次實驗以防災科技學院2011~2014級四屆學生為例,探討大學生洗浴次數和學習成績之間的關聯性,得到結論:一周的洗浴次數低于2.6時,那么學生的成績一般不太理想;每周晚上的洗浴次數大于2.6時,學生的成績普遍表現優;下午洗浴次數明顯多于晚上洗浴次數時,學生的成績往往不太理想。

參考文獻

[1]郭鵬,蔡騁.基于聚類和關聯算法的學生成績挖掘與分析[J].計算機工程與應用2019(17):169-179.

[2]鄒夢君.高校學生行為大數據的分析與應用研究[D].浙江:浙江師范大學,2018.

[3]范仲翔.數據挖掘技術在高校學生行為分析中的研究與應用[D].北京:北京郵電大學,2017.

[4]孫楊博.基于大數據挖掘的高校學生行為數據分析系統的研究與開發[D].北京:華北電力大學,2017.

[5]石靜.基于數據挖掘的學生行為對學業成績影響的研究[D].武漢:華中師范大學,2017.

[6]周梅.數據挖掘技術在教學管理中的應用[J].軟件導刊,2017,16(5):213-215.

[7]郭亨藝.基于圖書館門禁數據的學生讀者到館行為分析:以電子科技大學清水河校區圖書館為例[J].四川圖書館學報,2018(3):61-64.

[8]胡祖輝.施佺.高校學生上網行為分析與數據挖掘研究[J].中國遠程教育,2017(2):26-32.

[9]錢輝煌.朱國華,吳芬,等.關聯分析及神經網絡算法在學生考研成功影響因素分析中的應用[J].軟件導刊,2017,16(5):143-145.

[10]湯羽,林迪,范愛華,等.大數據分析與計算[M].北京:清華大學出版社,2018.

基金項目:中央高?;究蒲袠I務費專項“基于大數據技術的高校大學生行為特征分”(ZY20180121);教育部2018年產學合作協同育人項目“應急大數據智能分析科研平臺”(201801023008)。

作者:李海洋,防災科技學院應急管理學院,主要研究方向為災害信息處理;李忠,防災科技學院應急管理學院,教授,碩導,博士,主要研究方向為災害監測、信息處理;李瑩、孫可可,防災科技學院應急管理學院(065201)。

猜你喜歡
數據挖掘大學生
探討人工智能與數據挖掘發展趨勢
帶父求學的大學生
大學生之歌
黃河之聲(2017年14期)2017-10-11 09:03:59
新大學生之歌
北方音樂(2017年7期)2017-05-16 00:32:46
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
數據挖掘技術在中醫診療數據分析中的應用
一種基于Hadoop的大數據挖掘云服務及應用
數據挖掘的分析與探索
河南科技(2014年23期)2014-02-27 14:18:43
基于GPGPU的離散數據挖掘研究
大學生實習如何落到“實處”
主站蜘蛛池模板: 久久99蜜桃精品久久久久小说| 美女无遮挡免费网站| 97视频精品全国免费观看| 2020国产精品视频| 先锋资源久久| 五月天丁香婷婷综合久久| 一区二区理伦视频| 国产福利一区在线| 澳门av无码| 91午夜福利在线观看| 亚洲午夜福利在线| 国产尤物视频网址导航| 玩两个丰满老熟女久久网| 丰满少妇αⅴ无码区| 欧美伊人色综合久久天天| 国产麻豆另类AV| 无码免费的亚洲视频| 亚洲色偷偷偷鲁综合| 久久久黄色片| 国产精彩视频在线观看| 成人午夜视频免费看欧美| 中文字幕永久在线观看| 亚洲AV一二三区无码AV蜜桃| 亚洲永久免费网站| 国产精品黄色片| 狠狠色综合久久狠狠色综合| 国产麻豆精品久久一二三| 99re经典视频在线| 国产网站在线看| 一级毛片无毒不卡直接观看| 伦精品一区二区三区视频| 亚洲人成日本在线观看| 高清久久精品亚洲日韩Av| 69av免费视频| 亚洲天堂网在线视频| 伊人精品成人久久综合| 国产成人精品视频一区视频二区| 国产精品自拍露脸视频| 亚洲第一色网站| 亚洲国产第一区二区香蕉| 久久久久国产一级毛片高清板| 国模在线视频一区二区三区| 一级片一区| 色综合久久久久8天国| 欧洲免费精品视频在线| 欧美翘臀一区二区三区| 亚洲国产一区在线观看| 免费国产一级 片内射老| 欧美a在线| 国产综合在线观看视频| 青青青国产免费线在| 日韩精品久久久久久久电影蜜臀| 亚洲精品爱草草视频在线| 五月天天天色| 国产精品理论片| 日韩毛片免费观看| 人妻精品全国免费视频| 色欲综合久久中文字幕网| 亚洲成人一区在线| 一级毛片免费播放视频| 免费无码在线观看| 人妻中文久热无码丝袜| 亚洲人成网站色7799在线播放| 国产精品吹潮在线观看中文| 亚洲首页在线观看| 91 九色视频丝袜| 亚洲国产成人麻豆精品| 色九九视频| 亚洲三级色| 鲁鲁鲁爽爽爽在线视频观看| 亚洲自拍另类| 久久婷婷色综合老司机| 青青草国产在线视频| 九色视频线上播放| 国产在线麻豆波多野结衣| 日本在线视频免费| 欧美成人手机在线观看网址| 国产性爱网站| 国产成本人片免费a∨短片| 亚洲天堂在线视频| 亚洲无码高清一区二区| 亚洲欧美日韩另类|