顧寶程 王明艷



摘要 針對校園無線網對大學生學習行為的影響,通過采集的校園無線網行為數據,挖掘分析評估學生課程興趣度,更好地輔助教學管理。本文基于DBSCAN聚類算法評估了學生群體課程學習興趣度。并通過實驗驗證了DBSCAN聚類算法在大學生課程興趣度分析的有效性,實驗分析結果可為學校學生管理提供了有效決策依據,研究方法也可為其他高校解決類似問題提供了參考。
【關鍵詞】數據挖掘 DBSCAN算法 聚類算法興趣度分析
隨著高等教育信息化的發展,越來越多的高校應用無線網絡進行信息化教學管理,校園無線網里面蘊藏著大量的用戶上網數據。對高校大量的學生上網數據加以挖掘分析,發現學生上網行為特征,對校園無線網的調整和學生上網行為有著積極的引導作用。目前,基于校園無線網絡的數據利用比較多,主要是進行考勤分析的,入侵檢測,流量監控,后勤管理等方面的研究分析。文獻[2]通過對基于無線網對學生的出勤率來分析學生的學習興趣,文獻[3]通過最小關聯挖掘的技術,從學生選課數據庫中來分析學生的學習行為。通過挖掘學生上課時的上網流量總和對學生課程興趣度分析研究較少。本文主要針對校園網無線網對大學生學習行為影響,采用DBSCAN(Density-BasedSpatial Clustering of Applications with Noise)算法來進行聚類分析,對學生上網數據進行挖掘分析,分析學生上課用網的時長和流量總和來分析體現學生對課程的喜愛程度,從而輔助高校教育教學管理。
1 算法原理
DBSCAN是一種典型的基于密度的聚類算法,將足夠高密度的區域劃分為簇,在帶有“噪聲”的空間數據庫中發現任意形狀的聚類,由Erman等人[5]第一次將其運用到流量分類中,并證明了DBSCAN算法對未知流量的識別準確率優于同是聚類算法的K- means算法。在DBSCAN算法中,有兩個基本的鄰域參數,分別是ε領域和MinPts。其中£領域表示的是在數據集D中與樣本點xi的距離不大于£的樣本即:Nε(xi)={xj∈D|dist(xi,xj)≤ε},如圖1。
在DBSCAN算法中將數據點分為核心點(Core Points)、邊界點(Border Points)、噪音點(Noise)。核心點、邊界點和噪音點如圖2,直接密度可達、密度可達如圖3。
2 實驗及結果分析
數據來自校園無線網的計費數據庫,學生或者老師每天使用的日志都被記錄下來。其數據庫的存儲形式如表1。
實驗的環境采用Python機器學習科學計算庫Scikit leam,簡稱skleam。通過獲取學院軟件工程專業4個班級127名學生在10-11兩個月學生上專業課程的上網信息。分別對《計算機組成原理》、 《計算機網絡原理》、《程序語言與設計》3門專業課學生上課時上網行為數據進行分析。為了客觀公正根據實際上課的考勤情況去除缺課學生的數據,通過DBSCAN的算法進行分析。數據統計結果如圖4、5、6所示(圖中橫坐標表示時間,縱坐標表示這段時間累計的流量的總和)。
首先對不同課程所有班級進行分析,如圖4-6,學生學習《計算機組成原理》大部分學生使用手機的時長和流量總和遠高于其他兩門課程,可以發現學生對<計算機組成原理》的興趣不是很大。因此任課老師可適當的改進課堂教學方式,增加學生互動環節,提高課堂趣味性來增加學生的對課堂的粘合度,讓更多的學生參與到課堂中去,提高學生的積極主動性。通過圖6和圖4、5比較可以發現學生聽課認真程度遠高于其他兩門課程,可以發現手機使用情況兩極分化比較嚴重, 《程序語言與設計》是一門邏輯性比較強的課程,有些學生沒有能夠掌握好正確學習這門課的方法,開始選擇放棄。因此任課的老師可以適當的去關注這學生,給與學生一些幫助。圖5反映的是《計算機網絡原理》的上課時學生的狀態, 《計算機網絡原理》是偏向理論比較抽象的課程,因此任課老師在講課時可以適當增加學生討論互動環節,讓學生更好地融入課堂。
接著運用DBSCAN聚類算法對同一門課程不同的班級的上課狀態進行分析。以《計算機網絡原理》課程為例,為客觀公正根據實際上課的考勤情況去除缺課人的數據,四個班的《計算機網絡原理>為同一個任課老師時學生上網流量情況統計如圖7-10所示。
圖7-10可以發現軟件4班的學習氛圍最好,而軟件1班的學習狀態不是特別好,大部分人的上課對課堂的粘合度比較低,整體班級的學習氛圍以及學習方法需要進行適當的調整。教師及輔導員在生活和課堂中多花精力來進行引導管理,讓學生及時發現自身的問題所在并及時解決。圖8、10的結果相對比較接近,可以發現這兩個班級的學習氛圍相對比較穩定少部分的學習態度有問題,需要積極進行引導。
3 結論
通過采集的校園無線網行為數據,將DBSCAN聚類算法應用在學生行為分析中,以計算機學院軟件專業學生為例,挖掘分析了學生課堂上手機上網流量情況,評估分析學生對課程的興趣度,從而對學生管理提出相應的教學管理對策,該方法可為高效解決類似問題提供一種新的解決問題的辦法,從而輔助高校
參考文獻
[1]王法玉,閏小芹,王勁松,大數據時代下的教育管理信息化建設實踐與探索[J].中國教育信息化,2016.
[2]王法玉,姜妍,基于自組織神經網絡和模糊聚類的校園無線網戶學習興趣度行為分析[J/OL].計算機應用研究,2018,35 (01).
[3]姜永超,基于數據挖掘的學生選課及學習行為分析算法研究[J].現代電子技術,2016, 39 (13):145-148.
[4]安計勇,韓海英,侯效禮.一種改進的DBSCAN聚類算法[J].微電子學與計算機,2015,7 (07).
[5] Eerman J,Mahanti A,Arlitt M.Internettraffic identification using machinelearning [C]. Global TelecommunicationsConference, GLOBECOM, SanFrancisco, 2006: 1-6.
[6]楊憶,李建國,葛方振,基于Scikit-Learn的垃圾短信過濾方法實證研究[J].淮北師范大學學報(自然科學版), 2016, 37 (04): 39-41.