摘 要:通過依靠學生綜合數據庫并合理使用高校教務管理信息系統,以數據挖掘的含義、原理等方面為基礎,通過分析現在管理系統的弊端,設計基于數據挖掘的高校學生學習成績預警系統,來對成績有問題的學生發出預警通知,使教務管理系統得到改善,從而很好的提高學生學習成績。
關鍵詞:關聯規則 數據挖掘 學生成績 預警系統
中圖分類號:G64 文獻標識碼:A 文章編號:1672-3791(2013)02(c)-0023-01
高校教學管理的重心在于不斷提高高校教學水平,關鍵在于加強學生成績的管理。目前,通過數據挖掘技術對教學數據庫的不斷分析研究,其在教育方面的研究成果越來越突出。如果設計一套高校學生成績預警系統,參考高校教務信息系統數據庫,并使用數據挖掘技術對高校學生成績數據庫進行分析,系統通過挖掘各學生每一課程的成績數據,計算出不同成績水平的產生概率,通過原有的成績數據推測今后的成績趨勢,進而找到與本課程相對應的關聯規則作為預警因素,建立起預警系統,這樣就能夠及時評估學生的學習成績,督促學生改進學習方法,以提高其成績水平。
1 數據挖掘含義及基本原理
數據挖掘(Data Mining,DM)通俗地說就是從數據中挖掘信息。由于人類的認識水平有限,很多模糊的、隨機的、不完全的、有噪聲的數據中隱藏的信息就不容易被發現,但是通過對一系列有關數據的分析和挖掘,就會使大量重要的潛在知識浮現出來。數據挖掘將數據庫、數據網絡、統計數學等技術結合起來,從而進行預測、分類、估計、復雜數據類型挖掘、相關性分組或關聯規則等處理。在高校教務管理工作中,高校學生成績與成績的各影響因素之間潛藏著很大的聯系,而數據挖掘技術可以對此進行全面地分析。所以,各個從事此項研究的人員開始設計并逐漸將數據挖掘技術與高校教學管理系統結合起來,擴展數據挖掘技術應用的新領域,并多方面、多角度的定性分析學生成績情況。
數據挖掘主要是通過關聯規則數據挖掘算法進行:根據所需挖掘出的相符合關聯規則,設定最低可靠度和最小支持度兩個閾值,即用來表示所需的關聯規則一定要符合的最小可信任程度和所需的關聯規則一定要符合一組數據量在統計意義上能達到最低要求。
2 現在狀況下對學生成績的管理
一般情況下,教務系統的管理人員雖然能夠在數量較大的數據庫中作普通的查詢,或對一定數量學生的成績進行簡單統計處理或數學排序,但是如果想進行進一步的研究,那么這種傳統下管理數據庫的方法就只能望而卻步了。另外,在高校逐漸擴大招生人數的情況下,成績管理系統也需要處理越來越多的數據,解決更加繁瑣的問題。因而,在這種數據處理壓力較大狀況下,就要求更加強大的數據處理系統來進行工作。如果僅僅將計算機作為存儲工具而存放大數量形式不一的數據,而不去挖掘在其中隱含的具有重要價值的信息,那么數據中潛在的關聯和規則也就不會被找出或利用,同時也就不能夠對數據產生規律加以把握,在教學工作中造成一定損失。如果能夠對這些存在的弊端加以解決,那么不僅能夠使現代教學管理提高到新的層面,而且可以幫助教師有效評估學生學習成績狀況,以提高學生的學習成績。所以說盡早建立完善的數據挖掘管理信息系統很有必要。
3 高校學生成績預警系統設計
我國的高校成績預警設計在當前水平上,只能對學生成績數據進行簡單的統計分析。為了滿足需要,以便于更好的管理學生學習,針對學習成績的三個基本狀態:成績相對落后、成績趨于滑落和成績潛藏問題,依此能夠及時分析學生成績水平,督促學生改進方法,提高學生成績。
現在就以成績潛藏問題來對系統的基本使用原理進行分析,并設計出相應的基本模型。成績預警系統通過挖掘學生以往成績關聯規則,確定成績的關聯規則范圍,再根據目前成績水平在此范圍進行搜索,推算學生今后的學習中隱藏問題。
(1)對成績數據進行預處理,首先將學生所處學期、學期所有課程進行編號,因為四個學年有八個學期,各學期課程應該都在10科以內,故一般情況下以兩位數表示,即“學期+課程”,這樣就有利于后續的排序。然后把歷史數據庫內數據的格式“學號+姓名+不合格課程”中的“不合格課程”依次編上號碼,如不合格課程1,不合格學課程2,…。再將成績不合格的記錄從需要處理的所有成績記錄中一一篩選出來。
(2)挖掘出概率較高的數據,設置適當的支持度,以便于找出的關聯規則不具特殊性。為了能確保能夠準確成功預警,需要排除無關規則,同時也要避免有管關預警規則被棄用,所以在進行合適的置信度定位時,既不能過于狹隘,也不能范圍太廣,在保證準確率的同時不斷提高預警水平。預警規則包括前件和后件,前件和后件分別表示前后學期的課程,每個學科作為一個項,將前件各項和后件的各項之間排好順序,后件始終排在前件之后。規則的前件和后件不可以用來表示同一學期的課程成績,相同學期課程之間的成績不能夠相互預測,只能在前件產生之后對后件即下一學期成績進行預測,隨著歷史學期成績的期數增加,預測的準確率越高。
(3)按照首步的方法預處理本學期的學生成績,在預警規則庫中進行搜索,輸出匹配項進行分析。
4 結語
隨著我國各高校實行信息化步伐的加快,高校教育中的工作效率不斷提升,管理大量數據信息的系統也就充分發揮了作用。數據挖掘的方式能將很多有用的數據在繁瑣、量大的數據庫中提取出來,作為評估教學水平和學生學習的依據,合理指導高校的管理、教學工作。成績預警系統的目的就是能夠對出現學習問題的學生及時發出預警信息,使學生在大學的學業成功完成。同時,在信息技術不斷發展今天,不斷對成績預警系統進行改進,以使其能更好的為教育事業服務。
參考文獻
[1] 李昊,周振華.基于數據挖掘的高校學生成績預警系統[J].大慶石油學院學報,2011,4(35):91-95.
[2] 董軍凱.數據挖掘技術在成績分析中的應用[J].科技資訊,2009(22):72-74.
[3] 張皓.數據挖掘技術在構建學生成績預警系統的應用[J].電腦知識與技術, 2011,19(7):4529-4530.