摘要:該文討論了如何將數據挖掘技術與教務管理相結合,從教務管理數據倉庫中挖掘出隱藏在海量數據中的有用信息。從而為教學部門提供決策支持信息,促使更好的開展教學工作,提高教學質量,為教學質量評估提供幫助。
關鍵詞:數據挖掘;關聯規則;教務管理
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2009)33-9452-02
隨著信息技術、計算機技術和數據庫技術的飛速發展以及高等教育的大眾化,很多高等院校的教學和管理工作中都產生和積累了大量的數據。但是由于缺乏信息意識和技術,對于數據的處理還只是簡單的備份、查詢與統計,并沒有對于大量的數據進行深入的分析,加以捕捉有利于教學工作的信息,從而導致隱藏在這些數據中的信息未能得到有效的利用。因此如何快速而準確地從浩瀚的數據倉庫中提取出所需要的信息,就需要一種新的數據分析技術加以處理,而數據挖掘技術正是解決這個問題的可行而有效的方法。利用數據挖掘技術,針對已有的海量的教務信息進行有效的知識發現,是提高學校競爭力,幫助管理者進行決策的一種有效的方法。
1 數據挖掘技術概述
1.1 數據挖掘的概念
數據挖掘(Data Mining,簡稱DM)就是從大量的、不完全的、有噪聲的、模糊的、隨即的數據中,提取隱含在其中的、人們事先不知道的、但又有潛在的有用信息和知識的過程,是數據庫中知識發現(Knowledge Discovery in Databases,簡稱KDD)的核心。數據挖掘是一個基于多學科的交叉研究領域,它融合了數據庫技術、人工智能、機器學習、統計學、知識工程、面向對象方法等最新技術的研究成果。通過該技術,使信息系統的功能得到了最大程度的利用。
1.2 數據挖掘的對象
根據信息存儲格式,數據挖掘的對象有關系數據庫、面向對象數據庫、數據倉庫、文本數據源、多媒體數據庫、空間數據庫、時態數據庫、異質數據庫以及Internet等。
1.3 數據挖掘的常用方法
數據挖掘常用方法主要包括關聯分析、分類、預測、時序模式和偏差分析等
1) 關聯分析:關聯規則挖掘是由Rakesh Apwal等人首先提出的。兩個或兩個以上變量的取值之間存在某種規律性,就稱為關聯。數據關聯是數據庫中一類重要的、可被發現的知識。關聯分為簡單關聯、時序關聯和因果關聯。
2) 聚類分析: 聚類是把數據按照相似性歸納成若干類別,同一類中的數據彼此相似,不同類中的數據相異。
3) 分類:分類就是找出一個類別的概念描述,它代表了這類數據的整體信息,即該類的內涵描述,并用這種描述來構造模型,一般用規則或決策樹模式表示。
4) 預測:預測是利用歷史數據找出變化規律,建立模型,并由此模型對未來數據的種類及特征進行預測。
5) 時序模式:時序模式是指通過時間序列搜索出重復發生概率較高的模式。它是用己知的數據預測未來的值,但這些數據的區別是變量所處時間的不同。
6) 偏差分析:在偏差中包括很多有用的知識,偏差分析的基本方法就是尋找觀察結果與參照之間的差別,從而得到數據庫中數據存在的異常情況。
2.4 數據挖掘的過程
1) 確定挖掘對象:定義出問題,確定數據挖掘的目的。2) 數據準備:①選擇數據:在大型數據庫和數據倉庫中提取數據挖掘的目標數據集;②數據預處理:進行數據再加工,包括檢查數據的完整性及數據的一致性、去噪聲,填補丟失的域,刪除無效數據等。3) 數據挖掘:根據數據功能的類型和數據的特點選擇相應的算法,在預處理過的數據集上進行數據挖掘。4) 結果分析:對數據挖掘的結果進行解釋和評價,轉換成為能夠最終被用戶理解的知識。5) 知識的運用:將分析所得到的知識應用于業務信息系統的組織結構中去。
3 數據挖掘在高校教務管理中的應用
3.1 課堂教學評價
評價教師的教學質量,往往會從多方面的因素考慮,其中最主要的是從學生的角度出發對教師的課堂教學質量給予評價。課堂教學評價是學校教學管理重要的組成部分,是評價教學工作成績的主要手段。對教學起著激勵、改進、鑒定和研究作用。課堂教學的主要要素是教師、學生和教學信息,教師和學生通過教學信息發生相互作用。現在絕大部分學校每學期都要搞課堂教學評價調查,積累了大量的教學信息數據。而目前對教學的評價主要基于數值計算,將學生的評價簡單的歸納總結后,將結果通報給任課教師,并不做深入的思考。利用數據挖掘技術,從教學評價數據中進行數據挖掘,將關聯規則應用與課堂教學評價系統中,探討教學效果的好壞與教師的教齡、職稱、學歷、教學對象、教師整體素質以及教學方法之間的聯系。合理配備每個班級的上課教師,使學生能夠較好的保持良好的學習態度,從而為教學部門提供了決策支持信息,促使更好地開展教學工作,提高教學質量。
3.2 合理選課
為適應社會發展我國高校的教育體制都進行了改革,高校教育體制的改革使學分制在各高校相繼出現,在學分制下學生不僅可以自主制定自己的學習計劃,還可以根據自己的實際情況隨時來調整學習計劃,同時還可以通過選課來完善自己的知識。因此選課便成為高校運行體制的核心之一。選課對于高年級的學生來說可能具有一定的針對性,但對于低年級的學生來說他們剛剛跨入大學的校門,對于一些專業不是很了解,如果在剛開始就讓他們制定自己的學習計劃,并選擇適合自己的專業課程,勢必會造成一定的盲目性,因此教務部門應該在選課之前制定出有效的指導學生選課的方針對學生進行選課指導,使學生選課的盲目性降到最低限度,而數據挖掘中的關聯規則就是尋找指導方針的有效方法。通過使用數據挖掘技術從學年制教學體制下積累的大量數據中發現潛在的知識與規律,可以有效的指導學生選課減少學生在選課中的盲目性。
3.3 課程設置
課程設置,通常是指各年級各類學校或其他機構關于課程安排的方案,包括要開設那些課程,在哪一學期可設以及開設相關課程的先后次序等。在學校學生課程安排是循序漸進的,而且課程之間有一定的關聯與前后順序關系,在學習某一門課程之前必須先修一些課程作為它的基礎,如果先開設的課程沒有學好,勢必會影響后續課程的學習。隨著教學規模的不斷擴大,教務管理人員及任課教師很難再像以前那樣直接根據學生的成績數據分布找出諸如前期課程與后繼課程的關系,并據此進行教學進程的決策。在這種情況下,我們利用數據挖掘技術,挖掘教務管理系統中積累的有用信息,可以使學校的相關院系調節相關課程的設置,調整熱門課程和冷門課程的人數,通過選課率及相關信息鼓勵和引導學生選擇互補的課程,這樣可以提高學生的整體素質,也有利于教學資源的合理分配,為決策提供必要和準確的理論支持。
3.4 教師教學方法評價
在教學過程中,教師可以采用多種方法來完成自己的教學任務,例如講授法、討論法、計算機輔助教學法、參觀法、調查法、實習法等。在通常的情況下,一般可以采用一種或幾種方法進行。因此可以用數據挖掘的方法來挖掘數據庫中的數據,判定下一步應采用什么樣的教學方法,以滿足教學的需要,更有利于學生對知識的吸收。從每個學生對教學方法的評價以及不同的教學方法得出的教學成績來進行分析,運用回歸線性分析、關聯規則的方法判定此種教學方法適合哪一類學生或哪幾門課程,使得分層次教學能夠得到更進一步的實施。
3.5 試卷分析評價
考試是檢驗教與學效果的一種手段,而學生成績的高低與許多因素有關,其中試卷質量與學生成績有著最為密切的關系。例如試卷的難易度﹑知識覆蓋面﹑試卷考查形式的合理分配等。將關聯規則應用于試卷分析數據庫中,根據得分情況分析出每道題的難易度﹑區分度﹑相關度等指標,教師根據所得的幾種指標就能夠對試卷的質量做出比較準確的評價,進而可以用來檢查自己的教學情況及學生的掌握情況為今后的教學提供指導。
4 結束語
數據挖掘是深層次的數據信息分析,可以幫助決策者尋找規律,發現被忽略的要素,預測趨勢,進行決策。數據挖掘技術被廣泛的應用于市場營銷、醫藥業、電信業、金融業、互聯網等方面。將數據挖掘技術引入到教育領域中,挖掘出高校教務管理系統海量數據中潛在的信息可以提高教育管理的科學性,同時增強了教育數字化建設的實效性。
參考文獻:
[1] 劉曉霞.數據挖掘技術在高校教學中的應用[J].現代計算機,2008(6):115-116.
[2] 賈璐潔,張靖.數據挖掘技術在高校教務管理中的應用[J].中國科技信息,2007(12):225-226.
[3] 孟躍紅.數據倉庫技術在高校教育管理中的應用[J].徐州師范大學學報,2003(6):78-80.
[4] 姜永亮,符傳誼.數據挖掘技術在選課系統中應用[J].微型電腦應用,2009(8):61-64.
[5] 范明,孟小峰.數據挖掘概念技術[M].北京:機械工業出版社,2000:185-216.