劉靜
(南京航空航天大學 國際教育學院,江蘇 南京 210016)
隨著信息時代的快速發展,大量的數據被人類搜集和存儲,通過數據庫我們可以方便的存儲這些海量數據,但是由于之前的數據庫功能缺乏,無數據分析和研究功能,數據并不能得到有效利用。而數據挖掘技術則可以方便有效的對復雜的數據進行分析和處理,在商業、金融等領域已得到了廣泛使用。數據挖掘技術在許多行業已經有了比較成熟的技術和相應的挖掘工具軟件[1-3]。
目前,許多高等院校都開放了各自的教務管理系統,也初步具備了日常管理功能,具有一定的信息處理分析功能[4-6]。但國內的教務管理系統,仍停留在日常事務處理的操作層面上,僅僅是從手工管理過渡到計算機上而已,沒有涉及到面向主題和歷史數據的分析決策層面上,也缺乏成熟的分析系統。總體上來說,教務管理的信息化仍處于初級階段,離真正的信息化和決策化水平尚有較大的差距。因此,借助于數據挖掘技術對成績進行分析、并找出隱藏在課程和成績之間的關系規律,找出不同院系不同專業學生的就業率,使得決策者準確把握專業動向,合理進行決策安排,具有顯著的現實意義。
一般意義上的數據挖掘是一個進行探究海量數據的分析過程,該過程以大規模的數據為研究對象。通過數據分析找出數據之間的某種聯系,并將這些規律應用到新的數據庫中。而數據分析的主要目的是進行預測,預測也是數據挖掘技術最主要的應用之一。
數據挖掘(Data mining),它是數據庫知識發現中的一個步驟。數據挖掘一般是指從大量的數據中通過算法搜索隱藏于其中信息的過程。數據挖掘通常與計算機科學有關,并通過統計、在線分析處理、情報檢索、機器學習、專家系統(依靠過去的經驗法則)和模式識別等諸多方法來實現上述目標。
數據挖掘可以分為3個步驟:即數據準備、規律查找和規律展示。數據準備指的是從已有的數據源中選取有用的數據并將歸類為數據挖掘的數據集;規律查找是采用特定的數學方法將數據集所包含的內在規律找出來;規律展示是指采用比較易于理解的模式(如可視化)將已經找出的規律表示出來。典型的數據挖掘結構如圖1所示。

圖1 典型數據挖掘系統結構圖Fig.1 Typical data mining system structure
聚類分析指將物理或抽象對象的集合分組成為由類似的對象組成的多個類的分析過程。該技術來源于生物學、統計學和機器學習等。因此在目前的聚類分析中,往往由聚類產生組,組集合為簇,不同簇的之間的對象和對象相互具有很高的相異性。聚類分析具有不同方法:如基于密度的分析方法、層次的分析方法、劃分的分析方法、基于模型的分析方法、基于網格的分析方法等。
數據挖掘方法中另外一個主要方面是分類和預測。分類和預測方法是指在給定條件下能夠得到哪些值,其中決策樹是數據挖掘中的一個重要方法。決策樹可以分為分類樹決策和回歸樹決策。數據庫中離散的變量采用分類樹模型,其中的連續型變量采用回歸樹模型。決策樹分析的基礎是需要知道不同狀況下的事件的發生概率,故決策樹模型是一種基于數據的預測模型,它表示的是不同對象屬性和其對象值之間的一種映射關系。
數據挖掘另外一個重要的分析方法是人工神經網絡。人工神經網絡是一種應用類似于大腦神經突觸聯接的結構進行信息處理的數學模型。在工程與學術界也常直接簡稱為神經網絡或類神經網絡。神經網絡是一種運算模型,由大量的節點(或稱神經元)之間相互聯接構成。人工神經網絡能夠實現大規模的并行計算,它能夠利用海量的計算單元形成的特定網絡,該模型可以分為自組織網絡、前饋式網絡和反饋式網絡等。
從設計思路上來看,教務管理系統作為一個典型信息管理綜合系統,涉及到的信息有很多,主要有學生、教職工、成績、課程等。這些數據處理表示方法如下。
入學時,管理人員以班級為單位將學生的學籍信息錄入學校教務管理系統,與此同時,將各自教學計劃錄入系統。每次考試結束后,由工作人員將學生考試成績錄入。當學生需要調換專業等操作時,則可由學校專門教師進行修改。在教師評價中,將學生及各部門對教師評價所打分數錄入管理系統中,為將來數據挖掘做充分準備。該系統由兩部分組成:即日常教務管理系統、以及數據挖掘子分析系統。
從功能上來看,本次設計的教務管理系統可以包括以下幾個子模塊:成績管理子模塊、學生管理子模塊、課程管理子模塊、教師管理子模塊、系統設置子模塊、數據挖掘分析子模塊等。
教務管理信息系統主要工作之一為數據庫的設計,對于該類系統來講,合適的數據庫是數據倉庫數據的重要來源。因此,設計數據庫時,需要進行合理的數據搜集,使之不容易出現冗余,從而能夠加快訪問速度和效率。
本次設計中,系統的主要對象為學生、教師、課程和成績。不同的對象對應不同的屬性,如學生的屬性有學號、姓名、性別、籍貫、民族、聯系方式以及班級等。教師的屬性主要有工號、教師姓名、性別、學歷、專業、取得學位、職稱、聯系方式等。應該根據實體關系所確定的模型,通過合理設計數據庫表,將所涉及到的屬性信息輸入進去。
數據倉庫的設計不同于數據庫,數據庫主要目的是存儲數據,而建立數據倉庫是為了滿足復雜的數據統計分析需要。教務管理系統中的數據通過處理,轉移到數據倉庫中,從而可以讓管理者通過數據倉庫進行數據挖掘,最終實現對學生學習培養、教師素質提高提供決策支持。本次設計的數據倉庫包括幾個部分:1)數據源;2)數據提取;3)數據預處理;4)數據集市;5)分析工具。
由于本文研究的主要對象是教務管理系統,因此重點關注內容應該是學生和教師的信息。這就需要在模型設計時,要研究學生數據模型以及教師數據模型。
1)學生數據模型
學生數據中主要考慮學生的基本信息,如性別、學分、成績、籍貫、班級等。針對不同學生,建立學生數據模型:
①根據性別建立數據模型;②根據性別建立數據模型;③根據民族建立數據模型;④根據成績建立數據模型;⑤根據學分建立數據模型。
2)教師數據模型
①根據性別建立數據模型;②根據學歷建立數據模型;③根據年齡建立數據模型;④根據職稱建立數據模型;⑤根據教師評價建立數據模型。
數據挖掘模型建立以后,必須通過編程語言和其他一些工具進行數據挖掘。本系統在設計功能上,實現了教務管理系統的許多基本功能,比如學生管理、成績管理、教師管理等。
日常事務管理主要分為系統登陸模塊和學生管理模塊兩類。系統登陸模塊主要功能是用戶啟動系統,出現登錄界面,選擇身份。如圖2所示。

圖2 系統登陸模塊Fig.2 Login module
學生管理模塊的功能主要實現學生信息的獨自錄入、修改、刪除等功能。
可以使用聚類分析法對任課教師評價數據進行合理的數據挖掘。教師評價指標主要有:教學內容、教學方式、教學態度和知識能力。在進行教學評價時,往往以班級為單位,組織學生自己,運用教務管理系統為教師打分。
之后就可以使用數據挖掘模塊對打分結果進行聚類分析,那么從聚類分析結果來看,結合實際評分的結果,通過人工分析得出,聚類分析更能正確的進行教學評價分析。
以副教授為例,其所占全部教師比例為5%,若評價均值為80。因該類教師年齡較大,且主要經歷在科學研究方面,平時授課時間相對較少,且每次講課方式和方法比較固定,導致上課時和學生溝通較少。故該類教師的教學評價較低。
以上對于聚類分析結果進行了分析,得出學歷較高職稱較高的教師得到的評價較高,這是由于這類教師經驗豐富、知識面廣。學院管理者可以通過聚類分析的結果對每類教師進行相應的培養,以便可以提高教師的教學水平。
由于課程之間的相互影響是客觀存在的,在實際應用過程中,通過對學生考試成績進行充分的數據挖掘和分析研究,從而找出安排課程合理規律,為學院制定人才培養計劃,安排教學內容提供合理的參考。我們可以使用教務管理系統設計的課程關聯性使用分析功能模塊,實現對數據倉庫中有用的相關數據進行關聯情況規則分析,比如使用Aprior算法,可以產生數據挖掘結果。
通過分析可以看出,不同課程之間不是雜亂無章的,而是內在存有很強的聯系,這往往在考試成績差與平時成績好的學生能夠明顯的體現出來,因此在制定相關的人才培養計劃時,必須考慮到課程之間的相關性,并考慮到課程的開設順序,影響學生學習效果的方面,實踐中不能將課程提前開設或者向后開設、同時開設。本次研究的成果,所得到的數據挖掘結果應用,可以作為管理者參考的依據,同時也可以成為學生選課的依據。
本次研究,設計了一個基于數據挖掘的高校教務管理系統,從功能上來看,對數據倉庫和數據表進行詳細的設計,實現了教務管理系統中往往難以實現的功能,給出了重要模塊的實現過程。模型將聚類分析方法應用到教師和學生評價中,并且將關聯分析植入到學生成績評定中,最后 對系統進行了功能和性能方面的測試,從而驗證了系統運行的正確性。
由于作者能力有限,本次設計的系統中挖掘的內容相對單一和數量較少,除了文中所涉及的挖掘內容外,尚有諸多內容,仍待繼續改進。
在教務管理過程中,往往涉及到大量的數據,采用傳統的方法無法適應日益增長的數據規模需要,因此隨著社會進步及計算機和網絡技術的應用,數據挖掘技術為我們提供了合適的工具,本文基于此,研究分析了數據挖掘技術在高校教務管理系統的應用和實現。論證了數據挖掘的概念、分析方法,提出了教務管理系統的數據挖掘模型,分別對學生模塊和教師模塊應建立的模型進行了分析,通過實例分析可知,本系統模型能夠極大提高管理者的效率,本研究為類似項目研究提供了一個借鑒。
[1]姚志鴻.數據挖掘技術在教學管理中的應用與實現 [J].電子測試,2014(6):108-109.YAO Zhi-hong.The realization and application of data mining technology in teaching management[J].Electronic Test,2014(6):108-109.
[2]吳天真,李文靜.數據挖掘技術在高校教務管理中的應用綜述[J].科協論壇,2013(7):75-76.WU Tian-zhen,LI Wen-jing.Overview of application of data mining technology in the colleges and universities teaching management[J].Science and Technology Association Forum,2013(7):75-76.
[3]李素朵.數據挖掘技術在高職院校教務管理系統中的應用研究[D].石家莊:河北科技大學,2013.
[4]林麗.數據挖掘技術在高校教務管理系統中的應用[J].輕工科技,2012(4):89-90.LIN Li.Application of data mining technology in the university educational administration management system[J].Light Industrial Science and Technology,2012(4):89-90.
[5]魏韞怡.數據挖掘技術在電大教務管理中的應用[J].科技視界,2012,8(22):98-100.WEI Yun-yi.Application of data mining technology in the teaching management in TV University[J].Science and Technology View,2012,8(22):98-100.
[6]歐振用.數據挖掘技術在教務管理系統中應用研究[D].北京:北方工業大學,2011.