于鵬飛
[摘要]教育信息化是高等院校教育發展的主要趨勢,也是提升高校教學質量的重要途徑和渠道。本文以促進高等院校教學發展為目標,將數據挖掘技術和SQL Server數據庫引入教學質量評價中去,利用數據挖掘系統支持高等院校教學質量管理工作。首先,本文介紹了SQL Server數據庫及其特點,以及數據挖掘技術和常用的幾種數據挖掘算法,提出利用決策樹方法進行教學質量數據挖掘,并對這一方法的實現進行了簡要分析,僅供參考借鑒。
[關鍵詞]數據挖掘;教學質量;SQL Server數據庫;實現過程
[中圖分類號]G640
[文獻標識碼]A
[文章編號]1671-5918 (2018)02-0026-02
近年來,隨著高等教育改革工作的逐步展開和教學手段的不斷拓展,高等教育管理的現代化、信息化水平有了顯著提升,很好地滿足了現階段高等教育管理工作需求。特別是等信息系統的應用,為高校教學管理日常工作帶來了極大便利,不僅積累了大量教學相關數據,也降低了工作強度。如何更好地應用這些數據,充分發揮其在教學質量管理中的積極作用,是擺在廣大教育工作者面前的一個重要課題。基于此,就于基于SQL Server數據庫的高校教學質量數據挖掘進行了分析,以期全面推動教育管理信息化,提升高校教育工作水平。
一、SQL Server數據庫及特點
SQL Server數據庫是近年新提出的一種關系型數據庫管理系統,具有高性能、可擴展性、分布式等特點。從整體上看,本數據庫的優勢體現在以下幾個方面:第一,高性能性,能夠充分利用WindowsNT優勢;第二,采用先進的管理方法,支持本地、遠程系統配置和管理,也支持計算機圖形化管理;第三,有強大的事務處理能力,可通過各種方法保護數據的完整性;第四,支持多種結構的處理器,擁有自主的SQL語言。
二、數據挖掘技術
數據挖掘是上世紀末發展起來的一種交叉性學科,可從大型數據庫中提取出有價值的信息。這些有價值的信息都是潛在的、隱含的,事先不被人所知。提出后的有價值信息可用概念、規則、規律、模式等形式表現。準確的來講,數據挖掘是決策支持的過程,可作出歸納性推理,輔助決策者作出科學合理的決策。
(一)數據挖掘過程
通常情況下,數據挖掘主要包括數據準備、挖掘操作、結果表達和解釋等環節。各環節相互聯系,構成了一個反復不斷的數據挖掘過程。如,挖掘者在數據挖掘過程中如果發現選用的數據不能滿足要求,或挖掘結果達不到要求,可以重復先前的挖掘過程,重頭進行數據挖掘。
(二)數據挖掘算法
在數據挖掘工作中,除了選定數據挖掘過程模型外,選擇數據挖掘算法是最重要的一項工作。目前,常用的幾種數據挖掘算法有決策樹、聚類、統計等,這些方法在數據挖掘中有廣泛應用。
(三)SQL Server中的數據挖掘
數據挖掘本身是一種決策支持工具,興起于上世紀90年代,而最新發展起來的SQL Server數據庫也具備數據挖掘功能。SQLServer中的數據挖掘存儲采用特殊結構,要想瀏覽它必須使用微軟軟件,只有這樣才能進行數據模型創建、復制、刪除、修改等工作。
三、高校教學質量數據挖掘采用決策樹算法的必要性
(一)目前高校教學質量管理現狀
教學質量管理水平是衡量高校辦學能力的重要指標之一,提升教學質量管理水平是高校教育管理的核心工作。顯而易見,教學質量管理工作對高校而言十分重要。就當前來看,高校教育工作中基本使用了網上評教、學生成績查詢等信息工具,輔助高校日常教育及其管理工作。信息工具使用過程中產生了大量的數據信息,這些信息中隱藏很多有價值的信息,可用于教學質量管理。然而實際工作中并未完全做到這一點,這些數據被人的主觀忽略,未對這些教學數據進行充分挖掘,一定程度上降低了教學數據利用價值,不利于提升教學質量管理水平。基于此,需要通過一種科學、有效的方法進行教學數據挖掘,從中挖掘出有價值的信息,作為教學質量管理工作的決策支持依據。綜合考慮多種數據挖掘算法后,決策樹算法成為最佳選擇之一。
(二)決策樹算法
決策樹是一種與流程圖非常相似的樹狀圖,每一個節點表示在一個屬性上的測試。其中,分枝表示測試輸出,枝葉節點表示類或類分布。建立決策樹的主要目的是建立目標類變量關于各輸入變量的分類預測模型,以便實現對新數據對象的分類和預測,為教學質量數據分類與有用信息挖掘提供支持。
四、基于SQL Server數據庫的高校教學質量數據挖掘分析
(一)數據挖掘系統的實現
建立高校教學質量數據數據挖掘系統時,應當充分利用SQLServer數據庫及微軟公司的相關軟件、標準化接口等,可直接利用SQLServer數據庫的數據挖掘功能對高校教學過程中產生的數據進行數據挖掘,為高校教學質量管理提供有價值的信息。數據挖掘系統實現主要包括以下環節:首先,將教學質量評估中的數據引入SQLServer數據庫中,待數據處理后,創建星形結構的數據倉庫,支持數據挖掘模型建立;然后,打開SQLServer數據庫,利用數據庫中的“挖掘模型向導”建構教學質量數據挖掘模型;最后,運用決策樹方法對數據進行挖掘。
利用SQL Server數據庫本身的數據挖掘功能直接對高校教學質量評價數據進行數據挖掘,雖然能夠構建出數據挖掘的基本方案,但是SQL Server數據庫提供的算法有限,不能很好地適應高校教學質量數據挖掘工作要求。介于此,可將數據挖掘模型外掛于SQL Server數據庫進行數據挖掘。這樣一來,數據挖掘算法的選擇有了更多的選擇性和靈活性,不僅可以使用SQLServer數據庫中的DTS等工具進行數據預處理、構建數據倉庫,也可以讓SQL Server數據體庫提供更完整的數據管理服務,利于提升數據挖掘質量和效率,保證數據挖掘結果具有利用價值。
綜合以上分析,基于SQL Server數據庫建立高效教學質量數據挖掘模型時,要將數據挖掘模型外掛于SQL Server數據庫,采用c/s結構系統,通過服務器端數據庫存儲挖掘數據源組織,客戶端應用程度運行數據挖掘模塊。具體過程:第一,對數據源進行抽取、轉換,后存儲到服務器端數據庫,即SQL Server數據庫。其中,數據源包括學生評教、教師反饋等信息數據。當數據源存儲到SQL Server數據庫中后,利用SQL Server數據庫的Drrs工具對數據進行轉換、清理,將不同數據源的數據統一、有序的存儲在數據庫中,為后續的數據挖掘工作做準備;第二,利用高級語言建立數據挖掘算法的實現方法,并編制相應的外掛數據挖掘模塊;第三,將SQL Server數據庫中的數據與服務器中的數據庫進行相應的數據交互。以上三個環節的就是利用外掛模式,基于SQL Server數據庫建立起來的高校教學質量數據挖掘方案,該方案建立簡單、便捷,數據挖掘結果可用、有價值,很好地滿足了教學質量數據挖掘工作要求。
(二)數據挖掘模塊的實現
在該教學質量數據挖掘方案中,數據挖掘模塊主要包括數據預處理和清洗、事務庫生成、頻繁項集生成、關聯規則庫生成等。其中的每一個模塊有著不同的功能,它們相互聯系,建構了一個服務于高校教學質量數據挖掘的模塊整體。數據挖掘模塊的主要功能是:清洗學生評教數據、教師檔案庫數據等,將清洗后數據存儲在數據庫中,從中提取出要挖掘的數據對象并編碼,按照一定關系將其轉換為事務庫。然后,在事務庫基礎上,根據給定的最小支持度生成頻繁項集,根據給定的最小置信度量將頻繁項集轉化生成關聯規則,并顯示出來,為教學質量管理決策提供可靠的支持依據。
五、結論
綜上所述,為了提高高校教育管理工作,基于SQL Server數據庫和數據挖掘技術建立高校教學質量數據挖掘方案,利用先進的技術手段從大量的教學質量評價數據挖掘出有價值的關聯規則,提供給教學質量管理可靠的決策依據,保證教育管理工作成效。
參考文獻:
[1]李志軍.基于SQLServerBI決策樹的學生成績分析[J].電腦編程技巧與維護,2016,32( 15):57 - 58,63.
[2]李吳,周振華.基于數據挖掘的高校學生成績預警系統[J].大慶石油學院學報,2011,35(4):91 -95,2.
[3]馬秀麟,衷克定,劉立超.從大數據挖掘的視角分析學生評教的有效性[J].中國電化教育,2014,14( 10):78 - 84.
[4]董萍.基于數據挖掘的教務管理系統的設計與實現[J].三門峽職業技術學院學報,2015,14(1):135 -139.
[5]任鎖平.基于數據挖掘的高職教學質量監控評價系統設計及應用[J].電子設計工程,2015,23( 16):25 - 27,31.