劉占波 閆實 王曉麗



摘? 要: 隨著科學技術的快速發展以及數據挖掘技術的不斷改進,各個學校的教學管理系統中都已存儲了大量的數據信息,本文主要對目前教師在教學評價中的現狀進行了研究,并以教學評價的體系為數據挖掘的基礎平臺,利用數據挖掘技術對教師教學相關的數據進行挖掘和分析。重點對數據挖掘技術在教師教學評價中的應用進行研究,從而可促進學校教學的質量,對教師教學評價有重大的意義。
關鍵詞: 教師;教學評價;數據挖掘
【Abstract】: With rapid development of science and technology, continuous improvement of data mining technology, teaching management system of each college has stored a large amount of data information. The article mainly researches current situation of teaching evaluation of teachers, mines and analyzes teaching data of teachers with data mining technology based on data mining basic platform of teaching evaluation system,mainly researches? application of data mining technology in teaching evaluation of teachers, to promote teaching quality of colleges, which is of great significance to teaching evaluation of teachers.
【Key words】: Teacher; Teaching evaluation; Data mining
0? 引言
隨著新一代社交網絡、數字城市等大規?;ヂ摼W應用的迅猛發展。大數據的特點為:(1)彈性服務。(2)按需服務。(3)資源池化。(4)服務可計費。(5)泛在接入。大數據主要就是云架構計算技術,并且云架構計算是分布式計算、互聯網技術以及大規模資源管理等技術的發展與融合,其應用和研究涉及資源虛擬化、信息安全、海量數據處理等亟待處理的重要問題。隨著科學技術的快速發展以及數據挖掘技術的不斷改進,各個學校的教學管理系統中都已存儲了大量的數據信息,對存儲的大量的數據信息都是進行簡單的數字處理,不能對這些數據進行更深入的研究和分析[1]。
本文主要對目前教師在教學評價中的現狀進行了研究,并以教學評價的體系為數據挖掘的基礎平臺,利用數據挖掘技術對教師教學相關的數據進行挖掘和分析,對教師教學評價有重大的意義。
1? 數據挖掘技術
數據挖掘主要就是云架構計算技術,并且云架構計算是分布式計算、互聯網技術以及大規模資源管理等技術的發展與融合,其應用和研究涉及資源虛擬化、信息安全、海量數據處理等亟待處理的重要問題。數據挖掘系統的結構如圖1所示:
數據挖掘其可用于發現的模式類型主要有以下6種:
(1)挖掘中的頻繁項集的關聯以及相關模式。
(2)概念和類相關的描述,主要包含特征化和區分兩個方面。
(3)通過聚類對已有的數據進行類標記和分析。
(4)對數據進行聚類和預測,通過對比分析建立一個概念模型。
(5)對建立的模型進行演變分析,模擬數據的演變過程。
(6)對數據中的表現異類的數據進行深入的分析,即對離群點進行分析。
2? 利用數據挖掘技術進行教師教學評價研究的流程
Romero等研究學者認為在教師教學評價中數據挖掘技術的應用會是一個十分重要的循環迭代,通過數據挖掘技術將得到的教師教學評價相關的知識進入評價系統的循環中,并且通過改進學習系統、支持決策以及改善學習者的學習等過程,而不是簡單的將數據轉換為教師簡單的評價過程[2-4]。
各個學校的教學管理系統中都已存儲了大量的數據信息,對存儲的大量的數據信息都是進行簡單的數字處理,通過對這些數據進行更深入的研究和分析,主要對目前教師在教學評價中的現狀進行了研究,并以教學評價的體系為數據挖掘的基礎平臺,采用數據挖掘技術對教師教學評價的研究過程中主要的流程包括數據收集、確定數據挖掘目的、數據的挖掘以及模式評估與知識表示等四個部分。數據挖掘的過程主要包括以下幾個方面:
(1)根據已知的條件,確定數據挖掘目的。
(2)需要挖掘數據的準備,即對數據的清洗、數據的篩選等步驟。
(3)根據選定的算法對已有的數據進行挖掘。
(4)依據上述挖掘的結果,對數據挖掘的模式評估與知識進行表示。
大數據與實際生產應用緊密結合,并且其研究領域廣泛。通過對已有大數據體系結構以及關鍵技術的研究,對大數據還可以從以下兩個方面進行深入的研究:一方面,通過拓展大數據的外沿,比如將大數據與移動互聯網領域以及科學計算相結合,來拓展新的大數據應用模式;另一方面,通過討論大數據模型的缺陷來挖掘大數據的內涵,比如以大規模程序調試診斷以及端到云的海量數據傳輸為例來分析云架構技術面臨的挑戰。
移動互聯網的飛速發展極大的豐富了大數據的外部應用,使得大數據和移動互聯網的聯系十分密切。由于移動設備在接入方式上和硬件配置上的特殊性,使得對于大數據和移動互聯網的關系研究十分重要。下面對移動互聯網中移動設備的資源以及網絡接入問題進行更為深入的探討[5-6]。
2.1? 有限的移動設備資源
往往需要在瀏覽器端解釋的如JavaScript、Ajax等執行腳本程序才能訪問基于Web門戶的大數據服務,這樣會消耗較多的移動設備的計算能源與資源,并且移動設備運行平臺具有更新速度快以及種類繁多等特點,從而為移動設備定制客戶端成為不可能的事件。因此,為大數據平臺設計相對應的訪問接口非常迫切。
2.2? 網絡接入問題
應用需求動態的調整系統規模,使得系統的運行成本降低,對于大數據的分布式應用,開發者需要考慮資源回收以及動態分配的問題,但這個過程很容易發生死鎖、資源泄露等問題。同時上述大規模各領域的應用對于大數據平臺的搭建帶來了難題,因為其使得大數據平臺的搭建過程更為繁瑣和復雜。因此,需要不斷開發新的應用模型以及適合大數據的實用工具來解決這些問題顯得更為迫切。
3? 支持向量機SVM算法在教師教學評價中的應用
3.1? 支持向量機SVM算法
3.2? 支持向量機SVM算法在教師教學評價中的應用
在應用數據挖掘技術進行教師教學評價研究的過程中,本文在實驗過程中使用Weka中的J48聚類器進行教師測評結果信息表的挖掘,詳細過程為:
(1)啟動軟件進入Explorer界面,打開己經進行預處理(離散化)后的數據表格,選擇preprocess選項卡,觀察數據表中數據情況,其中包含625條數據信息,4個屬性,具體如圖2所示。
在結果窗口中單擊右鍵,可以看到支持向量機SVM算法在教師教學評價中的應用的圖像,能夠對聚類結果一目了然,本文方法對目前教師在教學評價中的現狀進行了研究,并以教學評價的體系為數據挖掘的基礎平臺,利用數據挖掘技術對教師教學相關的數據進行挖掘和分析具有很好的效果[7-9]。
4? 總結
科學技術的快速發展以及數據挖掘技術的不斷改進,各個學校的教學管理系統中都已存儲了大量的數據信息,對存儲的大量的數據信息都是進行簡單的數字處理[10-13],通過對這些數據進行更深入的研究和分析,主要對目前教師在教學評價中的現狀進行了研究,并以教學評價的體系為數據挖掘的基礎平臺,利用數據挖掘技術對教師教學相關的數據進行挖掘和分析,對教師教學評價有重大的意義。
參考文獻
毛伊敏, 彭喆, 陳志剛, 等. 基于不確定決策樹聚類算法在滑坡危險性預測的應用[J]. 計算機應用研究, 2014, 31(12): 3646-3650.
彭喆. 基于不確定的數據挖掘聚類算法在滑坡災害預測的應用[D]. 江西理工大學, 2015.
Han J, Kamber M. 數據挖掘概念與技術[M]. 范明, 孟小峰, 譯. 北京: 機械工業出版社, 2001.
劉述昌, 張忠林. 基于中心向量的多級聚類KNN算法研究[J]. 計算機工程與科學, 2017, 39(9): 1758-1764.
Fabrizio S. Machine learning in automated text categori zation[J]. ACM Computing Surveys, 2002, 34(1): 1-47.
Romdhani S, Torr P, Scholkopf B, et al. Efficient face detection by a cascaded support-vector machine expansion[J]. Pattern Recognition, 2004, 3175: 62-70.
Chen Guang-xi, Xu Jian, Cheng Yan. Cluster method of support vector machine to solve large-scale data set classi fication[J]. Computer Science, 2009, 36(3): 184-188. (in Chinese).
García V, Alejo R, Sánchez J S, et al. Combined effects of class imbalance and class overlap on instance-based classifi cation[A] // Intelligent Data Engineering and Auto mated Learning–IDEAL 2006[M]. Berlin, Heidelberg: Springer, 2006: 371-378.
Xia Zhan-guo, Xia Shi-xiong, Cai Shi-yu, et al. Semi-Supervised gaussian process classification algorithm addressing the class imbalance [J]. Journal on Communi cations, 2013, 34(5): 42-51.
Cao Yong. Research of chinese web text classification[D]. Xiamen: Xiamen University, 2007. (in Chinese).
GILLEN A, BROUSSARD F W, PERRY R, et al. Optimizing infra- structure: the relationship between it labor costs and best practices for managing the windows desktop[EB/OL]. http: //download. microsoft. com/ download/a/4/4/a4474b0c- 57d8-41a2-afe6-32037fa93ea6/IDC_windesktop_IO_whitepaper. pdf 2007.
MELL P, GRANCE T. The NIST Definition of Cloud Computing[R]. National Institute of Standards and Tech nology, 2011.
卓廣平. 高效數據挖掘算法在大規模數據集中的應用研究[J]. 軟件, 2014, 35(08): 72-74.