【摘 要】隨著高等教育的快速發(fā)展,高校的生存競(jìng)爭(zhēng)越來(lái)越激烈。其核心競(jìng)爭(zhēng)力是高校教學(xué)質(zhì)量,優(yōu)質(zhì)的教學(xué)質(zhì)量是高等院校的生命線,是高校進(jìn)行動(dòng)態(tài)管理的首要條件,也是實(shí)現(xiàn)科學(xué)管理的重要保證。在分析教學(xué)評(píng)估現(xiàn)狀基礎(chǔ)上,通過(guò)可視化數(shù)據(jù)挖掘工具Rattle,對(duì)教學(xué)評(píng)價(jià)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換,然后進(jìn)行指標(biāo)相關(guān)分析,和各個(gè)維度對(duì)評(píng)價(jià)的影響分析,從而通過(guò)可視化過(guò)程控制達(dá)到目標(biāo)管理。使教務(wù)管理部門(mén)能夠及時(shí)了解教學(xué)動(dòng)態(tài)和師資情況,為教務(wù)老師提供相關(guān)決策支持,為職稱(chēng)評(píng)聘提供教學(xué)工作質(zhì)量的科學(xué)依據(jù)。
【關(guān)鍵詞】數(shù)據(jù)挖掘 教學(xué)質(zhì)量 Rattle 可視化
【基金項(xiàng)目】國(guó)家社科基金項(xiàng)目“青少年科技創(chuàng)新能力的培養(yǎng)研究”(BCA150050)。
【中圖分類(lèi)號(hào)】G40-057 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2017)07-0079-02
ZHANG Donghui
Computing Center, Beijing Information Science & Technology University, Beijing 100192,China
【Abstract】With the rapid development of higher education, the Universities struggle for the existence has been becoming more and more intense.The core of the competition lies in the quality of the teaching.The high quality of teaching is the lifeline of the universities.It is one of the most important conditions for the dynamic management of the universities.It also guarantees the realization of the scientific management. In this paper, based on analyzing the present situation of teaching evaluation, through the visual data mining tools Rattle to cleaning, conversion of teaching evaluation data, then index correlation analysis, and to evaluate the effect of each dimension analysis, so as to achieve goals through the visualization process control management. This paper enable the administrative department to find out about teaching development and teachers' situation in time, offer relevant decision support to the teachers of educational administration, offer the scientific basis of teaching work quality for the thing that the professional title is commented and engaged .
【Key words】data mining; teaching quality; rattle; visualization
1.教師教學(xué)評(píng)估的現(xiàn)狀
教師教學(xué)活動(dòng)評(píng)價(jià)是一個(gè)復(fù)雜的過(guò)程,僅僅依靠一、兩次的單項(xiàng)評(píng)價(jià), 不可能真實(shí)反映教師教學(xué)的真實(shí)過(guò)程,無(wú)法修正評(píng)價(jià)過(guò)程中的暈輪效應(yīng)、趨同效應(yīng)等引起的各種偏差[1]。所以,對(duì)教師用動(dòng)態(tài)的、發(fā)展的眼光進(jìn)行系統(tǒng)的、全程的、較長(zhǎng)時(shí)間的、循環(huán)往復(fù)的評(píng)價(jià)是未來(lái)的趨勢(shì)。只有這樣, 才能充分挖掘教師的潛能, 發(fā)揮教師的特長(zhǎng),進(jìn)而實(shí)現(xiàn)主動(dòng)創(chuàng)新。
對(duì)眾多教師的多個(gè)環(huán)節(jié)的評(píng)價(jià)進(jìn)行綜合處理,是一項(xiàng)非常復(fù)雜的工作,因此一個(gè)好的教師評(píng)價(jià)系統(tǒng)會(huì)帶來(lái)很大的方便。目前隨著信息技術(shù)的發(fā)展,一些學(xué)者研究出了基于多元線性回歸、偏最小二乘、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等教學(xué)質(zhì)量評(píng)價(jià)方法[2-4],還有學(xué)者提出層次分析法和神經(jīng)網(wǎng)絡(luò)相融合的教學(xué)質(zhì)量評(píng)價(jià)模型[5]。這些教學(xué)評(píng)價(jià)是對(duì)調(diào)查得出的數(shù)據(jù)進(jìn)行量化分析,然后得出結(jié)論,并由此做出判斷,在形式與內(nèi)容上顯得比較單一。而且這樣做并不能發(fā)現(xiàn)數(shù)據(jù)中深層次的內(nèi)容,很難找出有關(guān)教學(xué)質(zhì)量的一些規(guī)律。而數(shù)據(jù)挖掘作為一種深層次的數(shù)據(jù)分析方法和有效地解決這一問(wèn)題的新技術(shù),可以對(duì)教學(xué)的質(zhì)量和水平與各因素之間隱藏的內(nèi)在聯(lián)系進(jìn)行全面透徹的分析[6]。但由于現(xiàn)有數(shù)據(jù)挖掘方法存在操作繁瑣、缺乏個(gè)性化教學(xué)質(zhì)量評(píng)價(jià),導(dǎo)致基于數(shù)據(jù)挖掘的教學(xué)評(píng)價(jià)系統(tǒng)實(shí)際使用率并不高[7]。本文基于可視化數(shù)據(jù)挖掘工具Rattle分析調(diào)查得到的教學(xué)評(píng)價(jià)數(shù)據(jù),并對(duì)評(píng)價(jià)數(shù)據(jù)進(jìn)行合理的處理,從中發(fā)現(xiàn)類(lèi)似“可能對(duì)教師教學(xué)水平產(chǎn)生影響的因素”等問(wèn)題,以及在什么條件下教師的教學(xué)質(zhì)量和水平是“高的”或“不高的”,幫助教師改進(jìn)教學(xué)的方法,進(jìn)而提高教學(xué)的質(zhì)量和水平。
2.可視數(shù)據(jù)挖掘工具rattle的認(rèn)識(shí)
2.1 數(shù)據(jù)挖掘過(guò)程
在大數(shù)據(jù)時(shí)代下,生活的方方面面都脫離不了數(shù)據(jù)挖掘。大數(shù)據(jù)不僅僅是一個(gè)概念、一個(gè)話題,而且正在成為生活中的一部分:用大數(shù)據(jù)預(yù)測(cè)疾病,用大數(shù)據(jù)助力企業(yè)商業(yè)決策,用大數(shù)據(jù)分析客戶(hù)心理。
所謂數(shù)據(jù)挖掘(Data Mining,DM)是指從大量不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、有用的信息和知識(shí)的過(guò)程。其表現(xiàn)形式為概念、規(guī)則、模式等形式。
一個(gè)完整的數(shù)據(jù)挖掘過(guò)程包括以下幾個(gè)步驟[8](圖1):
3.基于Rattle的教學(xué)質(zhì)量評(píng)價(jià)
3.1 數(shù)據(jù)準(zhǔn)備
數(shù)據(jù)挖掘項(xiàng)目第一步就是收集所有必需的數(shù)據(jù)。在大數(shù)據(jù)時(shí)代,不缺乏數(shù)據(jù),但缺乏可轉(zhuǎn)換為信息、知識(shí)、智慧的數(shù)據(jù)。
每學(xué)期結(jié)束,筆者所在學(xué)校都會(huì)對(duì)任課教師的教學(xué)進(jìn)行評(píng)價(jià),本文選用了三年(2013-2015)6個(gè)學(xué)期10位教師的“計(jì)算機(jī)基礎(chǔ)”課程的評(píng)價(jià)數(shù)據(jù)作為挖掘?qū)ο蟆O葘?duì)數(shù)據(jù)進(jìn)行預(yù)處理,刪除異常數(shù)據(jù)后,提取各項(xiàng)評(píng)價(jià)數(shù)據(jù)見(jiàn)表1。
還需要學(xué)院信息表,學(xué)期信息表,課程信息表(略)。
數(shù)據(jù)準(zhǔn)備主要進(jìn)行如下一些工作:
(1)將“職稱(chēng)”屬性進(jìn)行泛化處理,把職稱(chēng)為教授、研究員等正高級(jí)職稱(chēng)的,泛化為正高,把職稱(chēng)為副教授、副研究員、高級(jí)工程師等副高級(jí)職稱(chēng)的,泛化為副高,把職稱(chēng)為講師、實(shí)驗(yàn)師、工程師等中級(jí)職稱(chēng)的,泛化為中級(jí),把職稱(chēng)為助教、助理工程師等初級(jí)職稱(chēng)的,泛化為初級(jí)。
(2)對(duì)“年齡”屬性進(jìn)行離散化處理,轉(zhuǎn)換為年齡段區(qū)間。即將年齡分為:小于30、介于30至40之間、介于40至50之間、介于50至60之間、大于60等5個(gè)年齡段。
(3)對(duì)“分?jǐn)?shù)”屬性進(jìn)行離散化處理,轉(zhuǎn)換為分?jǐn)?shù)區(qū)間等級(jí)。分?jǐn)?shù)屬性離散化結(jié)果如圖3所示。
3.2 各維度因素對(duì)教學(xué)質(zhì)量的影響分析
考慮樣本數(shù)量及其代表性情況,對(duì)教師年齡、職稱(chēng)、學(xué)歷、性別等主要屬性進(jìn)行分析,以期發(fā)現(xiàn)主要屬性與教師評(píng)價(jià)結(jié)果之間的內(nèi)在聯(lián)系。
(1)教師維度與指標(biāo)C1(教書(shū)育人,為人師表)分析(圖4)
從圖4左上角的得分分布和左下角的得分熱力圖情況可以看到,C1得分分布集中在9.3-9.7之間。從圖4右上角可以看到每位教師C1得分分析,有4個(gè)離群值,可以通過(guò)追溯原始數(shù)據(jù),分析這4個(gè)數(shù)據(jù)產(chǎn)生的原因。從每位教師的箱線圖可看出最高分、最低分、平均分、分位數(shù)等信息,平均分最高的是lili老師,Wang-dh對(duì)指標(biāo)C1不穩(wěn)定,比較穩(wěn)定的是lili和zhang-hui。從圖4左下角可以看到C1得分集中的點(diǎn)(顏色越淺得分密度越大)。
同理,基于Rattle可以分析每位教師的其它指標(biāo)(C2,..,C10)情況。
(2)性別維度對(duì)指標(biāo)C2(精神飽滿(mǎn),富有激情)和C3(注重交流,師生互動(dòng))的影響(圖5)
圖5 性別維度對(duì)指標(biāo)C2和C3的影響
圖5的左上角和中間部分顯示的是所有教師的C2指標(biāo)和C3指標(biāo)的得分分布情況,可以看到C2大部分得分分布在8.3~9.8分之間,C3大部分得分分布在7.6~10分之間,結(jié)合圖5右邊的箱線圖,從得分分值的角度分析,看到C2的分?jǐn)?shù)更集中一些,且集中于高分段,說(shuō)明教師們上課時(shí)的精神飽滿(mǎn)狀態(tài)好于師生互動(dòng)的投入。圖5的左下角和中下部分顯示的是男教師和女教師的C2和C3指標(biāo)得分的對(duì)比情況,可以看到無(wú)論C2指標(biāo)還是C3指標(biāo)得分男教師的得分范圍都大于女教師,說(shuō)明男教師的個(gè)體差異大于女教師,在講課時(shí)精神面貌和師生互動(dòng)環(huán)節(jié)有欠缺的男教師比例大于女教師。
同理,基于Rattle可以分析職稱(chēng)維度對(duì)指標(biāo)的影響,學(xué)歷維度對(duì)指標(biāo)的影響,學(xué)院維度對(duì)指標(biāo)的影響,課程維度對(duì)指標(biāo)的影響。
(3)指標(biāo)相關(guān)分析(圖6)
圖6中,藍(lán)色越深(圈越大)表明其正相關(guān)性越強(qiáng),黃色越深(圈越大)負(fù)相關(guān)越強(qiáng),我們?cè)谠O(shè)計(jì)指標(biāo)時(shí),希望指標(biāo)獨(dú)立(負(fù)相關(guān)越大越好)。圖說(shuō)明指標(biāo)C4(方法新穎,深入淺出)和指標(biāo)C5(備課充分,內(nèi)容充實(shí))過(guò)于相關(guān),最好重新設(shè)計(jì)這兩個(gè)指標(biāo)。
(4)教師維度與學(xué)期維度分析(圖7)
圖7顯示了教師2013-2015年的6個(gè)學(xué)期的上課門(mén)數(shù)情況,可以清楚看到wang-dh老師的上課總門(mén)數(shù)最多,hu-xf老師最少。各個(gè)老師各學(xué)期承擔(dān)的教學(xué)任務(wù)各不相同
(5)總的評(píng)價(jià)得分(分?jǐn)?shù))與學(xué)歷維度之間的關(guān)系分析(圖8)
圖8 顯示所有教師的不合格率為18% ,合格率為23%,中等為18%,良好為21%,優(yōu)秀為20%。按教師的學(xué)歷分層為擁有碩士或博士學(xué)歷的教師和擁有博士學(xué)位的教師,前一層次的教師(碩博)中不合格為20% ,合格率為25%,中等為16%,良好為21%,優(yōu)秀為18%,后一層次的教師(博士)中不合格為18% ,合格率為28%,中等為21%,良好為13%,優(yōu)秀為21%。
本文中的合格率和優(yōu)秀率的計(jì)算與傳統(tǒng)方法不同,采用末位警告制,是分層次計(jì)算各個(gè)層次的不合格率和優(yōu)秀率,是局部角度而不是全局角度,這樣的統(tǒng)計(jì)更能準(zhǔn)確評(píng)價(jià)與維度之間的關(guān)系。
4.結(jié)束語(yǔ)
隨著網(wǎng)絡(luò)技術(shù)與數(shù)據(jù)庫(kù)技術(shù)的迅速發(fā)展,人們所積累的數(shù)據(jù)越來(lái)越多,需要挖掘出這些數(shù)據(jù)背后隱藏的許多有用的信息和知識(shí),在教育領(lǐng)域也是一樣。使用傳統(tǒng)的評(píng)價(jià)方法,即不客觀也不高效,已經(jīng)滿(mǎn)足不了現(xiàn)代教學(xué)發(fā)展的需要。人們希望能夠?qū)@些教學(xué)評(píng)價(jià)數(shù)據(jù)進(jìn)行多角度、高層次的分析和處理,希望從中能發(fā)現(xiàn)更多、更有用的知識(shí)和信息,為提高教學(xué)質(zhì)量提供更多的方法和措施。本文利用Rattle分析了教學(xué)質(zhì)量評(píng)價(jià)數(shù)據(jù)。用戶(hù)只需要選擇相關(guān)菜單命令、對(duì)話框或者按鈕就可以實(shí)現(xiàn)對(duì)教師教學(xué)質(zhì)量的可視化評(píng)價(jià)。操作簡(jiǎn)單快捷,結(jié)果顯示形象而直觀。
參考文獻(xiàn):
[1]胡平波.高校教師教學(xué)質(zhì)量評(píng)價(jià)指標(biāo)體系維度結(jié)構(gòu)及測(cè)量[J].江西財(cái)經(jīng)大學(xué)學(xué)報(bào),2010,69(3):111 -118.
[2]劉強(qiáng),戴起勛.高等教育大眾化條件下教學(xué)質(zhì)量評(píng)價(jià)體系研究現(xiàn)狀[J].江蘇大學(xué)學(xué)報(bào),2003,25(2):31-34.
[3]劉偉,孫林.基于支持向量機(jī)的課堂教學(xué)質(zhì)量評(píng)價(jià)[J].合肥工業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2010,33(7):968-971.
[4]孫曉玲,王寧,梁艷.應(yīng)用BP神經(jīng)網(wǎng)絡(luò)的教學(xué)評(píng)價(jià)模型及仿真[J].計(jì)算機(jī)仿真,2010,27(11):314-317.
[5]馮瑩瑩,于干,周紅志.層次分析法和神經(jīng)網(wǎng)絡(luò)相融合的教學(xué)質(zhì)量評(píng)價(jià)[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(17):235-238.
[6]羅美淑,劉世勇,夏春艷.數(shù)據(jù)挖掘技術(shù)在教學(xué)評(píng)價(jià)中的應(yīng)用研究[J].教育探索,2013,2(260):81-83.
[7]陳青山.決策樹(shù)算法在高校教學(xué)質(zhì)量評(píng)價(jià)系統(tǒng)中的應(yīng)用研究[D].成都: 西南交通大學(xué)碩士學(xué)位論文,2010.
[8]Yanchang Zhao(陳建,黃琰 譯).R語(yǔ)言與數(shù)據(jù)挖掘——最佳實(shí)踐和經(jīng)典案例[M].北京:機(jī)械工業(yè)出版社,2015.
[9]Graham Williams.Data Mining with Rattle and R[M]. Springer Science+Business Media,2011.
作者簡(jiǎn)介:
張冬慧(1969-),女,博士, 計(jì)算機(jī)實(shí)驗(yàn)師,研究領(lǐng)域?yàn)橛?jì)算機(jī)教育應(yīng)用。