李超鋒++胡鵬



摘 要:利用Apriori算法對1355個課堂的學生評教結(jié)果進行了關(guān)聯(lián)規(guī)則挖掘。挖掘結(jié)果表明學生對具有碩士學位職稱為正高級年齡超過46歲的教師的教學效果評價較差,對具有副高級職稱年齡在35歲及以下的教師的教學效果評價較好。本文據(jù)此提出了相應的教學建議。
關(guān)鍵詞:學生評教;教師特征;關(guān)聯(lián)規(guī)則
0 引言
隨著我國高校信息化水平的不斷提高,幾乎所有高校的教務管理或教學質(zhì)量監(jiān)控部門都引入學生評教系統(tǒng)并開展了學生評教工作,積累了大量的學生評教數(shù)據(jù)。一些高校的教學管理人員已經(jīng)意識到了學生評教數(shù)據(jù)中蘊含著對提高教學質(zhì)量有用的潛在信息和知識,并逐步著手開展了對學生評教數(shù)據(jù)的分析與挖掘。其中,將數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘技術(shù)應用到學生評教數(shù)據(jù)以發(fā)現(xiàn)教師背景特征與學生評教得分之間的內(nèi)在聯(lián)系是一個研究熱點。如周秀梅、李高菊等通過關(guān)聯(lián)分析發(fā)現(xiàn)教師的職稱和年齡會影響教學效果,教師的學歷和性別對評教結(jié)果的綜合分數(shù)無顯著影響[1-2]。張美華等通過對300份數(shù)據(jù)進行關(guān)聯(lián)挖掘發(fā)現(xiàn)30-40歲之間具有中級職稱的教師容易被學生接受,學生對初級職稱教師反映問題較多[3]。楊鈞的關(guān)聯(lián)規(guī)則挖掘結(jié)果表明,專業(yè)技術(shù)職務為正教授的教師平均得分最高,副教授和講師平均得分相差不多[4]。張硯雪利用分層次法關(guān)聯(lián)挖掘?qū)處煖y評系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)進行分析發(fā)現(xiàn),具有副高職稱的教師,學生評價分數(shù)很高,助教職稱的教師則沒有得到學生的認可[5]。
然而,通過對大量的文獻分析發(fā)現(xiàn),目前研究人員在使用關(guān)聯(lián)規(guī)則挖掘?qū)W生評教數(shù)據(jù)時基本上只考慮了規(guī)則的有效性,對規(guī)則實用性的關(guān)注不夠。另外,所使用的數(shù)據(jù)來自于部分學院甚至個別專業(yè)的少量數(shù)據(jù),數(shù)據(jù)的代表性和證明力略顯單薄。本文利用Apriori算法對某部屬高校學生評教的真實數(shù)據(jù)進行挖掘,找出高校教師自身特征與學生評教結(jié)果之間的關(guān)聯(lián)規(guī)則,以期為培養(yǎng)高素質(zhì)的高校教師隊伍進而提升高校教學質(zhì)量提供實證研究依據(jù)。
1 數(shù)據(jù)來源及預處理
本研究所需要的數(shù)據(jù)包括學生評教數(shù)據(jù)和教師自身特征基礎數(shù)據(jù)。學生評教數(shù)據(jù)來自于某部屬高校2014-2015學年度第2學期學生評教數(shù)據(jù)庫中的原始數(shù)據(jù),教師自身特征數(shù)據(jù)來自于該校人事管理系統(tǒng)的基礎數(shù)據(jù)庫。
學生評教數(shù)據(jù)在使用之前進行了數(shù)據(jù)篩選、課堂評教平均得分計算和離散化、缺失值和異常值去除等預處理,共得到1399個課堂評教數(shù)據(jù)。其中缺失值是由于部分學生未對所修課程所有評分指標進行評分造成的。異常值包括因?qū)W生惡意差評[6]導致總分少于40分的學生數(shù)據(jù)記錄和評教人數(shù)少于10人的課堂記錄。評教得分離散處理時將全校所有課堂按最終平均得分排名,前三分之一為優(yōu)等級,中間三分之一為中等級,后三分之一為差等級。
教師自身特征數(shù)據(jù)經(jīng)過數(shù)據(jù)篩選、專業(yè)技術(shù)職務名稱統(tǒng)一和年齡離散化等處理,共得到1490位教師數(shù)據(jù)。其中原始數(shù)據(jù)中的教授和正高級統(tǒng)一為正高級職稱,副教授和其他副高級統(tǒng)一為副高級職稱,講師和其它中級統(tǒng)一為中級職稱,助教和其它初級統(tǒng)一為初級職稱。年齡的離散化處理將年齡為36歲以下的教師歸為青年教師,36-46歲之間為中年教師,46歲以為老年教師。
最后,將學生評教數(shù)據(jù)和教師自身特征基礎數(shù)據(jù)按教師工號連接合并。因部分外聘教師信息登記不全,連接后的數(shù)據(jù)中有44個課堂的教師基本信息存在缺失值,去除后剩余1355條記錄為本研究最終使用數(shù)據(jù),結(jié)構(gòu)如表1所示。
2 研究方法及工具
關(guān)聯(lián)規(guī)則挖掘用于發(fā)現(xiàn)數(shù)據(jù)項之間的密切程度或關(guān)系,對于給定的項和事務集,通過對事務集的分析,挖掘出項集中項之間的相關(guān)性。挖掘出的結(jié)果通常以規(guī)則的形式描述,稱為關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的一般表示形式為X→Y。其中X稱為規(guī)則的前(左)項,可以是一個項或項集。Y稱為規(guī)則的后(右)項,一般為一個項,表示某種結(jié)論或事實。
一般情況下,可以從數(shù)據(jù)中找到很多關(guān)聯(lián)規(guī)則,但并不是所有的關(guān)聯(lián)規(guī)則都有效且實用。必須采用一定的測度指標篩選出有效且實用的關(guān)聯(lián)規(guī)則,這些規(guī)則稱為強關(guān)聯(lián)規(guī)則。強關(guān)聯(lián)規(guī)則常用的測度指標包括支持度(support)、可信度(confidence)和提升度(lift)。
支持度用于測度關(guān)聯(lián)規(guī)則應用的普適性,其值為前項與后項同時出現(xiàn)的概率,數(shù)學公式如式(1)所示,式中|T|表示事務總數(shù)。
可信度用于測度關(guān)聯(lián)規(guī)則的準確性,其值為包含前項的事務中同時也包含后項的概率,反映出前項出現(xiàn)的條件下后項出現(xiàn)的可能性,數(shù)學公式如式(2)所示,式中|T(X)|表示包含項X的事務數(shù),|T(X∩Y)|表示同時包含項X和項Y的事務數(shù)。置信度高說明前項出現(xiàn)時后項出現(xiàn)的可能性高。
置信度和支持度用于測度規(guī)則的有效性,即那些具有較高置信度和較高支持度的規(guī)則才被認為是有效的規(guī)則。實際挖掘過程中,通常需要根據(jù)實際情況指定最小支持度和最小可信度。
有效的關(guān)聯(lián)規(guī)則并不一定實用。因為這些規(guī)則可能揭示的僅僅是一種隨機關(guān)聯(lián)關(guān)系,也可能揭示的是反向關(guān)聯(lián)關(guān)系[7]。因此,在進行關(guān)聯(lián)規(guī)則挖掘時不僅要考慮規(guī)則的有效性還要考慮規(guī)則的實用性。
提升度用于測度規(guī)則的實用性,其值為規(guī)則置信度與后項支持度之比,數(shù)學公式如式(3)所示。
提升度反映了規(guī)則前項的出現(xiàn)對規(guī)則后項出現(xiàn)的影響程度。有實用價值的規(guī)則是那些提升度大于1的規(guī)則,因為只有提升度大于1才能說明前項的出現(xiàn)對后項的出現(xiàn)有促進作用。
本研究利用關(guān)聯(lián)規(guī)則挖掘的思想挖掘?qū)W生評教平均得分等級與教師自身特征之間的強關(guān)聯(lián)規(guī)則,其前項為教師自身特征即性別、職稱、年齡和最高學位中一項或多項的組合,后項為平均得分等級。研究過程利用R語言中的相關(guān)函數(shù)實現(xiàn)。
3 挖掘過程及結(jié)果分析
采用R語言軟件,利用關(guān)聯(lián)規(guī)則挖掘技術(shù)中的Apriori挖掘算法,對預處理之后的數(shù)據(jù)進行挖掘。首先在R語言GUI窗口中安裝和加載Apriori函數(shù)包arules,通過read.table函數(shù)將預處理后的數(shù)據(jù)讀入到數(shù)據(jù)框Data中并轉(zhuǎn)換為Transaction類的實例格式,調(diào)用apriori函數(shù)進行關(guān)聯(lián)規(guī)則挖掘,最后去除冗余規(guī)則后利用inspect函數(shù)查看挖掘結(jié)果。用R語言實現(xiàn)過程如下:
install.packages("arules")#安裝相關(guān)包
library("arules")#加載相關(guān)包
Data<-read.table(file="data.txt",header=TRUE) #讀取預處理后數(shù)據(jù)
Trans<-as(Data,"transactions") #轉(zhuǎn)換為稀疏矩陣式,即Transaction類的實例
Rules <- apriori(Trans,parameter=list(support=0.01,confidence=0.5,minlen=2),
appearance=list(rhs=c("平均得分=差","平均得分=優(yōu)","平均得分=中"),
default="lhs"))
SuperSetF<-is.subset(Rules,Rules) #冗余規(guī)則
inspect(Rules[-which(colSums(SuperSetF)>1)]) #查看去除冗余規(guī)則后結(jié)果
挖掘過程中最小支持度取1%,最小置信度取50%,最終結(jié)果中只選擇后項為平均得分等級的規(guī)則,結(jié)果如表2所示。
表2中3條規(guī)則的提升度均大于1,說明3條規(guī)則均具有實用性。第一條規(guī)則表明學生對具有碩士學位年齡在46歲以上正高級教師的評教結(jié)果并不理想。這一方面說明學生在評價教師授課質(zhì)量時并未受教師職稱的影響,另一方面也反映了當前高校教學中的一種現(xiàn)象,即具有正高級職稱的教師由于兼職或只重視科研而并未將主要精力投入到教學中去。第2和第3條規(guī)則表明年齡在35歲及以下具有副高級職稱的青年教師深受學生青睞。通過與部分學生座談發(fā)現(xiàn)主要有以下幾個原因:一是這些教師年齡與學生接近,思維方式相差不大,易于被學生接受;二是這些教師基本上都是剛剛博士畢業(yè)不久,對本專業(yè)的知識掌握程度既有廣度又有深度,而且與現(xiàn)實比較貼近,容易引起學生共鳴;三是這些教師信息化教育水平較高,上課過程中善于利用多種教學手段,能夠較好地吸引學生的注意力;四是這些教師經(jīng)過幾年的實際教學經(jīng)歷具備了一定的教學經(jīng)驗。
4 結(jié)論及建議
本研究共得到兩個主要的研究發(fā)現(xiàn):第一,具有碩士學位職稱為正高級年齡超過46歲的教師的學生評教結(jié)果較差。第二,具有副高級職稱年齡在35歲及以下的教師的學生評教結(jié)果最好。
基于本研究的發(fā)現(xiàn),我們提出了如下的教學建議。
(1)高校在強調(diào)讓具有正高級職稱的教師必須為本科生上課的同時,還應當通過思想教育和制度設計讓這些教師真正愿意投入精力為本科生上好課。
(2)教師教學發(fā)展研究中心應有針對性地多開展教師教學培訓與交流,對教學效果差的教師深入剖析原因,加強教育與培訓,對教學效果好的教學方式和手段大力推廣。
(3)組織人事部門應鼓勵教師攻讀博士學位或進修,進一步提高教師的業(yè)務水平。
總之,希望通過本文的研究結(jié)果一方面可以為我國高校建立科學的人事管理和決策制度提供依據(jù),指導學校有針對性地加強對教師的教育、培養(yǎng)和培訓。另一方面可以幫助高校教師審視自己的教學過程,調(diào)動教師的教學積極性,提高教師對教學工作的重視程度和教學有效性。
基金項目:本文系湖北省教學研究項目“基于數(shù)據(jù)挖掘技術(shù)的高校教學質(zhì)量評價研究”(項目編號:2014191)研究成果之一。
參考文獻
[1] 周秀梅,翁家銘,李石君.完全加權(quán)正負關(guān)聯(lián)規(guī)則算法及其在評教數(shù)據(jù)中的應用[J].內(nèi)蒙古師范大學
學報(自然科學漢文版), 2016,45(2):242-248.
[2] 李高菊.數(shù)據(jù)挖掘在職業(yè)院校“學評教”體系中的應用[J].河北軟件職業(yè)技術(shù)學院,2016,18(3):47-50.
[3] 張美華,歐云. 關(guān)聯(lián)規(guī)則在高校評教系統(tǒng)中的應用[J].電腦知識與技術(shù),2016,12(1):31-34
[4] 楊鈞,馬鐵明,吳磊,張穎.關(guān)聯(lián)規(guī)則在中醫(yī)院校學生評教系統(tǒng)中應用[J].遼寧中醫(yī)藥大學學報, 2016,18(11):
222-224.
[5] 張硯雪.應用關(guān)聯(lián)規(guī)則算法對高校教師測評數(shù)據(jù)進行分析]J].科技創(chuàng)新導報,2016(1):105,106,108.
[6] 陳磊,倪天倪.學生評教差評教師的有效性研究[J].高教探索,2012(1):84-90.
[7] 薛薇.基于R的統(tǒng)計分析與數(shù)據(jù)挖掘[M].北京:中國人民大學出版社,2015:323.