吳肖肖
摘 要:本文主要基于關(guān)聯(lián)規(guī)則的性質(zhì)屬性,選用Apriori算法,針對教師教學(xué)評估進(jìn)行分析,挖掘教師的職稱、學(xué)歷與評估結(jié)果之間的關(guān)聯(lián)性,然后以此挖掘出隱含規(guī)律和潛在價值。
關(guān)鍵詞:數(shù)據(jù)挖掘 關(guān)聯(lián)規(guī)則 Apriori算法 教師教學(xué)評估
關(guān)聯(lián)規(guī)則實際上是基于頻繁模式的挖掘,其中比較經(jīng)典的一個案例就是有關(guān)啤酒和尿不濕的關(guān)聯(lián)性分析。
“啤酒”和“尿布”兩個看上去沒有聯(lián)系的商品擺放在一起銷售、并獲得很好的收益,這種現(xiàn)象就是商品之間的關(guān)聯(lián)性分析。那么推及高校的教學(xué)管理,這種關(guān)聯(lián)的發(fā)現(xiàn)同樣也起到四兩撥千斤的作用,特別是針對于教師教學(xué)評估的關(guān)聯(lián)性分析,挖掘出隱含規(guī)律和潛在價值,為提高教師教學(xué)水平提供參考建議。
因此,本文通過針對教師教學(xué)評估分析來挖掘教師職稱、學(xué)歷與評估結(jié)果之間的關(guān)聯(lián)性,找出學(xué)生更喜歡哪類教師,是學(xué)歷高的還是職稱高的。
一、數(shù)據(jù)采集
數(shù)據(jù)采集就是根據(jù)用戶的需要,從原始數(shù)據(jù)里面抽取相應(yīng)的數(shù)據(jù)建立數(shù)據(jù)挖掘庫,作為挖掘任務(wù)的操作對象。本案例的數(shù)據(jù)采集對象是2015-2016第一學(xué)期的教師評價表作為原始數(shù)據(jù)。所以選取了全校現(xiàn)任專兼職教師84名,107門課程,145條記錄的教師評價表。通過學(xué)校的吉利教育中心信息化平臺,進(jìn)入評教模塊,導(dǎo)出教師信息表和學(xué)生評教表2個Excel文件。
二、數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理主要是針對原始數(shù)據(jù)中存在的噪聲、重復(fù)等記錄以及復(fù)雜的結(jié)構(gòu)等情況來進(jìn)行噪聲消除、重復(fù)刪除、類型轉(zhuǎn)換等初步的整理,主要包括數(shù)據(jù)集成、數(shù)據(jù)清洗、數(shù)據(jù)選擇三個方面。
數(shù)據(jù)集成:本案例的教師信息表和學(xué)生評教表是分別導(dǎo)出,因為要用到教師的職稱、課程評分、學(xué)歷等字段,所以需要將兩個表合并到一起。
數(shù)據(jù)清洗:通過排序的方式,將本案例的原始數(shù)據(jù)中不完整的教師信息剔除。
數(shù)據(jù)選擇:因為是針對學(xué)歷、職稱和課程評分等信息挖掘,其他字段沒有意義,所以將教教師信息表中的性別、部門、出生年月等字段以及學(xué)生評教表的部門等字段刪除。
三、數(shù)據(jù)轉(zhuǎn)換
數(shù)據(jù)變換主要包括數(shù)據(jù)維數(shù)的降低,離散型與連續(xù)型數(shù)據(jù)之間的轉(zhuǎn)換,以及將數(shù)據(jù)進(jìn)行分類分組來尋找數(shù)據(jù)特征等。本案例的教師課程評分是連續(xù)型的數(shù)據(jù),而Apriori算法只支持離散型數(shù)據(jù),所以需要將連續(xù)型數(shù)據(jù)轉(zhuǎn)換成離散型數(shù)據(jù)。本例采取的辦法是分為四檔,大于等于90分的為“優(yōu)秀”;大于等于85分的為“良好”;大于等于80分的為“中等”;小于80分的為“一般”。以平均分為界,高于平均分的成績標(biāo)記為1;低于平均分的成績記為0。
四、數(shù)據(jù)挖掘
確定算法是整個數(shù)據(jù)挖掘中最重要、最核心的一個步驟,其工作是根據(jù)挖掘任務(wù)尋找合適的算法,然后尋找合適的模式,最后給出這些模式合適的表示方式。本案例在SPSS Clementine工具里選用Apriori算法來建立模型。首先根據(jù)挖掘任務(wù)設(shè)計挖掘模型,簡稱“流1”。在“流1”中,首先,選取“教師評分匯總-轉(zhuǎn)換后”Excel表作為源文件節(jié)點;其次,選取“類型”為中間節(jié)點,以便與數(shù)據(jù)庫與模型之間建立連接;再次,選取“Apriori”算法為模型,與“類型”建立連接,其中由于用到了3個屬性,所以命名為“職稱&課程評分&學(xué)歷字段”,另外,選取“網(wǎng)絡(luò)”為模型,與“類型”建立連接,也命名為“職稱&課程評分&學(xué)歷字段”;最后選取“執(zhí)行”分別得到“Apriori”算法模型和“網(wǎng)絡(luò)”圖形,通過模型評估與圖形表示來進(jìn)行結(jié)果分析。
五、模型評估與圖形表示
1.模型評估
根據(jù)程序,點擊“執(zhí)行”選項,在右上方“模型”界面中生成挖掘結(jié)果“職稱&課程評分&學(xué)歷字段”,將其拖入“流1”界面,點擊“類型”圖標(biāo),右擊選取“連接”出現(xiàn)連接箭頭圖標(biāo),然后點擊“職稱&課程評分&學(xué)歷字段”Apriori圖標(biāo),使得“類型”和“職稱&課程評分&學(xué)歷字段”建立連接。點擊“職稱&課程評分&學(xué)歷字段”Apriori圖標(biāo),得出挖掘結(jié)果一。
2.圖形表示
單擊“執(zhí)行”按鈕,生成挖掘結(jié)果二。
六、結(jié)果分析
1.由挖掘結(jié)果一可知
(1)課程評分優(yōu)秀的教師,職稱是講師,學(xué)歷是本科。
(2)課程評分優(yōu)秀的教師,職稱是教授,學(xué)歷是本科。
(3)課程評分優(yōu)秀的教師,學(xué)歷是碩士。
(4)課程評分優(yōu)秀的教師,學(xué)歷是本科。
(5)課程評分優(yōu)秀的教師,職稱是講師。
(6)課程評分優(yōu)秀的教師,職稱是講師。
(7)課程評分優(yōu)秀的教師,職稱是教授。
(8)課程評分優(yōu)秀的教師,職稱是講師,學(xué)歷是碩士。
(9)課程評分優(yōu)秀的教師,職稱是副教授。
(10)課程評分良好的教師,職稱是助教,學(xué)歷是本科。
另外,對于中等、一般等課程評分情況的挖掘結(jié)果沒有很好的展現(xiàn),說明有些統(tǒng)計結(jié)果還是存在不小的誤差,可能的原因,比如有的學(xué)生打分不夠認(rèn)真仔細(xì)。
2.由挖掘結(jié)果二可知
相互之間關(guān)聯(lián)越緊密,頻次越高,線條也就越粗,歸納起來有以下三個:
(1)講師、本科和優(yōu)秀
(2)講師、碩士和優(yōu)秀
(3)教授、本科和優(yōu)秀
這個結(jié)果與前面規(guī)則生成的結(jié)論是完全相符的。
3.誤差分析
(1)原始數(shù)據(jù)不夠大。由于本案例只是針對2015-2016第一學(xué)期的教師評價數(shù)據(jù)挖掘,共涉及到84名教師,107門課程,145條記錄,規(guī)模不是很大。
(2)資料更新不及時。有些教師的資料不是最新的,比如職稱、學(xué)歷的變動還沒有及時更新,造成了挖掘結(jié)果的偏差。
(3)人為操作的失誤。由于對數(shù)據(jù)挖掘的理解不夠深入,在對原始數(shù)據(jù)的采集、預(yù)處理及轉(zhuǎn)換環(huán)節(jié)中容易產(chǎn)生誤差。
七、結(jié)論
1.從前項來看,職稱以講師為主,教授為輔;學(xué)歷以本科為主,碩士為輔。這個師資結(jié)構(gòu)說明浙江汽車職業(yè)技術(shù)學(xué)院的骨干教師是以本科起點的講師為主,本科起點的教授和碩士起點的講師為輔。
2.從后項來看,評分結(jié)果以優(yōu)秀居多,這個評價結(jié)果說明整體的教學(xué)效果還是可圈可點的。也從側(cè)面說明,不一定就是職稱高、學(xué)識深、教齡長的教師受歡迎,相比之下,年輕肯干接地氣的青年教師,更具活力,更受學(xué)生歡迎。從職稱是講師,學(xué)歷是本科或碩士來看,這個群體教師的特點主要一是年齡相近,縮短了和學(xué)生之間的差距和代溝,溝通方面沒有障礙;二是有些教師雖然職稱還不夠,但是在崗位上已經(jīng)工作多年,積累了很多教學(xué)經(jīng)驗,工作能力比較強(qiáng)。
本章基于關(guān)聯(lián)規(guī)則的性質(zhì)屬性,選用Apriori算法,針對教師教學(xué)評估進(jìn)行分析,挖掘教師的職稱、學(xué)歷與評估結(jié)果之間的關(guān)聯(lián)性。通過針對教師教學(xué)評估分析來挖掘教師學(xué)歷、職稱和評價結(jié)果之間的關(guān)聯(lián)性,找出深受學(xué)生歡迎的教師有哪些共同特點。