袁瑞 付浩杰 楊世恩
摘 要 基于成績的專業(yè)教學(xué)質(zhì)量評價模型主要通過分析學(xué)生學(xué)業(yè)成績來評價專業(yè)教學(xué)質(zhì)量水平。以西南地區(qū)某高校計(jì)算機(jī)學(xué)院各專業(yè)學(xué)生成績?yōu)榛A(chǔ),提出課程集群化分析的觀點(diǎn),應(yīng)用事后比較法發(fā)現(xiàn)專業(yè)間的整體差距;采用克倫巴赫α系數(shù)描述課程集群的耦合度,通過刪除項(xiàng)目度量法,定位并刪除成績評價不合理的課程。最后應(yīng)用卓越班的成績數(shù)據(jù)檢驗(yàn)其信效度,結(jié)果符合實(shí)際。該模型有效彌補(bǔ)了傳統(tǒng)學(xué)生評估帶有主觀化的缺陷,對教學(xué)質(zhì)量評價具有重要參考價值。
關(guān)鍵詞 專業(yè)教學(xué)質(zhì)量;成績分析;克倫巴赫α系數(shù);評價模型;卓越班
中圖分類號:G642 文獻(xiàn)標(biāo)識碼:B
文章編號:1671-489X(2018)04-0069-04
Abstract The evaluation model of the professional teaching quality based on performance, which evaluate the professional teaching qua-lity by analyzing studentsscore. Based on the score of the students study in the college of computer science in Southwest China, this article puts forward the concept of curriculum cluster, and finds out the difference between the professional courses and the different courses of the same specialty. The Cronbachs α describes the degree of coupling of the course cluster; by deleting the project metric method, positioning the curriculum with unreasonable performance evaluation. Apply the actual grade data to test its reliability and validity, and the result is consistent with the hypothesis. This model make up the traditional evaluation that ignores the teacher, the model has a certain reference value to evaluate the professional teaching quality.
Key words professional teaching quality; performance analysis; Cronbachs α; evaluation model;excellent class
1 引言
良好的教學(xué)評價工作,可使高校及時發(fā)現(xiàn)教學(xué)中存在的問題并且進(jìn)行適當(dāng)改進(jìn),從而使教學(xué)工作高效有序進(jìn)行,保證學(xué)生培養(yǎng)質(zhì)量。斯克里文和豪斯把教育評價定義為:
“評價是一種對優(yōu)缺和價值的評價,是一種既有描述又有判斷的活動。”[1]這個定義強(qiáng)調(diào)了教育評價的描述和判斷功能的全面性。我國學(xué)者陳玉琨提出:“教育評價是對教育活動滿足社會與個體需要的程度做出判斷的活動,是對教育活動現(xiàn)實(shí)的或潛在的價值做出判斷,以期達(dá)到教育價值增值的過程。”[2]此概念強(qiáng)調(diào)評價內(nèi)容的全面性,認(rèn)為教育評價的著重點(diǎn)應(yīng)該在人才的培養(yǎng)。泰勒模式又稱“行為目標(biāo)模式”[3],將整個評價圍繞教育目標(biāo)展開,具有很強(qiáng)的邏輯性和可操作性;但泰勒模式由于行為目標(biāo)的固化,會導(dǎo)致對于學(xué)生和教師意見的忽視。美國著名教育評價專家斯塔弗畢姆提出的以背景評價、輸入評價、過程評價和成果評價四種評價相結(jié)合的CIPP課程評價模式,在評價過程中關(guān)注到工作的改進(jìn),評價活動的方向性和價值性極具優(yōu)勢,但更多關(guān)注于描述性信息,缺乏價值上的判斷[4];
現(xiàn)有主流評價模式往往只重視第二方(學(xué)生、教學(xué)督導(dǎo)人員等)的評價,忽視了第一方(教師本人)的評價[5]。但教師是教學(xué)過程的直接參與者,其主體評價在綜合評價體系中起到支撐作用,而學(xué)業(yè)成績是教師對學(xué)生評價的直接反映。本文以西南地區(qū)某高校計(jì)算機(jī)學(xué)院學(xué)生歷年的總體成績?yōu)榛A(chǔ),對課程進(jìn)行集群分類,采用最小顯著差數(shù)法對比分析不同專業(yè)之間的差異,用克倫巴赫α系數(shù)(Cron-
bachs α)的一致性檢驗(yàn)進(jìn)行課程集群內(nèi)部的數(shù)據(jù)處理,構(gòu)建基于成績的教學(xué)質(zhì)量評價模型。對三個不同專業(yè)共五個班的成績數(shù)據(jù)進(jìn)行實(shí)證分析,通過相同專業(yè)的普通班和卓越班對比,驗(yàn)證該模型的可靠性,結(jié)果符合實(shí)驗(yàn)假設(shè)。該模型的設(shè)計(jì)旨在關(guān)注教師評價,完善傳統(tǒng)的專業(yè)教學(xué)質(zhì)量評價模型,彌補(bǔ)教學(xué)評價方法不夠多樣的現(xiàn)狀[6]。
2 評價模型的構(gòu)建
課程集群化處理 不同專業(yè)的課程開設(shè)不同,即使同一個專業(yè)的不同年級,都存在課程變化和教學(xué)方案改變等情況,使用課程成績直接比較不具備普適性和魯棒性。為此,本文提出課程集群化處理的觀念:課程集群是將教學(xué)計(jì)劃中內(nèi)容聯(lián)系緊密、內(nèi)在邏輯性強(qiáng)、屬于統(tǒng)一培養(yǎng)范疇的相關(guān)課程,進(jìn)行重新規(guī)劃、設(shè)計(jì)、構(gòu)建的具有連貫性、遞進(jìn)的課程集群[7]。本文依據(jù)西南地區(qū)某高校計(jì)算機(jī)學(xué)院的課程數(shù)據(jù),通過教師訪談和參考專業(yè)培養(yǎng)方案,將專業(yè)課程分為公共課、學(xué)科基礎(chǔ)和專業(yè)課三個課程集群。通過課程集群之間的比較,可以解決不同專業(yè)的課程不一致和課程數(shù)量不同而無法計(jì)算的問題。模型的進(jìn)一步計(jì)算將以課程集群為單位進(jìn)行,對集群間比較和集群內(nèi)部進(jìn)行分析。
比較各專業(yè)成績差異 本文在多個專業(yè)之間比較采用顯著性檢驗(yàn)法[8],判斷專業(yè)和集群之間的差異性。采用方差分析的多重比較檢驗(yàn),明確不同專業(yè)間的成績差異程度,有無達(dá)到顯著性標(biāo)準(zhǔn)。
研究中采用多重比較中的最小顯著差數(shù)法(LSD法)。基本做法是:在F檢驗(yàn)顯著的前提下,求出該專業(yè)成績差異顯著水平為α?xí)r的最小顯著差數(shù),然后將任意兩個課程成績平均數(shù)的差數(shù)的絕對值與其比較。
利用LSD法進(jìn)行多重比較時,可按如下步驟進(jìn)行:
1)列出所有課程成績平均數(shù)的多重比較表,比較表中各課程成績按其平均數(shù),從大到小自上而下排列;
2)計(jì)算課程達(dá)到顯著差異時的最小顯著差數(shù)LSD0.05和LSD0.01;
3)將課程平均數(shù)多重比較表中課程成績平均數(shù)差數(shù)的絕對值與LSD0.05、LSD0.01比較,做出統(tǒng)計(jì)推斷。
計(jì)算集群耦合度及刪除無效課程 克倫巴赫α系數(shù)作為一種衡量心理或教育測驗(yàn)可靠性的方法,可用于處理課程集群內(nèi)部數(shù)據(jù)一致性檢驗(yàn)。在課程成績分析中,依據(jù)公式估量課程集群的內(nèi)部一致性,以此作為信度指標(biāo),可克服部分折半法的缺點(diǎn)[9],測量一組同義或平行測驗(yàn)“總和”的信度。
研究中將每一科考試科目當(dāng)作測驗(yàn)中的一個題目來驗(yàn)證,分析每個課程組之間的一致性,α系數(shù)在0~1之間:如果α系數(shù)小于0.6,一般認(rèn)為內(nèi)部一致信度不足;達(dá)到0.7~0.8時,表示內(nèi)部一致性具有相當(dāng)?shù)男哦龋贿_(dá)到0.8~0.9時,說明結(jié)果信度非常好。
如果該課程集群的克倫巴赫α系數(shù)小于0.6,應(yīng)當(dāng)進(jìn)行下一步的分析,篩選出對一致性影響較大的課程。需要采用“對項(xiàng)目刪除進(jìn)行度量”的方式進(jìn)行。比較移除該課程后,其余課程的一致性系數(shù)的變化,并判斷該課程的打分情況。
3 試驗(yàn)及討論
基于成績的教學(xué)質(zhì)量評價模型是利用學(xué)生在校期間的全部課程成績進(jìn)行分析。在本研究中,研究學(xué)校的計(jì)算機(jī)學(xué)院有三大專業(yè),分別是計(jì)算機(jī)科學(xué)與技術(shù)(課程數(shù)N=72)、
軟件工程(課程數(shù)N=53)和信息安全(課程數(shù)N=72),篩選其中選課人數(shù)大于30人的課程。其中計(jì)算機(jī)科學(xué)與技術(shù)和軟件工程專業(yè)根據(jù)學(xué)校培養(yǎng)的需要,通過考核選拔部分優(yōu)秀學(xué)生組成“卓越班”進(jìn)行培養(yǎng),分別是計(jì)算機(jī)科學(xué)與技術(shù)卓越班(課程數(shù)N=43)、軟件工程卓越班(課程數(shù)N=46)。因此,本次研究中“卓越班”的成績作為對照組,對專業(yè)教學(xué)質(zhì)量評估模型進(jìn)行檢驗(yàn)。
實(shí)驗(yàn)對學(xué)生總體成績進(jìn)行差異性分析。求得專業(yè)所有學(xué)生該課程成績的平均值,數(shù)據(jù)導(dǎo)入SPSS22.0,對五個專業(yè)(包含兩個卓越班)進(jìn)行多重比較分析。
研究假設(shè)
1)計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程、信息安全三個專業(yè)的成績沒有顯著性差異;
2)計(jì)算機(jī)科學(xué)與技術(shù)卓越班、軟件工程卓越班的成績顯著高于計(jì)算機(jī)科學(xué)與技術(shù)、信息安全和軟件工程三個非卓越專業(yè)。
實(shí)驗(yàn)結(jié)果分析 在該校計(jì)算機(jī)學(xué)院的三個專業(yè)和兩個卓越班級之間成績差別主效應(yīng)顯著的基礎(chǔ)上(F=20.895,P<0.001),進(jìn)行事后因子的多重比較。
從表1的研究結(jié)果來看,三個普通專業(yè)中軟件工程專業(yè)的成績要顯著優(yōu)于計(jì)算機(jī)科學(xué)與技術(shù)和信息安全專業(yè),其二者均具有顯著性差異(P<0.05);計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)和信息安全專業(yè)沒有顯著性差異(P>0.05)。該結(jié)果基本符合培養(yǎng)目標(biāo)。
計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的卓越班和軟件工程專業(yè)的卓越班沒有顯著性差異(P>0.05),但兩個卓越班的成績都明顯好于計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程和信息安全專業(yè)。這說明在學(xué)院培養(yǎng)中,卓越班學(xué)員的篩選及培養(yǎng)效果是明顯的。
課程集群差異 專業(yè)的成績有不同,專業(yè)不同類別的比較要有意義,還要根據(jù)課程組成績和耦合度來進(jìn)行比較。將數(shù)據(jù)導(dǎo)入SPSS22.0進(jìn)行獨(dú)立樣本t檢驗(yàn)。
根據(jù)課程性質(zhì),將課程分為專業(yè)課、學(xué)科基礎(chǔ)課和公共基礎(chǔ)課三個課程集群。
根據(jù)對成績結(jié)果比較分析發(fā)現(xiàn),計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程和信息安全專業(yè)的差異主要在公共課上,專業(yè)課與學(xué)科基礎(chǔ)課沒有顯著性差異(P≥0.05),故在文章中沒有展示。表2與表3是軟件工程的公共課程對比。對比差異,軟件工程與計(jì)算機(jī)科學(xué)技術(shù),P<0.05;與信息安全,P<0.05。結(jié)果表明,軟件工程專業(yè)的公共課成績要明顯優(yōu)于計(jì)算機(jī)科學(xué)與技術(shù)和信息安全專業(yè)。
耦合度分析 課程耦合度可以以課程組成績的一致性來代表,表明該課程組對學(xué)生能力檢驗(yàn)的一致性,以及學(xué)生掌握情況的一致性。成績數(shù)據(jù)導(dǎo)入SPSS22.0,對每個課程集群的數(shù)據(jù)采用克倫巴赫α系數(shù)一致性檢驗(yàn)。
從表4可以看出,該學(xué)校三個專業(yè)的大部分課程組耦合度都較低,只有計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)學(xué)科基礎(chǔ)的α系數(shù)達(dá)到0.6以上。由此可以看出,該校計(jì)算機(jī)專業(yè)課程的成績結(jié)果一致性程度不足。
問題課程篩選,以軟件工程學(xué)科基礎(chǔ)課程組為例,通過對項(xiàng)目刪除進(jìn)行度量,可以得出如果刪除該項(xiàng)目帶來的α系數(shù)的變化。根據(jù)變化可以看出該項(xiàng)目對整個課程集群帶來的影響。
表5是軟件工程專業(yè)的學(xué)科基礎(chǔ)類別課程的成績,以“程序設(shè)計(jì)(C)”課程為例,如果把“程序設(shè)計(jì)(C)”刪除掉,那么克倫巴赫α系數(shù)將上升到0.362。這說明“程序設(shè)計(jì)(C)”與其他課程的一致性差異很大,導(dǎo)致該課程組的一致性信度下降。
4 結(jié)語
基于成績的教學(xué)質(zhì)量評估模型為現(xiàn)在教育界常采用綜合評估模式提供了一種方法補(bǔ)充,為進(jìn)一步增強(qiáng)教學(xué)質(zhì)量評估效果提供了有效措施。
從相關(guān)數(shù)據(jù)來看,該校卓越班計(jì)劃效果是非常明顯的,卓越班的整體成績要顯著優(yōu)于非卓越班。但該校的專業(yè)課程集群耦合度不太理想,只有計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)的部分課程集群耦合度較好。該校軟件工程專業(yè)的學(xué)科基礎(chǔ)和信息安全專業(yè)的專業(yè)課兩個課程集群的成績一致性得分很低,說明應(yīng)對這兩個課程集群的課程成績打分模式進(jìn)行優(yōu)化。特別是在刪除項(xiàng)目度量中,對刪除該課程后一致性系數(shù)上升的課程,要進(jìn)一步進(jìn)行試卷分析和成績評價方案分析,提升教師成績評價的效度。
運(yùn)用基于成績的教學(xué)質(zhì)量評估模型,能夠?qū)崿F(xiàn)成績數(shù)據(jù)的深度運(yùn)用,將教師評價直接運(yùn)用到教育質(zhì)量分析中。課程集群化分析可以協(xié)助對專業(yè)課程質(zhì)量進(jìn)行評估,觀察教學(xué)質(zhì)量水平,探究教師成績評價質(zhì)量。通過對集群內(nèi)部的一致性檢驗(yàn)和刪除項(xiàng)目度量,實(shí)現(xiàn)對問題課程的精確定位,發(fā)現(xiàn)一致性不足的課程,并進(jìn)行進(jìn)一步分析。
參考文獻(xiàn)
[1]北京教育行政學(xué)院.學(xué)校管理的技術(shù)與手段[M].北京:文化藝術(shù)出版社,1990.
[2]陳玉琨.教育評價學(xué)[M].北京:人民教育出版社,1998.
[3]邢政權(quán),趙忠.泰勒模式對學(xué)生評教的影響研究[J].高等農(nóng)業(yè)教育,2017(1):40-42.
[4]袁琴.CIPP評價模式在高職項(xiàng)目課程評價中的應(yīng)用[J].中國職業(yè)技術(shù)教育,2013(35):53-57.
[5]許國瑩,劉家秀.專業(yè)課程教學(xué)質(zhì)量評價體系的構(gòu)建:基于醫(yī)學(xué)檢驗(yàn)技術(shù)專業(yè)實(shí)踐[J].中國醫(yī)學(xué)教育技術(shù),2015(2):229-232.
[6]黃巨臣,肖海燕.素質(zhì)教育背景下農(nóng)村中小學(xué)課堂教學(xué)評價研究[J].教育探索,2016(10):10-12.
[7]張麗萍,劉東升,林民.“課程群”教學(xué)管理體系的建設(shè)與實(shí)踐[J].內(nèi)蒙古師范大學(xué)學(xué)報:教育科學(xué)版,2013(3):61-64.
[8]張厚粲,徐建平.現(xiàn)代心理與教育統(tǒng)計(jì)學(xué)[M].北京:北京師范大學(xué)出版社,2007.
[9]席仲恩,汪順玉.論負(fù)克倫巴赫alpha系數(shù)和分半信度系數(shù)[J].重慶郵電大學(xué)學(xué)報:自然科學(xué)版,2007(6):785-787.
[10]黃靜宜.CIPP課程評價模式簡析[J].職業(yè)技術(shù)教育,2005(10):38-39.