藍欣?韓娣
摘 要 當前學生評教被廣泛應用且被賦予重要地位。以X大學的學生評教為個案展開元評價研究,其學生評教中存在學生遵循的標準與學校設計的指標體系脫節,學生評教組織實施與結果反饋無法讓學生感到評教的意義等問題。改進評教工作,建議以教學滿意度調查代替現有的大面積學生評教工作,鼓勵教師自覺運用“自我評價”的方法評價與改進教學,同時要科學運用評價技術,慎重對待評價結果。
關鍵詞 學生評教;元評價;教學滿意度;自我評價
中圖分類號 G712 文獻標識碼 A 文章編號 1008-3219(2017)05-0057-05
很多學校將學生評教結果作為教師評價的重要指標,學生評教被賦予重要地位并被廣泛使用,因此有必要對其進行科學評價,即學生評教的元評價研究。所謂元評價就是對評價的評價,也叫再評價,是指“按照一定的標準,運用可行的科學方法,對教育評價方案、教育評價結果和獲得結果的過程進行分析,從而對教育評價做出價值判斷,也就是對教育評價的科學性、有效性和現實性等進行的評價”[1]。由于X大學一直重視學生評教工作,將其作為教學質量保障的重要措施之一,學生評教模式也具有一定的代表性,所以我們對X大學的學生評教進行了細致的調查與分析。
一、X大學學生評教模式與內容、研究工具與信息采集
(一)評教模式與評教內容
評教模式。學生評教時間點:每學期進入期末復習階段開始,期末考試前結束;學生評教范圍:每個學期、每個學生對每個任課教師進行評教,即每個學生參與的對其每個任課教師的全員評價;評教方式:學生登錄教學管理信息系統進行網上評教;結果反饋方法:學生評教結果在每學期初面向被評價教師個人及教學單位相關負責人員反饋,教師通過教務管理系統查詢評教結果及學生的評價意見。評教結果的使用:學生評教結果作為教師教學質量評價的重要依據。對教師教學質量評價結果排序前30%的教師且學年評價分數在85分以上者,定為A級教師,給予表揚與鼓勵。后10%的教師,在職稱評審、評優等方面可能有不利影響。
評教的指標體系。X大學的評教指標體系從教學管理的內容與過程出發,將評教指標分為課堂教學管理、教師個人素養、師生關系及教學內容、教學環節、教學方法六個子項目,20個問題。其中課堂教學管理(課堂紀律、學生出勤與時間控制)、教學內容設計(教學目標、重點難點、進程設計等)與教學方法、手段(理論聯系實際、教學設備運用等)各4個問題,關于教師素養(教態、著裝、語言表達、人格魅力等)和教學環節(備課、教材選用與作業批改、輔導答疑)各3個問題,關于師生關系(師生互動與信息反饋、尊重學生)2個問題。
評教問卷采用李克特量表,每個問題有五個選項:很滿意、較滿意、一般、不太滿意、很不滿意,分別賦值為5分、4分、3分、2分、1分。學生對同一教師在20個問題上的評分之和即為該生對該教師的評價分數,介于20~100分之間。而授課班級所有學生的評教分數的算術平均數就是該班學生對該教師該門課程的評教結果。
(二)研究工具與信息采集
本研究的主要研究工具是問卷《學生評教問題調查》和X大學教務管理中的學生評教信息。X大學學生評教系統是其教務管理系統的子系統。根據研究需要,筆者獲得有關部門特別授權,可以調取其中任意班級學生的評教信息。
《學生評教問題調查》為自編問卷。它是基于初期對學生、任課教師的訪談及本研究的基本假設編制而成的。主要包括四部分內容:被調查者的屬性(如年級、專業類別、性別等基本特征)、學生對評教工作的主觀感受與主觀認識(9個問題)、學生評教的客觀行為(2015-2016學年第一學期學生評教的實際情況,3個問題)和學生信仰的“好教師”特征。
抽樣與信息采集。本研究以X大學所有本科在校生為調查對象。按照下述步驟抽取樣本并采集信息:第一步,通過學生評教信息系統調取2015-2016學年第1學期的評教信息作為學生評教質量分析的基礎數據。以教師授課班級為單位,按照年級、專業類型進行分層整群抽樣,共涉及4個年級、8個學院、42個自然班、19個授課班級(部分課程為幾個自然班的合班課,稱之為授課班級)。第二步,在所抽取的班級中進行問卷調查。問卷調查自2016年3月中旬開始,歷時近一個月。問卷調查選擇學生能夠安心作答的時間和場所,當場填寫、當場回收,較好地保證了問卷調查的回收率與有效率。調查共發放問卷1550份,回收問卷1504份,剔除無效問卷137份,共獲得有效問卷1367份,有效回收率為88.2%。樣本的人口學變量統計如表1所示。
問卷含一對檢驗收集數據信效度的配對問題,其相關系數為R=-0.699**,達到中等相關,說明所收集數據質量基本良好。
二、學生評教質量分析
(一)學生評教結果的總體分布
本次調查共涉及19個授課班級的76門次課程,評教的最高值為98.05分,最低值為74.11分,總平均值為92.88分。舍去2個離群值74.11分和81.44(74.11的標準分Z74.11=-4.48,81.44的標準分Z81.44=-3.25,均在3個標準差之外,故可作為離群值舍去),得到74門次課程學生評教結果的總平均值為93.28分,標準差為3.36分,標準誤為0.39分,其總體分布如圖1所示。74門次課程中有64門次(占85%)課程的評分高于90分,低于90分的只有10門次,全距為16.61分。
以授課班級為單位,統計同一班級學生對不同教師評價最高分與最低分之差(DR)(該指標粗略地反映了同一班級學生對不同任課教師評價的差異情況),DRmin=0.98,DRmax=12.2,其分布情況如表2所示。19個授課班級中有10個班級的最高評分與最低評分之差小于5分,大于10分的僅有2個授課班級,很多教師的學生評分只有1~2分之差。因此,以如此微弱之差異評價教師教學水平的高低是值得商榷的。
表2 各授課班級學生評教差異情況
R 0-5分 5-10分 10分以上 合計
授課班級數 10 7 2 19
注:這里以同一授課班級所有課程評教結果的最大值-最小值作為全距R,表示學生評教的差異。
(二)學生評教的信度分析
以同一班學生對同一組任課教師教學評分的一致性程度,即評分者信度評價學生評教的信度,它反映了學生對教師教學水平做出評價時所遵循價值觀念與操作規則的一致性程度,是反映學生評教質量的基本指標。
以所調查學生班級在2015-2016學年第一學期的評教結果為基礎數據,借助SPSS統計軟件,計算學生評教的肯德爾和諧系數W。結果顯示,所調查的22個授課班級中,最小值W=0.586,最大值W=0.895,其中有5個班的Kendall W系數>0.8,14個班的Kendall W系數介于0.7~0.8之間,只有一個班低于0.6,因此總體上學生評教的評分者信度尚好。
(三)學生評教效度分析
以評教問卷所欲測量的與實際所測量到的信息的一致性作為學生評教的內容效度。本研究不是對效度系數的直接計算,而是對學生評教操作過程的規范性、有效性來反映這一質量指標。學生評教時所遵循的評價標準、價值取向、規范操作是高效度評價的基本保證,反之就會影響效度。
根據問卷調查之前的學生、教師訪談了解的信息,將學生評教主要的不規范行為歸納為“請同學代為評教”“隨便地應付差事”“憑感覺而非指標打分”三類。《學生評教問題調查》設置三個是非選擇題,了解學生在問卷調查前剛剛結束的評教活動(即2015-2016學年第一學期)中上述問題的發生率。
從總體情況看,有4.95%的學生是“請同學幫忙”完成的;20.4%的學生“隨便地應付差事”;71.8%的學生是“憑感覺而非指標打分”的。以授課班級為單位的統計顯示:有8個班“請同學幫忙”的比例超過5%,最高達到12%;“隨便應付差事”的比例有10個班超過20%,最高達到52%,只有一個班低于5%;“憑感覺而非指標打分”的情況最為嚴重,最低43.9%,最高90%。
憑感覺而非指標給教師評分使得學校所要評價的與實際所測量的內容之間不一致,一定比例的學生請人幫忙、應付差事的做法加大了學生評教的誤差。因此,X大學的學生評教信度雖良好,但效度不高。
三、學生評教情況的問卷調查結果分析
《學生評教問題調查》除了上述學生評教行為調查,反映了評教效度問題外,還對學生的主觀感受主觀認識、學生信仰的“好教師”特征進行了調查,結果分析如下:
(一)關于學生主觀感受與主觀認識
關于學生評教的必要性:969名(71.2%)學生對學生評教的必要性持肯定態度,極為明顯地高于持否定態度的203人(14.9%,卡方=582.104**)。關于參與評教工作的意愿:820名(60.5%)學生表示愿意或比較愿意參加評教工作,極為明顯地高于不愿意或不太愿意的314人(23.2%,卡方=295.571**)。關于學生對自身評教行為的評價:問卷要求學生對自己的評教是否“總是客觀公正、認真負責”進行自評,結果1073名(79%)學生做出了“總是”或“基本是”的肯定回答,極為顯著地高于127人“完全不是”或“基本不是”的否定回答(卡方= 909.561**)。關于評教實際效果:1357名回答了此問題的學生中有502人(37.0%)認為評教沒有對教師教學產生積極影響,實際效果不明顯,極為顯著地高于持肯定態度的367人(27.0%,卡方=271.58**),多達488人(36%)的回答是不置可否。關于評教結果泄露的擔心:有589人(43.6%)顧慮教師看到評教結果而影響成績,所以多數情況都是評高分。這或許就是評教結果普遍偏高,評分結果差異小的原因。
可見,學生總體上是肯定評教的意義的,也有意愿參加評教工作,而且認為自己的評價是客觀、公正、理性的。但對評教的實際功能發揮是否定態度,也有相當比例的學生因擔心評教結果影響成績,而盡量不給老師打低分。當然,其余沒有表達“有必要”的28.8%、沒有表示愿意參加的39.5%、沒有肯定自己評教是“客觀、公正”的21%的學生也是不容忽視的客觀存在,如果他們以負面的評教行為對待評教工作,勢必對學生評教的信度與效度產生重大影響。
(二)學生信仰的“好教師”特征分析
《學生評教問題調查》中根據學生評教指標體系所涉及的六個維度歸納了9個優秀教師的重要特征,要求學生從中選擇自己滿意的好教師應具備的最重要特征(限選5個),并由“第一重要”到“第五重要”排序。被列為“第一重要”的賦值5分,依次遞減,“第五重要”的賦值1分,未被列出的賦值0分。1331人賦值結果統計如表3所示。
排位最高的是“實踐經驗豐富,技能水平高,確能給予學生指導與幫助”,其次是“講課充滿激情,富有活力”,第三是“工作態度認真負責、細心嚴謹”。相反排位最后的“舉止端莊,為人師表”,第八“嚴格教學管理,課堂駕馭能力強”,第七“學識淵博,學術水平高”。
表3 學生滿意的教師特征調查
N 和
x4.6實踐經驗豐富,技能水平高,確能給予學生指導與幫助 1331 3364
x4.3講課充滿激情,富有活力 1331 3110
x4.1工作態度認真負責、細心嚴謹 1331 2768
x4.8尊重學生,與學生平等溝通 1330 2567
x4.9教學方法得當,語言表達能力強 1330 2411
x4.2耐心教導學生,對學生負責 1331 2357
x4.5學識淵博,學術水平高 1331 1835
x4.4嚴格教學管理,課堂駕馭能力強 1331 763
x4.7舉止端莊,為人師表 1331 758
從這一統計結果我們可以看到:
一是學生更看重教師的實踐經驗或技能水平的高低,而對教師的學術水平高低反而不是很重視。這一結果與X大學的重視實踐技能培養,“動手動腦全面發展(從“動手動腦全面發展”的提法看,“動手”先于“動腦”,實踐重于理論,是該校一種教育理念與教育價值的反映。)”的校園文化相一致,也反映了現實社會中工具理性對大學生價值追求的影響。
二是與嚴格的課堂控制相比較,學生更喜歡能以其內在的教學魅力吸引學生的教師。“講課充滿激情,富有活力”被學生列在第二位,而“嚴格教學管理,課堂駕馭能力強”卻被排在倒數第二位,反映出學生喜歡有激情、有活力,真正具有感召力的教學,而過于“嚴格教學管理”反而容易引起學生的逆反,特別是經常花費大量時間點名簽到,而教學平平的教師很可能引起學生的反感。這反映了學生厭惡被約束、希望得到尊重、理解與信任的情感需求。
三是與舉止端莊的外在形象相比,對待工作認真負責、嚴謹求實的職業精神更能贏得學生的尊敬。“工作態度認真負責、細心嚴謹”被排到第三重要特征,而“舉止端莊,為人師表”被排到倒數第一的位置,說明認真對待每個學生的疑問,認真評判每個學生的作業并給予清晰的標注、點評或鼓勵,在學生看來彌足珍貴,應該得到教師的重視。
四、X大學學生評教工作存在的問題與對策建議
(一)存在問題分析
1.學生實際遵循的評教標準與學校設計的指標體系脫節
一方面,79%的學生認為自己總是“客觀、公正、理性”地進行評價,另一方面學生評教的不規范行為又較為普遍地存在。應如何解讀這樣的信息呢?
課題組在部分學生班級進行訪談,學生較為集中地反映了如下意見:第一,因對某些評價指標的意思不很明確或不很理解,不得不根據感覺而非指標評價;第二,部分學生認為以相同的指標評價不同風格教師、不同類型課程是不合理的,不應該局限于指標體系;第三,評價指標過于繁瑣,按照指標逐條評價的意義不大。所以學生認為雖然是根據自己的感覺而非指標進行評價的,但并非沒有依據的隨意評價,其結果反映了自己對教師教學的意見,所以是客觀公正的。
可見,學生評教通常是依據其“總體感覺”打分,反映的是學生對教師教學活動的感知效果與他們的期望對比而形成的感覺狀態,即學生的教學滿意度。而學校所要評價的是教師的課堂教學管理、個人素養、師生關系及教學內容、教學環節、教學方法等。兩者雖有一定的相關性,但從內涵到外延,兩者之間的差異是明顯的。
2.學生評教組織實施、結果反饋存在的問題影響了學生評教行為
關于學生對評教的主觀感受與主觀認識、學生的評教行為的調查,分學科、性別的統計檢驗均未發現顯著差異,只在分年級的方差分析中發現極為顯著的差異,即學生對評教工作的態度與做法隨著年級的升高而出現顯著變化,呈現出隨著年級升高,學生的重視程度下降,不規范的評價行為增加的現象,評教質量不高。認為評教很有必要或較有必要的學生比例由一年級的81%(265人)下降到四年級的64.5%(136人),而持否定態度的學生比例則由7.6%(25人)上升到22.3%(47人)。認為評教“非常有效或比較有效地”促進了教師教學水平提高的學生比例,由一年級的66%下降到四年級26.3%,而否定的意見則由一年級的11.7%增加到四年級時的40.6%。學生對評教有效性的評價在年級間存在極為顯著的差異(Pearson 卡方=92.832**)。學生“愿意或比較愿意”參與評教的比例由一年級的74.1%下降到四年級的43.7%,而“不愿意或比較不愿意”的比例則由一年級時的11.4%增加到四年級時的37.2%。學生參與評教工作的積極性在年級間存在極為顯著差異(Pearson 卡方=71.471**)。學生“隨便應付”、“根據自己的感覺而非指標打分”的不規范評教行為也隨著年級的升高而愈發嚴重,如表4所示。究其原因,是因為每學期一次的評教工作無法使其成為師生間信息交流的有效渠道,滯后的評教結果反饋模式無法令學生感受到評教的意義,學生作為評價者卻覺得“與己無關”,這無疑影響了評教的質量。
3.學校與學生對教師教學要求存在差異,影響評教效度
從評教問卷的分析中,可以看到學校對教師的課堂講授、課堂組織與管理等課堂上的教育教學行為,對備課、作業批改、輔導答疑、教材選用等教學環節均有明確要求。學校組織評教活動的目的之一就是規范教師的這些教學行為,進而達到提高教學質量的效果。
而學生根據自身的“感覺”給教師的評價,實際上是學生感知到的、教師課堂教學行為滿足其學習需求的程度。與學校對教師的要求不完全一致。兩者之間雖然相關,但出發點不同。學校的評價指標主要是教學管理視角下對教師教學行為與教學態度的要求,而學生評教則是“消費者”視角下教師教學行為能夠滿足其需要的主觀感受。教師如果僅僅拘泥于學校對教師教學的規范要求,忽視學生的客觀需求,就很難獲得學生的好評。例如,很多學生就喜歡板書而不使用PPT課件的數學老師、物理老師,與學校要求“靈活使用多媒體設備”的規定不一致。
(二)改進學生評教工作的對策建議
第一,以教學滿意度調查替代現有的大面積學生評教工作。評價本身是一個價值判斷過程,但科學評價是具有共同價值選擇的評價者,以客觀信息和科學方法為基礎,對被評價者某一屬性所做出的判斷。因學生對教師“課堂教學質量”的價值選擇不同,通常采用的學生給老師打分的“評教”充其量不過是學生對教師課堂教學滿意程度的民意調查,并非真正意義上的教學評價。因此,學生給教師教學打分應側重于是否喜歡老師的教學,是否從中有所收獲,是否因教師的教學而喜歡上相關專業內容或方法,而非對教師具體教學內容、教學方法等專業性評價。這種對學生的民意調查同樣能夠反映教師的教學質量,因為學生普遍不喜歡的課程不可能是教學質量高的課程。無論教師水平多高,不能得到他的服務對象——學生的滿意就不能說是成功的。
第二,學校要采取措施,鼓勵教師自覺地運用“自我評價”的方法評價、改進與完善教學活動。自我評價是人們對自己的能力、狀態和發展趨勢的評價,具有自我發展、自我實現、自我完善等重要功能[2]。現在的評教無論是被評價的教師,還是參與評價的學生都是被動的參與者,影響了評教功能的發揮。教師在教學活動中經常性地傾聽學生意見,隨時地了解學生需要,自己對自己教學的優劣、長短進行反思與強化,無疑對于改進教學方法、提高教學效果具有重要意義。每學期一次的學生評教由于其滯后性使得教師失去了調整、改進的機會,學生失去了獲得更滿意教學的機會。只有教師自覺地運用自我評價的方法才能真正達到促進教與學共同提高的目的,讓教師與學生都能在評價中受益。
第三,要科學地運用評價技術,慎重地對待評價結果,避免簡單地按照分數排隊的做法。任何形式的評教活動其目的都是幫助教師發現問題,改進教學,而非打分、排隊。本末倒置簡單地以分數高低評價教師的教學不僅無法實現評價目的,還可能給教師帶來過大壓力,導致不敢管學生、一味迎合學生的現象。對于學生滿意度低、確實存在問題的教師,應充分發揮基層教學組織、教學督導部門的督導作用,通過深入課堂聽課,幫助教師找到問題及其解決的辦法。只有這樣才能真正發揮評價的功能。
參 考 文 獻
[1]王漢瀾.教育評價學[M].河南:河南大學出版社,1995:422.
[2]何云峰,胡建.自我評價的多維哲學思考(筆談)——自我評價的功能和作用[J]. 湖南師范大學社會科學學報,2007(5):16-20.