【摘 要】測驗法是最常用的教學評價手段之一,試卷作為測驗的工具,蘊藏著大量重要的信息,教師可以從正態性、信度、效度、難度、區分度等方面做試卷分析,挖掘數據資源。教師在分析考試數據的過程中,不僅要看到測驗的鑒定功能,而且更需要重視其診斷和改進作用,將試卷分析的信息充分地應用于教學實踐之中,改進教學,不斷提高教學質量。
【關鍵詞】試卷分析 試卷應用 物理測驗
考試在教學實踐中有著廣泛的應用,除了選拔、鑒定功能之外,教師還要重視其對教學的指導和改進功能。在查閱文獻的基礎上,結合自身的教學經驗,我們認為,試卷分析與應用的基本思路為“采集數據—處理數據—指導教學—總結反思”四個環節。
一、采集數據
本文的研究數據選自陜西省延安市某中學高二年級一個班級44名學生的一次物理月考成績。考試試卷為教師自主編制,試卷共有22道題目,滿分為100分。
將該班所有考生本次測驗中22個題目的得分逐個統計在Excel表格中,形成考試成績統計表,并導入Spss軟件中。
二、處理數據
數據處理工具是Excel及其Spss16.0統計分析軟件。
1.成績分布及統計分析
通過考試取得的數據往往是大量的,難以直接看出具體信息,需要對其做初步整理才能反映數據的整體概況。可以通過頻數分布表、頻數分布圖和一些特征值對數據做初步的處理。對44名學生考試成績作成績的頻數分布圖,并輔以正態擬合曲線,如圖1所示。
理論上,考試成績應服從或近似服從正態分布,即成績中等水平的學生占大多數,成績特別好和特別差的學生占少數。試卷分析首先必須檢驗其考試結果的分布情況,通過正態擬合檢驗發現本次考試的成績接近正態分布,且成績處于低分區人數較多,20分以下1人,成績在40~50分的頻數最大,達到12人,成績在80~90分的有5人。
對考試成績作基本統計,情況如表1所示。
從表1可看到,考試成績的平均值為48.09分,中位數為43.50,標準差為19.32,表明各個成績偏離平均值的程度較大;最低分為19.00分,最高分為87.00分,該班級成績總和(sum)為2116分。四分位數(Percentiles)為:第一四分位數為32.25,表示有25%的考生成績低于32.25分;第二四分位數為43.50,表示有50%的考生成績低于43.25分;第三四分位數為60.00,表示有75%的考生成績低于60分。
2.考試試卷評價指標分析
一份好的試卷,從總體上來說,就是準確可靠、切實有效、難易適當和鑒別力強。在實際的試卷質量評價中,通常采用信度、效度、難度和區分度這幾個指標來衡量。
(1)信度。信度是反映一份試卷的穩定性和可靠性的指標,是分析試卷整體質量的重要指標之一。一般認為,在0.80以上表示非常好,在0.60~0.80之間表示較好,低于0.60時不可信,應對評價指標進行修訂。此次試卷檢測到的系數為0.870,表明該測驗的內在一致性信度非常好,說明測題的各部分都以同等程度測量著被試的同一種屬性,即本次考試成績的可靠性較高。
(2)效度。效度是反映試卷的準確性和有效性的指標,同時也是評價試卷整體質量的一項重要指標。一般來說,效度數值越大,測題就越好。經計算得到本次測驗的效度系數。對效度系數做統計假設檢驗,樣本容量小于50,其檢驗統計量t=2.34,即2.58>t≥1.96,表明效度系數在0.05水平上與總體零相關有顯著性差異,可以得出本次測驗具有有效性的結論。
(3)區分度。區分度指測題對于被試反應的區別程度和鑒別能力,一般用某題的得分與測驗總分之間的相關系數來表示。經計算,求得各題區分度如表2所示。
分析表2發現,第7題區分度小于0.20,表示區分度很差;第1、第3、第5、第9、第10、第18等題區分度尚可,但是能修改則更好,其他題目區分度非常好。
(4)難度。難度是衡量試題與試卷難易程度的指標,以難度系數來衡量,一般情況下,試題的難度系數即為該試題的平均得分率,難度系數越大,試題越容易,反之越難。
在本次測試中,計算得到各題難度系數如表2所示。分析表2發現,第7、第8、第11、第13、第14題難度系數小于0.4,為難題(p<0.4);第1、第2、第3、第4題為容易題(p>0.7),其余為中等難度(0.4
三、指導教學
在現行教學制度下,教與學的雙方及其管理者更加看重考試結果的評價功能。其實對于教與學雙方的可持續發展而言,考試的改進功能都應該是首要的。考試只有促進學生發展和教師成長才能完成其終極目的并且體現其存在的根本價值。
1.發揮測驗對學科知識的診斷—改進功能
通過對測驗的分析,師生可以對教學過程中存在的問題進行揭示與研究,判斷導致困難與不足的原因,進而改進教學活動,即診斷—改進。診斷—改進功能是現代教育評價的主要功能,人的發展和教育活動都是一個不斷變化的過程,只有不斷完善和改進教學才能充分發揮考試的價值。
分析圖1發現,50分以下考生達到28人,即有一半以上的考生成績低于平均成績,需要深入對這28名考生的試卷做詳細分析,尋找失分的原因,制定補救措施。
分析表2中的難度系數發現,試卷第7、第8、第11、第13、第14題難度較大,說明大部分考生這些題都做錯了,教師應重視這一現象,診斷這一現象背后的深層原因是什么,做到透過現象看本質,從而制定相應的措施解決問題。
2.重視測驗對學生的心理影響
在考試中,考生都渴望自己學習的成果被認可,這是一種普遍的心理現象。在教學實踐中必須重視這種心理現象,利用這一心理反應,盡可能維護學生的高成就動機和高自我效能感。
(1)加強個體內評價與相對評價相結合。相對評價是在一個團體內,個體以自己所處的位置與他人相比較而進行的評價。個體內評價法是以被評價對象自身某一時期的發展水平為標準,判斷其發展狀況的評價方法。個體內評價是把被試的過去和現在比較,或者將評價對象的不同方面進行比較評價,評價對象只和自身相比較,充分體現了尊重個體差異的原則,適當地減輕了被評價對象和其他人對比的壓力,可以提高被評價對象的自信心和學習熱情。教師在處理考試結果時,特別是對成績不理想的考生,要多采取個體內評價。
在本次測驗中,某個考生考試成績為54分(見表3),在班級中排名為第14名,如果僅僅對他的第四次考試成績做相對評價,可能會使其對學習喪失信心。但是如果將個體內評價與相對評價結合起來,讓學生通過和自己以往的成績相比較,使其清楚地認識到自己的進步,不要輕易否定自己,那么就能提高學生的自我效能感。
(2)注重量化評價與質性評價相結合。書面測驗的規則是把考試的結果數值化,從而對評價對象作出評判。其優點是邏輯性強,標準和精確化程度高,能對教學現象的因果關系作出精確分析,對考生的行為特征作出準確描述,結論較為客觀和科學。但是量化的成績不能反映教學過程中某些不可量化的因素。量化評價把復雜的教育現象加以簡化或數字化,容易丟失教育過程中一些很有意義的內容,因此在對測驗試卷的應用過程中,不能局限于對具體數值的關注,對學生的評價要與質性評價相結合,重視教學過程中的非智力因素,通過特定的方法(如與學生對話、交流等),關心學生的情感、態度、價值觀等因素。
四、總結反思
一套完整的測試試卷包括測驗目標、測驗時限、測驗類型、測題數量、計分方法、測驗的信度和效度等諸多要素,任何一套測驗試卷的編制都不會是一勞永逸的,需要根據測試的結果對難度、區分度作出修正,使試卷組成不斷趨于完善。
從表2可以看出,本次考試區分度不合格(0.2以下者)有第7題,可以刪去,因為它不是過難就是過易;第1、第3、第5、第9題區分度較低,應該修正這些題目,提高區分度。分析難度系數發現,容易的試題有4道,中等難度的題目有13道,較難的題目有5道,應當適當削減難題數量,增加簡單題目數量,使試卷結構更加趨于合理。
(作者單位:寧夏大學物理電氣信息學院,寧夏 銀川,750021)