摘要:本文以本校高一年級期末考試的物理成績為研究對象,用SPSS軟件對640份試卷進行了初步的統計分析,計算出了試卷的難度、區分度、信度、效度等具體量化參數,驗證了一種提高試卷效度的方法,統計分析的結果增加了試卷質量評估的可靠性、科學性,為指導和改進課堂教學提供了參考基于SPSS的學科相關性分析和性別差異性分析也為學生選科和生涯規劃提供一定的借鑒意義.
關鍵詞:SPSS;考試數據;試卷分析
基金項目:蘇州市教育科學“十三五”規劃2016年度課題“基于提升學生核心素養的初高中物理教學銜接的實踐與研究”(項目編號:16032060).
作者簡介:田曉華(1986-),女,甘肅定西人,碩士,中學一級教師,研究方向:高中物理教學及研究.
考試是檢驗教師的教學效果和學生學習效果的一種重要手段,一份優質的試卷能為測試結果提供客觀、科學有效的評價,因而試卷分析是教學工作中的一項重要內容本文通過SPSS軟件對本校高一年級期末考試的物理成績進行深度分析,以期對物理教師課堂教學策略的改進和調整提供一些參考.
1原始數據錄入
本文使用的軟件為SPSS21版啟動軟件,點擊菜單“文件”→“打開”→“數據”,選擇文件類型為“Excel”,將高一全年級學生的物理成績(含小題得分)導入,SPSS會根據Excel自動添加變量名.
2試卷結構
本試卷由兩部分組成,滿分120分,其中選擇題共38分,非選擇題共82分,見表1所示.
基本描述統計數據表顯示:學生總數為640人,無人缺考,全級均分8221分,最高分117分,最低分23分,全距為94分,方差235369,標準差為15342,說明本次檢測中學生的個體差異較大筆者和學生溝通交流后發現原因在于:從初中進入高中,物理學習梯度較大,有部分學生還沒有適應高中物理的學習,加上同時學習9門功課,部分學生往往無法合理安排學習時間,容易導致顧此失彼,甚至有個別學生產生直接放棄學習物理的念頭因此教師應該在教學中做好分層教學,因材施教,特別要多關注這部分低分學生,幫助其夯實基礎知識,適時做好補差工作,探索多種教學策略,調動學習物理的積極性.
32正態分布檢驗
為了檢驗試卷是否規范,需要觀察學生成績是否服從正態分布.圖形可以將數據分布比較直觀地呈現出來,因此筆者首先做出分數分布的直方圖運行菜單:“分析”→“描述統計”→“頻率”,將“總分”拖入變量框,點擊“圖表”對話框,選中“直方圖(在直方圖上顯示正態曲線)”,運行結果如圖1.
由圖1可知,全年級成績基本呈正態分布結合表2分析得知:峰度系數0357>0,表明該總體數據分布與正態分布相比較為陡峭,為尖頂峰;偏度系數為-0615<0,表明總體成績略微呈負偏態分布,即高分略多.
為進一步檢驗,可做P-P圖或者趨降P-P圖.P-P圖的兩個坐標軸分別表示理論累計概率和實際累計概率,如果數據服從正態分布,則其中的數據點應和理論直線(對角線)基本重合趨降P-P圖,反映的是按正態分布計算的理論值和實際值之差的分布情況,即分布的殘差圖如果數據服從正態分布,則數據點應較均勻地分布在Y=0這條直線上下[1].具體操作:點擊菜單“分析”→“描述統計”→“P—P圖”,在彈出的對話框中將全卷總分拖入變量框,單擊“確定”,運行結果如圖2所示.
由圖2可知,本次測試學生的物理成績基本服從正態分布,表明試卷命題基本合理,反映了學生的實際水平這也說明接下來的統計分析是有意義的.
33試卷的“四度”分析
331難度
難度是指測試題目的難易程度,用難度系數p表示,且0≤p≤1本文中用公式P=MW計算各題的難度系數,期中M表示全體學生某題的平均分,W表示該題滿分分值試題的難度一般07以上為容易題,04~07為中等難度,04以下為較難題或難題通常期末考試為目標參照性考試,可適當偏高,全卷平均難度以07左右為宜,06~08為正常[2]
操作如下:首先在菜單欄點擊“分析”→“描述統計”→“描述”,將“q1”“q2”……“q18”拖入變量框,點擊“選項”對話框,選中“均值”,點擊“繼續”、“確定”,即可得到每題的平均分然后將“每題平均分”“每題的滿分”作為變量輸入相應數值,點擊菜單“轉換”、“計算變量”,目標變量設為“p”,數學表達式為“P=每題平均分/每題的滿分”,最后單擊“確定”,運行便可得到各題的難度系數,整理輸出結果見表3.
全卷的難度p可取各題難度的加權平均值,或按公式P=K 來計算,其中 表示所有考生的總分均值,K表示試卷滿分.
從難度分析來看,大部分題的難度大于07,選擇題中1、2、3、4、8、9、10為容易題,第5、7難度中等,第6、11屬于難題實驗題中第12為容易題,13和14難度中等計算題中第15、16、17為容易題,18屬于難題全卷的難度系數P=8221/120=0685,難度中等,有利于測量學生的真實水平和更好地控制不及格率進一步對照試卷內容,發現難度系數大于09的幾道題目考察的知識點過于基礎,選項過于明顯,故而需要修改才能加入題庫第11題難度系數較小,但該題非常新穎靈活,期末測試出現這樣一道題也很正常,從另一方面,也提示教師在教學中應該多聯系生活實際,注重知識點靈活應用.
332區分度
區分度是指試題對考生實際水平的區別能力,通常將試卷滿分作為考生的實際能力水平,而將考生某題得分與試卷總分的相關系數作為該題的區分度.
區分度常用D表示,取值在-1~1之間,值越大區分度越好按照美國伊貝爾(L.Ebel)提出的標準,04以上表明此題的區分度很好;03~039表明此題的區分度良好,修改后更佳;02~029表明此題的區分度尚可,但需修改;019以下表明此題的區分度差,必須淘汰或改進后方可使用另外,若區分度為負值,則為消極區分,說明這個題目有問題,應刪除或重新修訂;區分度為0,則無區分作用.
每道題的區分度在某種程度上可以衡量該題目的優劣,而各題區分度的加權平均是衡量一份試卷優劣的重要指標,可以按照公式D=∑ni=1KiDi∑ni=1Ki 計算,式中D表示試卷的區分度,Di表示第i題的區分度,Ki表示第i題的滿分.
具體操作:運行菜單“分析”→“相關”→“雙變量”,在彈出的對話框中將“q1”“q2”……“q18”“總分”拖入變量框,相關系數選擇“Pearson”,其它為默認值,點擊“確定”,得到各題的相關系數矩陣,輸出結果整理見表3.
由表3可知:第5、8、12~18題的區分度均大于04,區分度很好;第3、9、10題區分度良好;第4、6、7區分度尚可,第1、2、11題區分度很差結合難度系數還可以發現,難度系數過高或過低的題目,區分度都很不好,因此在命題時應綜合考量,適當調整只有適當的難度才會增大區分度,這對試卷質量的提升具有指導意義全卷的區分度計算得D=0491,整體區分度很好.
333信度
信度指測試結果的穩定性或可靠性的程度,越高說明考生受偶然因素影響的程度越小,可以比較真實客觀地反映考生的學習水平實際測量中有多種不同度量方式本文用科隆巴赫α(Cronbach's Alpha)系數來度量,取值范圍0~1,一般認為大于09信度為優,07~09較好,低于07為不合格.
具體操作:運行菜單,點擊“分析”→“度量”→“可靠性分析”,將變量“q1”……“q18”全部拖入項目框,模型選“α”,單擊“確定”,運行結果如表4(a)和表4(b)所示.
由表4可見,本次試卷的信度為0714,屬于一般.各題項已刪除的 Cronbachs Alpha 值在0665~0717之間非選擇題除第15題外都低于07.
影響試卷信度的因素較多,可以嘗試從以下兩個方面提高試卷信度:(1)增加題目數量;(2)盡可能使全卷難度系數呈正態分布.
對于方法2,由于無法重新測試,筆者嘗試做出各題難度系數的直方圖,并再次用P-P圖進行正態性檢驗,方法同前,運行后輸出結果見圖3.
很顯然,全卷各題的難度系數并不符合正態分布,這也對信度產生一定影響同時也給命題者一定的啟示,為了獲得較高的信度,應當在一份試卷中將各種難度的題型、題量合理搭配,盡可能使試題的難度呈正態分布.
334效度
效度是指測量結果的準確性和有效性的程度,亦即測量是否達到預期的目的效度的估計有多種方法,本文用效標關聯效度,它是以測試分數和校標之間的相關系數來表示測試效度的高低效度用E表示,取值范圍0~1,一般大于07為優秀試卷,04~07較好,低于04為不合格[4]
本文選擇高一(上)的期中考試成績作為校標,將學生的期考試中和期末考試成績作為變量輸入SPSS,利用Pearson相關分析,方法同前,輸出結果見表6可見兩次考試成績的Pearson相關系數為0675,故認為本試卷效度較好
4學科分析
41物理與其他學科的相關性
按照新高考改革的方向,學生可以在語文、數學、英語三科之外,自由選擇物理、化學、生物、政治、歷史、地理中的三科作為高考考試科目,即所謂3+3模式各種選科組合給學生很多自由度,然而怎樣選擇搭配才較為合理科學,筆者嘗試對物理成績與其他學科成績進行Pearson相關分析,方法同前,輸出結果見表7.
Pearson相關系數用r表示,取值-1~1,當r>095說明極強相關;當r>08高度相關;當05 分析表7可知,無論男生還是女生,物理成績除與語文無關外,與其他學科均顯著相關,但相關程度有所不同男生的物理成績與化學、生物、地理、數學呈中度相關,女生的情況也基本相同據分析,在6個選科中,高校提出選考科目所占的比重由大到小依次排列為物理、化學、生物、地理、歷史、政治以上海高考為例,最多的組合是“物化生”,再次是“物化地”[5].可見,這樣的選科組合也是有一定科學依據的當然,在選科時除了要符合高校對選科的要求,還要考慮自己的興趣、愛好、特長等因素,綜合考量從而制定自己的生涯規劃. 42物理成績的性別差異分析 由前所述,物理對學生的高中生涯規劃尤為重要,然而很多學生、家長甚至有些教師都普遍認為“男生比女生更適合學物理”,因此筆者嘗試用SPSS中的獨立樣本T檢驗來分析本次考試中男女生成績有無顯著差異. 操作如下:點擊菜單“分析”→“比較均值”→“獨立樣本T檢驗”,在彈出的對話框中將全卷總分、卷1、卷2一起拖入“檢驗變量”框,將“性別”拖入“分組變量”框,單擊“確定”,輸出結果見表8. 由表8可知,“全卷”、“卷1”、“卷2”三項的第一個sig均大于005,即方差齊,因此觀察方差齊性時的T檢驗sig值,若sig>005,則表示兩組均值無顯著差異;若sig<005,則表示兩組均值存在顯著差異結果顯示,全卷sig=0759,卷1的sig=0195,卷2的sig=0882由此可以得出結論:無論全卷總分,還是卷1(選擇題)、卷2(非選擇題),男女生成績均無統計學意義上的顯著差異因而教師應該糾正“女生不適合學物理”、“女生學不好物理”這種性別歧視觀點,強化性別平等意識,積極鼓勵女生學習物理鑒于篇幅原因,其它性別差異分析將單獨討論. 5結論與啟示 本文運用SPSS軟件對一次考試成績進行了初步的統計分析,得到較為客觀、準確、科學、全面、清晰的量化分析,結果顯示,本次試卷難度P=0685,難度中等;區分度D=0491,整體區分度很好;信度α=0851,較好;效度E=0675,較好在大規模的考試中,如果試題的難度處于03與07之間,區分度大于03的話,則可以認為試卷具有較高的質量[6]因此該試卷是一份較為成功的試卷,統計分析的結果為物理課堂教學的調整和改進提供了一定的參考意義,也對此后的命題工作提供了信息參考對物理與其他學科間的相關性分析和成績的性別差異分析也為學生的選科、生涯規劃提供了一定的參考價值. 參考文獻: [1]張文彤,鄺春偉SPSS統計分析基礎教程[M].北京:高等教育出版社,2011. [2]王雪,鄧振偉,陳玲,田七SPSS軟件在試卷質量分析中的應用[J].讀與寫(教育教學刊),2009(3):74-77. [3]陳琪琪基于SPSS的物理試卷分析與評價[J].物理通報,2017(12):103-106. [4]趙立新,陳文藝,郭子君試卷質量的定量評價[J].華南農業大學學報(社會科學版),2004(4):136-141. [5]鄭剛高考“3+3”模式下的生涯規劃指導:如何選科[J].遼寧教育,2016(6):79-80. [6]章建石新高考改革背景下不同版本試卷測量學指標的比較與監測——以某年度英語試卷的分析為例[J].全球教育展望,2018(5):71-79.