999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于SPSS 17.0的試卷科學性測度

2013-12-31 00:00:00戴惠蓉
科教導刊 2013年26期

摘 要 考試肩負著檢驗教學效果的重任,理應對其進行科學化測度。文章以SPSS17.0為統計分析工具,通過成績分布直方圖、題目難度、題目區分度、題目信度和題目效度等指標來測度試卷質量,不僅可以直觀、便捷分析考試結果,發現考試中的重要信息和規律,還可為教學效果評估提供重要的考核指標和模式。輸出模塊顯示了藉以測度的試卷的質量,并為提高試卷科學性指明了路徑,以使試卷測度系統形成良性循環。

關鍵詞 SPSS 17.0 試卷 質量 測度

中圖分類號:G424 文獻標識碼:A

0 引言

考試,作為教學過程的重要環節,不僅承擔了檢驗學生知識掌握能力的重任,而且彰顯著教師的教學效果和教學能力。以往,對于考試功效的認知呈現著重“考試成績”輕“試卷質量”的偏誤,成績被統計完畢,試卷即壽終正寢,鮮有對試卷本身進行量化分析的教學實驗,這不利于教學質量的提高和教學評估的科學化。隨著社會科學研究方法的日益科學化和規范化,考試作為教育學研究的重要內容,理應對其進行科學化測度,這不僅能提高試卷的出題質量,檢驗學生掌握所學知識的真實水平,還能為考核教師教學能力提供重要的指標。教育評價技術方法中教育測量理論就是應用教育統計學方法來實現的,為測評學生能力、分析試卷質量、考核教育效果提供了可資借鑒的分析方法。

試卷本身的科學性體現在諸多方面,如試卷總體成績分布、試卷難度、區分度、信度和效度等,以上因素影響著一份試卷的質量。本文以泉州市新村小學某年級學生的89份小學語文考試樣卷為樣本,借助統計學軟件SPSS 17.0來施以量化分析,旨在探尋試卷質量的需改進之處,促進教學能力的不斷提高。同時希冀教師在學術科研和教學實踐過程中更加注重科學統計方法的應用,挖掘有關考試的有價信息,提高自身的綜合素質。

1 研究框架及數據處理

一個完整的試卷科學性測度系統包括試卷、成績、測度和輸出四個模塊。其中試卷模塊、成績模塊和輸出模塊的建構基于主觀判斷,難以量化分析,而測度模塊須以計量統計分析為支撐。本研究以SPSS 17.0統計分析軟件為工具來測度試卷質量,主要圍繞測度系統展開,并輔之以試卷題型及分值構建、考試成績錄入和分析結果輸出模塊,旨在便于統計分析并為提高試卷科學性指出路徑。

考生人數應為90,其中1人因故缺考,有效樣本數為89。經過客觀公正批改,形成實得成績。教師在對成績進行匯總時,應該考量成績匯總用途,如果僅用于考生學習能力測評之目的,則只需統計各被試學生的卷面總成績;若有意向借助成績進行試卷質量測度,則須統計各被試考生各小題的實得分,形成數據表。統計成績一般采用Excel文件,若借助SPSS 17.0軟件進行試卷科學性測度,則可以直接將數據輸入數據錄入分析系統。亦可首先在Excel文件中將數據錄入完畢,然后將其導入SPSS 17.0分析軟件。

2 試卷科學性測度

試題科學性的客觀標準體現在符合教學大綱要求,難度適當,區分優劣能力較強,覆蓋面較大,學生考試成績呈正態分布等諸方面。縱觀已有研究成果,鑒別試卷質量優劣的數字指標有“五度”:信度、難度、區分度、效度、覆蓋度,但在實際適用中,經常被采用的是“四度一分布”,即信度、難度、區分度、效度及成績分布。

2.1 建立成績分布直方圖

在教育測量方法中,正態分布是最常見、應用最廣的一種重要分布。根據教育統計學的理論,經統計分析(樣本數≥30)93%的考試成績分布狀況在直觀上呈現為“中間多,兩邊少,左右基本對稱”的特點。判斷成績是否接近正態分布,最直觀、最有效的方法是將成績分布曲線與均值和方差相同的正態分布曲線加以比較。所以一次難度適中信度可靠的考試,客觀有效的學生成績應接近正態分布,且平均分在75分左右,標準差在5~9之間。

利用SPSS得到分數段分布直方圖,如圖1所示,這89名學生的成績分布形態基本對稱,較接近正態分布。平均分為69.66分,標準差為8.755分,分析結果基本符合數理統計學原理。

2.2 題目難易度分析

難度(Difficulty)是反映試題難易程度的一個指標,它對考試結果有很大的影響,題目的難度值越大,說明該題越容易,反之該題越難。

一般的試卷主要選擇難度在0.5左右的試題,如果是選拔性質的考試,應該主要選擇難度較高的試題,如果是達標性質的考試,應該選擇難度較低的試題,同時為了測試考生的能力差異,試卷中應該加入少量難度較高的題目。總體上說,試卷的難度應該控制在0.3~0.8之間。但是題目的難度系數不能太接近,這樣的題目太同質,會降低總分數的區別力。所以一張試卷的平均難度除控制在0.3~0.8之間外,還應使試題的難度適當分散。

根據本次考試的難度統計結果,Q5、Q7、Q17、Q18、Q27題題目較難,Q20題題目偏難,Q11、Q21、Q25、Q30、Q31、Q32、Q33、Q34、Q35、Q36題題目偏易。由于得分便易的題目集中在主觀題上,從某種程度上可以反映學生對主觀題的把握能力較強。

2.3 題目區分度分析

區分度(Discrimination)是指測驗題目對學業水平不同的學生的區分程度或鑒別能力。具有良好區分度的測驗,區分度越高,說明試卷區分考生水平差異的能力越強,反之,區分能力就越差。它是測驗是否有效的“指示器”,被作為評價試題質量,篩選試題的主要指標與依據。

本文采用一種比較便捷的測度方法,區分客觀題與主觀題。對于客觀題,采用斯皮爾曼(Spearman)等級相關分析法,即求總分與每個試題得分間的相關系數;對于主觀題來說,看成是非等間距測度的連續變量,并且樣本數大于30,采用皮爾遜(Pearson)相關分析法,即求總分與每個試題得分間的積差相關系數作為試題的區分度。

根據試卷各題的區分度,第4、7、11、12、14、15、18、20、23、25、26、33小題的區分度不夠,應被淘汰或作進一步的修改。

2.4 信度分析

信度(Reliability)是指測量方法的質量,即對同一現象進行重復觀察是否可以得到相同的資料。具體到試卷信度,是指同一個測驗對同一組被試對象,施測兩次或兩次以上得分的一致程度。信度的高低反映了考試中隨機因素影響的大小,一次測試中隨機因素影響小,則信度大,隨機因素影響大,則信度小。信度也可以用來指示實測值和真值相差的程度,如果實測值與真值相差較小,說明結果的信度較高,反之信度較低,信度值的合理范圍為0.5~0.9。在SPSS17.0軟件中一般采用科隆巴赫(Cronbach)€%Z系數計算測驗的內部一致性系數。

本次考試的信度系數為:Alpha=0.576,本次測試的信度較低。

2.5 效度分析

效度(Validity)是指測量準確地反映所需測量概念的程度。表現在考試試卷測度上,是指試卷準確地測量了考試目的欲測內容的多少。具體而言就是覆蓋面和權重在多大程度上體現了教學大綱的要求,能否有效檢驗考試能力水平。效度與信度的區別是:信度反映了考試中隨機誤差的大小,而效度反映了考試中系統誤差的大小。缺乏信度和效度的測量都是不科學的。

效度只有高低之分,沒有全部有效和全部無效之分。效度的取值范圍在0至1之間。對于一次考試來說,其效度系數一般應在0.4~0.7之間,值越大效度越高。本文采用標準關聯效度法(predictive validity),把學生的平時成績作為效度分析的標準,利用積差相關法求效度。根據計算結果,本次考試的試卷效度為0.593。

3 測度結果及調試路徑

3.1 測度結果

根據教育測量理論,本次小學語文考試成績的分布直方圖并未凸顯出畸形特征,基本上呈正態分布,單峰且大體對稱。通過對題目難易度的計量分析可以看出,只有1題偏難,卻有10題偏易,這不利于區分被試者的知識掌握能力的高低。從本次考試成績的區分度可以看出,共有12道題目的區分度低于0.2,這不利于檢驗學生真實水平的差異性,需要改進出題質量,提高區分度。本次考試成績的信度雖然在合理值范圍內,但是值接近合理區間的底限,說明試卷測試的題目的一致性程度較低,需要進一步調適試題,提高信度。本次考試的效度居中,考試測量目的預測內容的程度一般。

3.2 調適路徑

根據測度結果進行試卷調適,是試卷科學性測度的重要目的之一,是提高教學質量的重要環節,應引起廣大教育工作者的充分重視。考試成績是考生水平的反映,同時考試成績分布是否呈正態反映了命題質量。此考試成績呈正態分布曲線,此次說明考試基本上符合教學要求。在考試題目設計上要求對試題的難度組合進行合理的搭配,這樣有利于考試成績的正態分布。本次試卷的偏易題過多,偏難題過少,在調適試卷的時候應注意適當增加偏難題的數量并減少偏易題的數量,這也有利于提高試卷的區分度。本次考試的信度系數較低,提高測量信度一個常用的方法是在提高試題區分度的前提下,適當增加試題數量。另外從信度系數的計算公式上看,增加考試總分的方差,減少各小題的方差,可以增加信度。從操作的角度看,擴大樣本容量,題目難度值的差距不懸殊且在0.4~0.7之間,提高試題區分度,以及制定盡可能客觀的評分標準和方法等均有利于提高考試信度。就效度而言,因作為效度測量標準的的變量有很多,而一個測驗又可能會有不同的標準,因此必須注意標準的選擇,它是獲得測驗的標準關聯效度的核心。

4 結語

考試,是衡量教學效果的必要手段。隨著統計學及經濟計量學邊緣的不斷擴張,對于教學結果的評價越來越依賴于科學的理論和方法。教育評價技術方法中教育測量理論就是應用教育統計學方法來實現的,成為測評學生能力、考核教育效果的重要措施。利用SPSS測度考試的難易度、區分度、信度、效度等指標,不僅可以直觀、便捷分析考試結果,發現考試中的重要信息和規律,還可為教學效果評估提供重要的考核指標和模式。通過構建合理的測度系統,量化、高效地測評考試,另外根據輸出系統的信息反饋,還可為提高試卷科學性指明路徑,以使測度系統形成良性循環,一改以往對考試評價的定性角度慣性。但目前在教育教學及科研領域,人們采用科學的測評方法測度試卷科學性的嘗試并不多,尤其是一些規模較小的考試,這不利于教學質量和教師素質的提高,亦不利于考試學研究者開啟新的研究視域。應該加強對試卷科學化測度的研究及實踐,使考試這一重要的教學環節日益走上科學化和規范化的軌道。

主站蜘蛛池模板: 午夜免费小视频| 三级视频中文字幕| 欧美在线视频不卡第一页| 五月综合色婷婷| 久久伊人操| 伊人久久久大香线蕉综合直播| 在线观看国产黄色| 欧美劲爆第一页| 在线观看亚洲天堂| 国产微拍一区二区三区四区| 欧美啪啪网| 伊人久久精品无码麻豆精品| 九色国产在线| 亚洲天堂777| 色播五月婷婷| 精品国产黑色丝袜高跟鞋| 毛片手机在线看| 欧美一区福利| 欧美福利在线播放| 免费国产黄线在线观看| 亚洲人成电影在线播放| 国产一级裸网站| 最新痴汉在线无码AV| 日本高清免费不卡视频| 91毛片网| 中文字幕精品一区二区三区视频 | 国内精品一区二区在线观看| 九色综合伊人久久富二代| 国产青青操| 亚洲av色吊丝无码| 亚洲无码精彩视频在线观看| 92精品国产自产在线观看| 精品乱码久久久久久久| 亚洲成人播放| 国产在线观看一区二区三区| 特级aaaaaaaaa毛片免费视频| 国产精品欧美在线观看| 99尹人香蕉国产免费天天拍| 久久成人18免费| 亚洲国产精品日韩欧美一区| 国产精品久久久久久久久久98| 制服无码网站| 视频国产精品丝袜第一页| 精品剧情v国产在线观看| 国产 日韩 欧美 第二页| 日本三级黄在线观看| h视频在线观看网站| 欧洲在线免费视频| 久久亚洲中文字幕精品一区| 国产91无码福利在线| 亚洲国产中文精品va在线播放| www.国产福利| 永久免费精品视频| 54pao国产成人免费视频| 日本人妻一区二区三区不卡影院| 成人亚洲视频| 免费一极毛片| 国产精品视频观看裸模| 日韩精品免费一线在线观看| 国产成年女人特黄特色大片免费| 911亚洲精品| 极品性荡少妇一区二区色欲| 91av成人日本不卡三区| 欧美日韩国产系列在线观看| 欧美成人精品高清在线下载| 中文字幕亚洲精品2页| 99精品视频九九精品| 青青热久麻豆精品视频在线观看| 日韩国产黄色网站| 国产麻豆精品久久一二三| 狠狠亚洲婷婷综合色香| 精品午夜国产福利观看| 无码AV动漫| 欧美中文字幕一区| 综合色88| 国产精品无码制服丝袜| 91福利免费视频| 亚洲伊人天堂| 中国成人在线视频| 亚洲国产成熟视频在线多多| www.亚洲天堂| 国产SUV精品一区二区|