999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

淺談考試“四度”的把握與控制

2011-12-29 00:00:00王岱君田華王金平邱玉剛
教學(xué)與管理(理論版) 2011年4期


  考試分析中最主要的指標(biāo)為考試“四度”,即難度、區(qū)分度、信度和效度。現(xiàn)就廣大教師普遍反映的如何分析這四個(gè)指標(biāo)以及如何通過這四個(gè)指標(biāo)進(jìn)行科學(xué)合理的命題進(jìn)行簡要闡述。
  一、難度
  試題的難度是評價(jià)試題質(zhì)量的重要指標(biāo),難度是指試題或試卷的難易程度,是評估試題或試卷質(zhì)量的主要指標(biāo)之一。難度系數(shù)是用正答率或平均得分率表示。從這個(gè)意義上來看,將其稱之為“易度”似乎更確切。近來有不少學(xué)者已將難度改為錯(cuò)答率或平均失分率,即難度系數(shù)越大,答錯(cuò)的人越多,答對的人越少,即難度越大。
  1.影響試題難度的幾個(gè)因素
  影響試題難度的因素有許多,以下是幾個(gè)主要的因素。
  (1)題目內(nèi)容要求的不同
  每門課程的各章節(jié)對學(xué)生的要求不同,一般分為掌握、熟悉和了解等。要求學(xué)生必須掌握的內(nèi)容,學(xué)生學(xué)得必然要好,則題目的答對率就高,反之,只要求學(xué)生了解的內(nèi)容,則答對率低。此外,常見的和直接從教材取材的題目,學(xué)生容易做,難度就小;反之難度就大。
  (2)題目信息量的多少
  如果題目的信息量太多,條理不清,會(huì)影響學(xué)生對題意的理解,使題目的難度增加。
  (3)題目結(jié)構(gòu)的繁簡程度
  題目的類型、知識的綜合程度和知識間聯(lián)系的復(fù)雜程度等,都會(huì)對題目的難度產(chǎn)生影響。比如選項(xiàng)多的題要比選項(xiàng)少的難度大,多項(xiàng)選擇題要比單項(xiàng)選擇題的難度大。
  (4)題目的變化程度
  題目的迷惑性、干擾性、題目設(shè)置的靈活程度等,都會(huì)對題目的難度產(chǎn)生影響。
  命題者在設(shè)定試題難度時(shí),應(yīng)考慮上述各方面的因素。從單個(gè)題目來說,可以出現(xiàn)難易的偏差,但試卷總難度系數(shù)應(yīng)控制在較好的程度。
  2.試卷難度水平的確定
  試卷難度水平的確定取決于考試的性質(zhì)和目的。就選拔性考試而言,應(yīng)該使試卷的難度系數(shù)接近錄取率。然而,各學(xué)校大多的考試都是各門課程的期末考試,當(dāng)然不同于選拔型考試,因此,設(shè)置試卷的難度時(shí)就應(yīng)遵循以下原則。
  第一,試卷中應(yīng)有一定數(shù)量的難度較低的題目,用于考查學(xué)生對最基本知識的掌握,這部分題目可以不必過多地考慮難度,但數(shù)量不應(yīng)太多,30%左右為宜。難度系數(shù)在0.8-0.7之間。
  第二,試卷中另有一部分題目,是中等水平的考生才會(huì)做的,屬于中等難度題,應(yīng)是要求掌握或熟悉的內(nèi)容,難度系數(shù)應(yīng)控制在0.7-0.4左右,題量應(yīng)占整個(gè)試卷的50%以上。
  第三,試卷中較難的題目,占整卷的10%左右,主要考察優(yōu)秀的學(xué)生,它的難度系數(shù)可控制在0.4-0.2之間。
  各種難度的題目的所占的比例,應(yīng)依據(jù)各門課程的考試大綱要求而定。
  二、區(qū)分度
  區(qū)分度是指試題或試卷對學(xué)生實(shí)際水平的區(qū)分程度或鑒別能力,用于判定試題能否把學(xué)習(xí)成績優(yōu)與劣的學(xué)生區(qū)分開來的指標(biāo)。測量理論對考試的區(qū)分度十分重視,稱之為判斷考試是否有效的指示器,并作為評價(jià)試題質(zhì)量、對試題進(jìn)行篩選的主要依據(jù)。最常用的是極端分組法。
  1.區(qū)分度的高低應(yīng)取決于不同的考試要求
  選拔性考試對試題的區(qū)分度要求較高,而學(xué)校課程考試主要是依照考試大綱要求編制試卷,因而,只要試題的內(nèi)容符合考試大綱的要求即可,不必要求試題有高區(qū)分度,甚至在要求學(xué)生必須掌握的內(nèi)容中出現(xiàn)難度值為零,區(qū)分度為零的試題也是允許的。但對于區(qū)分度小于零的情況我們必須進(jìn)行分析,如總成績較好的學(xué)生為何在某道題上的得分低于總成績差的學(xué)生,原因可能是此題難度過大,或是該題的答案存在錯(cuò)誤。
  2.區(qū)分度是試題對不同考生的知識能力水平的鑒別程度
  如果一個(gè)題目的測試結(jié)果使水平高的考生答對,而水平低的考生答錯(cuò),說明該題能夠?qū)⑺礁吆退降偷目忌鷧^(qū)分開來,則它的區(qū)分能力就很強(qiáng)。通過我們的考試分析認(rèn)為,區(qū)分度大于0.4的為優(yōu)秀題目,達(dá)到0.3以上的為良好題目,達(dá)到0.2以上可以接受,而低于0.2的題目則區(qū)分能力差。
  3.區(qū)分度與難度的聯(lián)系
  區(qū)分度與難度是兩個(gè)不同的概念,但是兩者之間存在著一定的聯(lián)系。一般來說,難度適中的題目往往有較高的區(qū)分度。通過我們的分析表明,難度系數(shù)在0.5的試題具有最好的區(qū)分度。
  三、信度
  信度是指測量結(jié)果的穩(wěn)定性和可靠性,即學(xué)生的考試成績與學(xué)生的真實(shí)水平相一致的程度。信度通常用一種相關(guān)系數(shù)來表示,相關(guān)系數(shù)越大,表明測量的可信程度越大,則信度則越高。當(dāng)系數(shù)為1時(shí),說明測試的可靠性達(dá)到最高程度;而系數(shù)是0時(shí),則測試的可靠性降到最低程度。在一般情況下,系數(shù)不會(huì)高到1,也不會(huì)降到0。對信度系數(shù)的要求因測試類別的不同而不同,通常對標(biāo)準(zhǔn)化測試的信度系數(shù)要求在0.9以上,而一般的考試信度系數(shù)以0.7-0.8為宜。在實(shí)際應(yīng)用中,信度主要有再測信度、等值復(fù)本信度、分半信度、評分者信度等。較常用的是克倫巴赫(Cronbach)的α-系數(shù)公式。
  1.決定試卷信度的幾個(gè)要素
  (1)試卷結(jié)構(gòu)和長度是否合理
  試題數(shù)量的多少,試題樣本選擇的正確與否,試卷能否覆蓋考查的內(nèi)容,各種題型搭配是否合理,能否做到重點(diǎn)突出,難易得當(dāng),直接影響考試信度。
  (2)試題答案是否正確可信
  客觀題的答案具有唯一性,可信程度高。主觀題由于受到一些不穩(wěn)定因素的影響,信度不及客觀題高。在設(shè)計(jì)標(biāo)準(zhǔn)答案時(shí),也要做到正確無誤。
  (3)閱卷者的知識水平及綜合素質(zhì)是否可靠
  諸如知識經(jīng)驗(yàn)、業(yè)務(wù)水平、責(zé)任心、職業(yè)道德、精力體力等。試卷評閱者的信度反映了評分能夠穩(wěn)定反映考生真實(shí)水平的程度。
  2.保證試卷信度的相應(yīng)措施
  (1)合理安排試卷的結(jié)構(gòu)
  根據(jù)考試大綱規(guī)定的考試范圍和要求,將考核內(nèi)容合理劃分,形成合理的試題結(jié)構(gòu)。
  (2)合理采用不同的題型
  包括選擇題(單選、多選)、填空題、名詞解釋、簡答題、論述題等,主觀題和客觀題的比例要恰當(dāng)。單選題的選項(xiàng)應(yīng)不少于四個(gè),而是非判斷題應(yīng)不用或盡量少用,因?yàn)槭懿聹y因素影響太大。
  (3)合理制定參考答案及評分標(biāo)準(zhǔn)及細(xì)則
  客觀題的答案不會(huì)受人為因素的影響,但要注意制定答案不要出現(xiàn)錯(cuò)誤,配分要合理。對主觀題要做出合理答題要點(diǎn)并相應(yīng)配分,盡可能使主觀題的答案客觀化、標(biāo)準(zhǔn)化,以減少評分者主觀因素的影響。
  (4)加強(qiáng)考試閱卷各環(huán)節(jié)的管理
  考試保密措施有效,嚴(yán)格考試紀(jì)律,防止舞弊。完善評分程序,對評卷人員要依照程序嚴(yán)格進(jìn)行挑選,評卷前要進(jìn)行集中培訓(xùn)。對一些較復(fù)雜的主觀題要先進(jìn)行試評,并通過討論來減少分歧。要采取集體流水作業(yè)評卷形式,盡量做到評分的準(zhǔn)確一致,并認(rèn)真進(jìn)行復(fù)核。
  四、效度
  效度是指試卷的有效性,是考試誤差或準(zhǔn)確度大小估計(jì)的一個(gè)統(tǒng)計(jì)學(xué)指標(biāo),也就是說,效度是衡量考試結(jié)果對考試目標(biāo)的實(shí)現(xiàn)程度,即試卷是否達(dá)到了考試的目的。最主要的為以下兩個(gè)方面。
  1.內(nèi)容效度
  指一套試題是否測試了應(yīng)該測試的內(nèi)容,也就是說所測試的內(nèi)容是否反映了測試的要求,即測試的代表性和覆蓋面的程度。檢驗(yàn)內(nèi)容效度就是檢驗(yàn)由概念到指標(biāo)的經(jīng)驗(yàn)推演是否符合邏輯,是否有效。試卷要具備較好的內(nèi)容效度,必須滿足兩個(gè)條件:①要有確定好的內(nèi)容范圍,并使全部題目都落在這一范圍之內(nèi)。②試卷題目應(yīng)是已界定的內(nèi)容范圍的代表性樣本,即題目能代表所測的內(nèi)容范圍的主要方面,且各部分題目所占比例恰當(dāng)。
  2.效標(biāo)關(guān)聯(lián)效度
  效標(biāo)關(guān)聯(lián)效度是指考試結(jié)果與效標(biāo)之間的相關(guān)程度。效標(biāo)是檢驗(yàn)考試效度的一個(gè)參照標(biāo)準(zhǔn),它可以是①另一種考試(同類的標(biāo)準(zhǔn)考試)成績,這份試卷的權(quán)威性必須很高,是專家公認(rèn)的效度高的試卷,能很好地反映該門課程的性質(zhì)和特點(diǎn)。以該份標(biāo)準(zhǔn)試卷為標(biāo)準(zhǔn)來檢查其它試卷的效度。但由于客觀上的許多原因,有效的效標(biāo)難以確定,因此,不少學(xué)者采用求平均區(qū)分度來代替試卷的效度。
  平時(shí)考試的效度一般能達(dá)到0.4以上,即可認(rèn)為實(shí)現(xiàn)了考試目標(biāo)。
  3.信度和效度的關(guān)系
  信度和效度是兩個(gè)相互關(guān)聯(lián)的重要標(biāo)準(zhǔn)。信度是對結(jié)果一致性和穩(wěn)定性的評價(jià)標(biāo)準(zhǔn)。效度是對結(jié)果正確性的評價(jià)標(biāo)準(zhǔn),把兩者的作用結(jié)合起來看,信度和效度是考試結(jié)果具有科學(xué)價(jià)值和意義的保證。
  (責(zé)任編輯任洪鉞)

主站蜘蛛池模板: 久久精品国产999大香线焦| 亚洲成在线观看| 亚洲国内精品自在自线官| 久久99精品久久久久纯品| 亚洲精品无码不卡在线播放| 不卡午夜视频| 幺女国产一级毛片| 亚洲天堂网在线观看视频| 91福利片| 日韩中文字幕亚洲无线码| 日本欧美一二三区色视频| 激情成人综合网| 三上悠亚在线精品二区| AV不卡在线永久免费观看| 欧洲成人免费视频| 国产在线无码av完整版在线观看| 黄片在线永久| 国产内射一区亚洲| 亚洲福利片无码最新在线播放 | 亚洲成人免费看| 国产精品视频公开费视频| a级毛片在线免费| 国产精品无码AV片在线观看播放| 国产精品男人的天堂| 无码免费的亚洲视频| 久久黄色小视频| 日日拍夜夜嗷嗷叫国产| 一区二区三区在线不卡免费| 国产精品播放| 国产91精选在线观看| 福利在线不卡| 婷婷六月在线| a级毛片一区二区免费视频| 日本不卡视频在线| 视频在线观看一区二区| 国产男人的天堂| 老色鬼欧美精品| 国产最新无码专区在线| 曰韩免费无码AV一区二区| 欧美亚洲第一页| 久久久国产精品无码专区| 国产91高跟丝袜| 亚洲综合片| 农村乱人伦一区二区| 中文无码毛片又爽又刺激| 亚洲黄色片免费看| 成人精品免费视频| 亚洲va欧美va国产综合下载| 亚洲床戏一区| 欧美专区在线观看| 日韩成人午夜| 玖玖免费视频在线观看| 99精品伊人久久久大香线蕉| 午夜免费视频网站| 亚洲无码视频图片| 五月激激激综合网色播免费| 日本精品αv中文字幕| 国产无码在线调教| 超碰91免费人妻| 91在线播放国产| 国产一区二区三区精品久久呦| 久99久热只有精品国产15| 国产色婷婷| 色吊丝av中文字幕| 一本综合久久| 2024av在线无码中文最新| 国内毛片视频| 日韩二区三区无| 亚洲国产系列| a色毛片免费视频| 亚洲黄色视频在线观看一区| 自慰网址在线观看| 国产永久在线观看| 天天摸天天操免费播放小视频| 国产三级成人| 91国内视频在线观看| 亚洲日韩精品伊甸| 综合色在线| 91麻豆久久久| 伊人久久大香线蕉影院| 国产精品久久久久无码网站| 亚洲成人免费在线|