

摘?要:隨著教育水平的發(fā)展以及國(guó)家對(duì)教育的重視,考試與評(píng)價(jià)也逐漸在教育領(lǐng)域發(fā)揮著越來(lái)越重要的作用,考試不再是簡(jiǎn)單地給分?jǐn)?shù)、排名次,而是為甄別、診斷學(xué)生的能力提供可靠有效的數(shù)據(jù),并以可靠的數(shù)據(jù)為決策依據(jù),進(jìn)而實(shí)現(xiàn)因材施教和因人施教,真正促進(jìn)學(xué)生多元、個(gè)性、全面綜合發(fā)展,幫助學(xué)生在學(xué)科學(xué)習(xí)、基礎(chǔ)成長(zhǎng)中選擇適合自己的學(xué)習(xí)成長(zhǎng)方式方法。
關(guān)鍵詞:因材施教;考試;評(píng)價(jià);科學(xué)命題;課程標(biāo)準(zhǔn)
考試是教師檢驗(yàn)學(xué)生學(xué)習(xí)效果的最直接最有效的工具。近些年隨著國(guó)家對(duì)教育的重視,考試與評(píng)價(jià)應(yīng)運(yùn)而生并得到飛快的發(fā)展。有了考試與評(píng)價(jià)的改革,考試不再是簡(jiǎn)單的給分?jǐn)?shù)、排名次,而是真正能夠以可靠的數(shù)據(jù)為決策依據(jù),實(shí)現(xiàn)因材施教和因人施教,真正促進(jìn)學(xué)生多元、個(gè)性、全面綜合發(fā)展。如何更有效地利用考試?一份科學(xué)合理能夠達(dá)成預(yù)定目的的試卷必不可少。
那么如何科學(xué)命題?從而達(dá)到幫助學(xué)生在學(xué)科學(xué)習(xí),基礎(chǔ)成長(zhǎng)的過(guò)程中找到適合自己的學(xué)習(xí)成長(zhǎng)方法,真正地實(shí)現(xiàn)“量身定制,因材施教”?
首先,命制一份科學(xué)有效的試卷需要有相關(guān)原則性的約束:嚴(yán)格按照《課程標(biāo)準(zhǔn)》來(lái)確定考試的知識(shí)范疇,其次嚴(yán)格按照考試的目的要求來(lái)確定考試內(nèi)容和考察重點(diǎn),同時(shí)要確保試題的信度,效度,難度,區(qū)分度都在符合要求的區(qū)間內(nèi)。那么如何把《課程標(biāo)準(zhǔn)》的要求在一份試卷中變成可以度量的可測(cè)標(biāo)準(zhǔn)?如何保證試卷的信效度,難度和區(qū)分度都在既定的考試要求范圍內(nèi)?
以下以某學(xué)校五年級(jí)的英語(yǔ)試題實(shí)例對(duì)以上幾個(gè)問(wèn)題進(jìn)行分析論證。
一、 試卷的效度論證
(一)試卷的知識(shí)結(jié)構(gòu)效度論證
根據(jù)最新版《小學(xué)英語(yǔ)課程標(biāo)》(以下簡(jiǎn)稱《課程標(biāo)準(zhǔn)》)可以將小學(xué)生英語(yǔ)學(xué)科教學(xué)內(nèi)容歸納出以下幾個(gè)關(guān)鍵詞:“語(yǔ)音”“詞匯”“語(yǔ)法”“功能”“話題”。由于《課程標(biāo)準(zhǔn)》對(duì)知識(shí)內(nèi)容的劃分比較概括,無(wú)法實(shí)現(xiàn)精細(xì)分析,我們可以借助語(yǔ)言學(xué)相關(guān)理論,按照語(yǔ)言構(gòu)成要素,對(duì)《課程標(biāo)準(zhǔn)》中“語(yǔ)音”“詞匯”“語(yǔ)法”“功能”“話題”進(jìn)行細(xì)分界定。同時(shí)結(jié)合語(yǔ)言構(gòu)成要素可以把小學(xué)階段英語(yǔ)知識(shí)細(xì)分為以下知識(shí)指標(biāo):語(yǔ)音(讀)、語(yǔ)音(聽(tīng))詞匯、詞法、句法、句子、對(duì)話、文章。細(xì)分后根據(jù)考試目的在施測(cè)試卷中分別命制各個(gè)知識(shí)指標(biāo)的試題,制定出更精細(xì)化的評(píng)分標(biāo)準(zhǔn),細(xì)分到每一個(gè)語(yǔ)音,詞匯或者句法等指標(biāo)的考查點(diǎn)多少分的形式。根據(jù)新的評(píng)分結(jié)果可以清楚地了解學(xué)生在哪些考查點(diǎn)有優(yōu)勢(shì),以及在哪些考查點(diǎn)有劣勢(shì)。這樣的考查結(jié)果,可以更進(jìn)一步對(duì)學(xué)生進(jìn)行分析診斷。因?yàn)槿〉猛瑯臃謹(jǐn)?shù)的兩個(gè)學(xué)生不一定在每個(gè)細(xì)分后的知識(shí)指標(biāo)得分一致。在獲得客觀反映學(xué)生學(xué)習(xí)狀況及其問(wèn)題或困難的診斷結(jié)果后,可以幫助學(xué)生認(rèn)識(shí)自身學(xué)習(xí)狀況及其問(wèn)題或困難成因;教師或者學(xué)校就可以對(duì)學(xué)生進(jìn)行有針對(duì)性的指導(dǎo),促進(jìn)學(xué)生進(jìn)步,指導(dǎo)教師教學(xué);學(xué)校可以了解學(xué)情,也可以為分層分類教學(xué)提供有效幫助。
根據(jù)《課程標(biāo)準(zhǔn)》,本試卷的知識(shí)指標(biāo)主要包括語(yǔ)音(讀)、詞匯、詞法、句法、句子、對(duì)話、文章,各知識(shí)指標(biāo)所占題量和分值比重見(jiàn)圖1、圖2。
考查詞法、文章的題目無(wú)論是題量還是分值,在整份試卷中所占比重都很大,學(xué)生的成績(jī)受詞法、文章模塊上的表現(xiàn)影響較大。
《課程標(biāo)準(zhǔn)》中對(duì)于小學(xué)生“語(yǔ)言知識(shí)”部分的要求是基礎(chǔ)教育階段學(xué)生應(yīng)該學(xué)習(xí)和掌握的英語(yǔ)語(yǔ)言基礎(chǔ)知識(shí)包括語(yǔ)音、詞匯、語(yǔ)法、功能和話題等五方面的內(nèi)容。其中小學(xué)畢業(yè)時(shí)學(xué)生要達(dá)到二級(jí)水平。其中“功能”是指了解問(wèn)候、告別、感謝、致歉、介紹、請(qǐng)求等交際功能的基本表達(dá)形式?!霸掝}”是指能理解和表達(dá)有關(guān)相關(guān)話題的簡(jiǎn)單信息。試卷中并未涉及“話題”的有關(guān)“表達(dá)”的知識(shí)考查項(xiàng),說(shuō)明試卷的知識(shí)結(jié)構(gòu)效度是有缺失的。
(二)試卷的能力結(jié)構(gòu)效度論證
20世紀(jì)50年代布魯姆的教育目標(biāo)認(rèn)知領(lǐng)域的分類公布之后,該理論在世界范圍內(nèi)引起了巨大的反響。教育研究人員科研人員也競(jìng)相對(duì)其進(jìn)行了廣泛深刻的論證。布魯姆的教育目標(biāo)分類學(xué)中認(rèn)知向度定義為學(xué)生在能力層面的可測(cè)指標(biāo)得到了有效論證。因此,我們可以把布魯姆的教育目標(biāo)分類學(xué)結(jié)合課程標(biāo)準(zhǔn)中語(yǔ)言技能中聽(tīng)、說(shuō)、讀、寫的有關(guān)要求,將學(xué)生應(yīng)掌握的能力轉(zhuǎn)化為可操作的定義,從而確定能力的考查指標(biāo)。我們可以把能力層級(jí)由簡(jiǎn)到難依次排列:記憶,理解,信息提取,綜合概括,推理,應(yīng)用,分析,評(píng)鑒,創(chuàng)造(表達(dá))。
從記憶到信息提取,屬于較低的能力水平;從應(yīng)用到創(chuàng)造,屬于較高的能力水平。隨后根據(jù)考試結(jié)果同樣可以得到更清晰的數(shù)據(jù),也就可以清楚地了解學(xué)生在能力指標(biāo)上哪一個(gè)能力考察點(diǎn)有優(yōu)勢(shì)或者有劣勢(shì),更進(jìn)一步對(duì)其進(jìn)行分析診斷。
就本份試卷所考查的低級(jí)能力指標(biāo)全部覆蓋,且突出對(duì)記憶指標(biāo)的考查。高級(jí)能力指標(biāo)只考查了應(yīng)用,且分值比明顯高于題量比,對(duì)“應(yīng)用”要求較高。如圖3、圖4所示。
低級(jí)能力,主要考查學(xué)生基礎(chǔ)知識(shí)的掌握情況、從文章提取基本信息的能力,是評(píng)定學(xué)生學(xué)業(yè)水平的主要技能項(xiàng)。
高級(jí)能力是考查個(gè)體英語(yǔ)語(yǔ)言能力的重要表現(xiàn),對(duì)初高中的學(xué)習(xí)至關(guān)重要,因而對(duì)這些能力指標(biāo)的考查在一定程度上能夠預(yù)測(cè)個(gè)體將來(lái)英語(yǔ)學(xué)習(xí)能力和發(fā)展的潛力。
總體而言,本套試卷考查能力層級(jí)的分值比重為:低級(jí)能力85%,高級(jí)能力15%,試卷中低級(jí)能力的考查比重明顯高于高級(jí)技能,高級(jí)能力只考察了“應(yīng)用”,明顯有缺失。說(shuō)明整套試卷能力項(xiàng)指標(biāo)結(jié)構(gòu)的均衡性較差,結(jié)構(gòu)效度不理想。
二、 試卷的信度論證
試卷的信度是指試卷測(cè)試分?jǐn)?shù)所具有的一致性或穩(wěn)定性的程度,這里的一致性指的是同一測(cè)試項(xiàng)目測(cè)試結(jié)果的一致程度。較高的一致性意味著同一個(gè)群體接受同一份試卷測(cè)試結(jié)果顯示強(qiáng)烈的正相關(guān);這里的穩(wěn)定性指的是在不同時(shí)間內(nèi),對(duì)考生重復(fù)測(cè)試所得結(jié)果的相關(guān)程度,如果一群學(xué)生在不同時(shí)間接受同樣的試卷測(cè)試時(shí),測(cè)試結(jié)果差異很小說(shuō)明試卷具有較高的穩(wěn)定性。
考試前試題信度的計(jì)算,考慮操作復(fù)雜性與可行性,一線教師出題一般可以選擇更容易操作的辦法,也就是試卷穩(wěn)定性高,那么它內(nèi)部考查同一知識(shí)層面或者能力層面的題目得分前后應(yīng)該高度相關(guān),因而保證較高信度的前提就是每一考查的知識(shí)層面或者能力層面都有充足的測(cè)試題目。經(jīng)過(guò)多次實(shí)際操作,考前命制試題參考內(nèi)部一致性信度這一概念是容易操作且可行的,本套試卷試題都達(dá)到較好的信度要求。
三、 試卷的難度論證
試題的難度需要根據(jù)考試目的或者評(píng)價(jià)的目的來(lái)具體確定,試卷的難度界定是通過(guò)學(xué)生該題上的正確比例來(lái)進(jìn)行,是屬于統(tǒng)計(jì)方法界定。而這需要在考試結(jié)束后確定,如何在考試之前確定試卷的難易程度,我們可以粗略地根據(jù)細(xì)分后的知識(shí)指標(biāo)對(duì)試題進(jìn)行解析:其中語(yǔ)音的分值比和題量比占5%左右;語(yǔ)法部分,也就是句法和詞法占據(jù)40%左右;詞匯占15%左右;“功能”即試題分析中的“對(duì)話”占15%左右,試題分析中的“句子”涉及句意的理解以及句子結(jié)構(gòu)的分析,屬于較難的知識(shí)指標(biāo),在試卷中只占了5%左右;試題分析中的“文章”占20%左右,而文章也是以詞匯和語(yǔ)法為基礎(chǔ)的。以上說(shuō)明試卷以考查基礎(chǔ)知識(shí)為主,因此可以得出本套試卷難度設(shè)置中等偏簡(jiǎn)單,在難度預(yù)設(shè)上符合形成性評(píng)價(jià)的要求,基礎(chǔ)知識(shí)掌握牢固的學(xué)生得高分的可能性較大。
四、 試卷的區(qū)分度論證
考前要保證較好的區(qū)分度,可以根據(jù)布魯姆的教育目標(biāo)分類學(xué)進(jìn)行預(yù)測(cè),實(shí)測(cè)有效。布魯姆的教育目標(biāo)分類學(xué)中認(rèn)知?dú)v史向度是由簡(jiǎn)到難排列的。根據(jù)認(rèn)知?dú)v史向度水平從低到高的排列,兩端各取兩個(gè)指標(biāo),作為極難(應(yīng)用、信息提取)和極易題目(知識(shí)、理解)的代表。結(jié)果顯示極難、極易題目分值比重分別為64%、36%,極難題目所占比值較小,極易題目所占比值大。結(jié)合上面知識(shí)比重、效度和難度的分析結(jié)果,可以推測(cè)這份試題對(duì)中間段學(xué)生和低水平學(xué)生的區(qū)分度較好,對(duì)高水平學(xué)生的區(qū)分度較差。
綜上所述,命制科學(xué)試卷首先要在《課程標(biāo)準(zhǔn)》的規(guī)范下命題,確保各知識(shí)指標(biāo)都能考查到。其次要保證試卷的信效度難度區(qū)分度在考試要求的范圍內(nèi),根據(jù)考試或者評(píng)價(jià)要求不同對(duì)試題的信效度、難度、區(qū)分度進(jìn)行可控的微調(diào)。對(duì)考試結(jié)果數(shù)據(jù)進(jìn)行分析,為教師教學(xué)提供依據(jù),為學(xué)校管理提供依據(jù)。最終實(shí)現(xiàn)因材施教和因人施教,真正促進(jìn)學(xué)生多元、個(gè)性、全面綜合發(fā)展,幫助學(xué)生在學(xué)科學(xué)習(xí)、基礎(chǔ)成長(zhǎng)中選擇適合自己的學(xué)習(xí)成長(zhǎng)方式方法,最終達(dá)到教師有效教學(xué),學(xué)校有效管理的良性循環(huán)。
參考文獻(xiàn):
[1]黃濤.新版布魯姆教育目標(biāo)分類對(duì)外語(yǔ)教學(xué)與測(cè)試改革的啟示[J].西華師范大學(xué)學(xué)報(bào),2009.
[2]洛林·W·安德森.分類學(xué)視野下的學(xué)與教及其測(cè)評(píng)/布盧姆教育目標(biāo)分類學(xué)修訂版(完整版)[M].北京:外語(yǔ)教學(xué)與研究出版社,2009.
[3]劉寶權(quán),席仲恩.SPSS在英語(yǔ)試卷統(tǒng)計(jì)分析中的應(yīng)用[J].外語(yǔ)電化教學(xué),2004.
[4]宋小平,張敏.SPSS在醫(yī)學(xué)生物試卷的信度和效度分析中的應(yīng)用[J].生物學(xué)通報(bào),2008.
[5]義務(wù)教育英語(yǔ)課程標(biāo)準(zhǔn)[M].北京師范大學(xué)出版社,2011.
作者簡(jiǎn)介:谷云菲,江蘇省蘇州市,西交利物浦大學(xué)附屬學(xué)校。