效度作為測試學(xué)領(lǐng)域的專門術(shù)語,指一項測試能測出預(yù)定要測量內(nèi)容的程度,或能夠引起預(yù)報作用的程度。測試的效度可以用多個不同的統(tǒng)計方法來估計。語言測試的效度是指測試作為測量手段,測量出想測量的語言學(xué)習(xí)者語言能力的程度和水平。Bachman將語言測試的效度分為以下幾種類型: 1.內(nèi)容效度(content validity),其高低根據(jù)測試所包含的具體內(nèi)容來確定。設(shè)計測試的內(nèi)容之前必須首先思考測量的目的,然后確定具體的測試內(nèi)容。2.結(jié)構(gòu)效度(construct validity),其高低根據(jù)測試項目及其所反映的理論關(guān)系決定。比如,交際能力測試和交際能力理論的關(guān)系越大,測試的結(jié)構(gòu)效度就越高。3.標(biāo)準(zhǔn)關(guān)聯(lián)效度(criterion-related validity),其高低源于某一測試在反映學(xué)習(xí)者水平方面與其他外在評估標(biāo)準(zhǔn)的一致性程度上。例如,學(xué)習(xí)者在某項測試的表現(xiàn)與其在有關(guān)這項語言能力評估中表現(xiàn)的水平應(yīng)保持一致。4.預(yù)測效度(predictive validity),其高低根據(jù)測試能否準(zhǔn)確地預(yù)測學(xué)習(xí)者將來的學(xué)習(xí)成績而定。某一單項語言測試應(yīng)該能夠預(yù)測學(xué)習(xí)者在這一語言能力方面的水平。5.卷面效度(face validity),指測試中根據(jù)觀察者的主觀判斷,測試達(dá)到預(yù)先設(shè)想的衡量知識或能力的程度。對語言測試的效度進行類型劃分,將效度這樣一個抽象的專業(yè)術(shù)語具體化,便于在語言測試的設(shè)計及評價過程中更多地追求具體的有關(guān)效度的指標(biāo),便于在語言測試的研究領(lǐng)域?qū)Σ煌愋偷男Ф日归_探索和研究,便于通過實踐操作提高語言測試的效度。本文擬以湖北省2007年高考英語中的閱讀理解試題為例,以對其進行統(tǒng)計的數(shù)據(jù)為基礎(chǔ),從卷面效度的視角,分析其測試效度存在的問題,并提出改進意見。
一、2007年湖北高考英語卷閱讀理解試題相關(guān)數(shù)據(jù)統(tǒng)計
(一)閱讀理解題選材分析。

(二)閱讀理解題考點覆蓋情況。

二、2007年湖北高考英語卷閱讀理解試題卷面效度存在的問題
(一)文段過長。
2007年湖北高考英語閱讀理解試題的篇幅過長,有一篇竟然接近600個單詞,整個大題的英文詞數(shù)達(dá)到2551個,以2007年高考英語考試大綱中對閱讀理解規(guī)定的參考時間35分鐘來計算,要求考生的閱讀速度接近73w/pm,相對于全國其它自主命題的省份,這個速度要求比較高。
(二)體裁、題材重復(fù)。
C、D的題材都是有關(guān)心理的,C篇是有關(guān)兒童害怕心理的文章,D篇是有關(guān)影響人們幸福因素的文章,這兩篇相同題材的文章,會使考生感到枯燥。再者,高考考生對心理方面的知識接觸不是很多,接連考了兩篇有關(guān)心理的文章,其效度肯定會降低。B、C、D三篇在體裁上都是說明文,所以題材和體裁上都出現(xiàn)了重復(fù)。
(三)表層理解的考題有余,深層理解的考題不足。
考查細(xì)節(jié)理解的題目太多,考查作者的意圖、態(tài)度等深層理解能力的題目較少。從表2中我們不難看出,考查對文章細(xì)節(jié)的理解的題目達(dá)到11個之多。2007年高考英語考試大綱對閱讀的要求是這樣描述的:“……閱讀,要求考生讀懂熟悉的有關(guān)日常生活話題的簡短文字材料,例如公告、說明、廣告及書、報、雜志中關(guān)于一般性話題的簡短文章。考生應(yīng)能:(1)理解主旨要義;(2)理解文中具體信息;(3)根據(jù)上下文推斷生詞的詞義;(4)作出簡單判斷和推理;(5)理解文章的基本結(jié)構(gòu);(6)理解作者的意圖和態(tài)度。”可見,2007年湖北高考英語試題閱讀理解并未涉及對文章結(jié)構(gòu)的理解,而且出題者對考生的六項閱讀理解能力的要求也沒有分出孰輕孰重。
(四)閱讀材料呈現(xiàn)的方式、閱讀理解題目的題型單一。
閱讀材料單純以文字來描述、呈現(xiàn),缺乏圖畫、圖表等呈現(xiàn)方式。閱讀題型全都是四選一的多項選擇題,沒有簡答、綜述等效度比較高的題型,而且與生活聯(lián)系不太緊,對于公告、說明、廣告等與生活聯(lián)系緊密的材料均為涉及,實屬遺憾。
三、對提高卷面效度的思考
通過分析2007年湖北省高考英語閱讀理解題可知其命題存在一些問題,其主要原因在于:1.質(zhì)量專業(yè)標(biāo)準(zhǔn)與監(jiān)督機制沒有建立。在制定和實施分省命題政策的同時,沒有建立起分省命題的質(zhì)量專業(yè)標(biāo)準(zhǔn),也沒有形成有效的試題質(zhì)量監(jiān)督機制。2.達(dá)到專業(yè)水準(zhǔn)的試題命題者數(shù)量不足。分省命題政策總體上比較倉促,各省沒有足夠時間尋找或培養(yǎng)出足夠數(shù)量的有專業(yè)水準(zhǔn)的試題命題人,一些省市往往是倉促形成命題小組,有些大學(xué)英語教授本人并沒有接受過試題命制的專業(yè)訓(xùn)練,有些大學(xué)教授對新課程理念不是很熟悉。這樣的試題命題人往往只能憑借自己的經(jīng)驗來命題,難以依據(jù)科學(xué)的語言測試?yán)碚撁}。據(jù)此,筆者從宏觀和微觀兩個層面對提高英語閱讀理解測試效度提出以下建議:
(一)盡快建立試題質(zhì)量專業(yè)標(biāo)準(zhǔn)和監(jiān)督機制。
在建立分省命題制度的同時,應(yīng)該建立各科試題質(zhì)量專業(yè)標(biāo)準(zhǔn),建立起試題質(zhì)量的監(jiān)督機制(即使是事后監(jiān)督,也可以起到一定的作用),保證各省市命制的試題達(dá)到幾乎同樣的水平,從而保證試題質(zhì)量,確保其效度。
(二)廣泛選拔和培養(yǎng)有足夠?qū)I(yè)水準(zhǔn)的試題命題者。
有足夠?qū)I(yè)水準(zhǔn)的試題命題者是確保試題質(zhì)量、提高試題測試效度的根本。現(xiàn)在的高等院校中有一些測試專家,或者接受過語言測試訓(xùn)練的專業(yè)人士,應(yīng)該廣泛選拔命題人員。若人數(shù)仍然不足,則應(yīng)通過短期培訓(xùn),盡快培養(yǎng)有足夠?qū)I(yè)水準(zhǔn)的試題命題者,或者建立3—5人的全國審題專家委員會,對分省命題的高考英語試題進行最后的審定,確保試題質(zhì)量。
(三)精心構(gòu)思高考閱讀理解測試的目的。
為了保證高考閱讀理解測試的效度,針對高考考生,高考命題者要明確高考閱讀理解應(yīng)測量的閱讀能力的層次。具體來講,閱讀測試的目的分為基本的對文章大意和主要信息的理解與較高層次的對寫作態(tài)度、隱含意義、閱讀策略等的駕馭。
(四)合理設(shè)計高考閱讀測試的內(nèi)容。
為了保證閱讀測試的效度,根據(jù)具體的測試目的,高考命題者應(yīng)充分考慮閱讀測試的文章來源、文章體裁、文章題材、篇幅長短、題型選擇、題目設(shè)計等每一個要素,從而確保與具體測試目標(biāo)的一致性,確保對閱讀能力測量的有效性。
(五)深入比較閱讀測試題的優(yōu)劣。
為了保證閱讀測試的效度,高考命題者在高考測試的進行、評分等各項工作結(jié)束后,應(yīng)將試題與同層次其它閱讀試題進行比較。通過這種分析,一方面可以檢測試題和其它閱讀試題所測量的學(xué)習(xí)者閱讀能力是否保持一致,另一方面也可以查缺補漏、取長補短。
(六)科學(xué)吸收閱讀測試的反饋。
為了保證閱讀測試的表面效度,高考命題者在測試結(jié)束后,應(yīng)了解考生的答題情況以及同行對這次測試的評價。根據(jù)反饋的信息,高考命題者能夠及時地了解到測試在哪些方面沒有達(dá)到對考生閱讀能力測量的目標(biāo),在哪些方面與對考生閱讀能力的要求有偏離等重要問題。通過這種從測試的設(shè)計到反饋各個階段的細(xì)致工作,可以提高閱讀測試效度的保險系數(shù),提高閱讀測試的設(shè)計水平,使閱讀測試更好地、真實地反映考生的閱讀能力。
總之,我們必須在分省命題政策下,盡快提高分省命題的試題質(zhì)量,確保為高等學(xué)校選拔合格新生、引導(dǎo)基礎(chǔ)教育健康發(fā)展這兩個高考基本目的的實現(xiàn)。
參考文獻:
[1]Bachman,L.F. Palmer,A.Language Testing in Practice[M].Oxford:Oxford University Press,1996.
[2]魯子問.國家·考試·人[M].武漢:湖北人民出版社,2006.
[3]魯子問,王篤勤.中小學(xué)英語評價測試?yán)碚撆c實踐[M].北京:中國電力出版社,2005.
[4]高蘭生.英語測試與試題命制[M].北京:人民教育出版社,2002.
[5]湖北教育考試院.2007年普通高等學(xué)校招生全國統(tǒng)一考試(湖北卷)——英語試卷.