馮 瑞
北京創(chuàng)博恒達(dá)科技有限公司 北京 100078
劍橋通用五級證書考試(劍橋大學(xué)考試委員會稱之為主題系列考試,Main Suite Examinations,縮寫為MSE)是英國劍橋大學(xué)考試委員會根據(jù)歐洲委員會制定的歐洲語言共同參考框架(CEFR)設(shè)計的英語作為外語的五級系列考試。該系列考試是一種對考生的英語聽、說、讀、寫能力以及詞匯和語法知識進(jìn)行考察的水平考試。成績及格者會獲得由劍橋大學(xué)考試委員會頒發(fā)的成績合格證書。
劍橋通用英語第一級(Cambridge English:Key),又稱KET(Key English Test),是一項基礎(chǔ)英語水平考試,處于歐洲語言共同參考框架的A2級別??荚噷ο罂梢允侨魏螄驼Z言背景的考生。通過該考試,表明考生能夠在簡單的日常情景中使用英語進(jìn)行溝通,在英語學(xué)習(xí)方面已經(jīng)具備良好的開端。
KETfor schools于2008年開始施考,兩個考試試題任務(wù)類型和難度是一樣的,不同于KET標(biāo)準(zhǔn)版,它的內(nèi)容設(shè)計和話題是針對11-14歲的青少年,而標(biāo)準(zhǔn)版主要是針對成人,離開學(xué)?;蛘吖ぷ鞯娜?。本文只對KET標(biāo)準(zhǔn)版的閱讀測試進(jìn)行評價。
對于KET考試閱讀部分的研究在國內(nèi)外是比較有限的。由劍橋大學(xué)外語考試部和劍橋大學(xué)出版社聯(lián)合推出的語言測試研究系列(Studies in Language Testing,SiLT)中的Examining Reading(Khalifa&Weir 2009)中有對劍橋英語系類考試的閱讀進(jìn)行的詳細(xì)研究。研究以Weir(2005)“基于證據(jù)的效度驗證框架”為基礎(chǔ),從考生特征、認(rèn)知效度、環(huán)境效度、評分效度、后果效度和效標(biāo)關(guān)聯(lián)效度六個方面進(jìn)行了對比分析。Khalif(2005)使用Weir的效度框架探究了考生特征在MSE的閱讀考試中是否被加以考慮;Khalifa&Schimitt(2010)使用專家評審、實踐考察和軟件分析方法調(diào)查了MSE各個級別考試中閱讀試卷的詞匯發(fā)展。
1.閱讀測試的試題構(gòu)成以及構(gòu)念
閱讀測試共分為五個部分,每個部分有一到多個閱讀文本,以及相應(yīng)的一組問題。文本有短的通知,也有長篇的連貫的文章。從單個的詞到篇章,覆蓋了一系列的閱讀技能考察。
(1)連線匹配題(matching)。 一共5個問題,對應(yīng)8個答案。8個答案均為現(xiàn)實生活中會見到的通知,考察的是對短文的理解。
(2)多選題(multiple choice)。一共5個問題,每題三個選項中選一個。這五個問題是針對一個話題的,選擇的是正確的詞,考察對詞匯的理解。
(3)多選題(multiple choice)和匹配題(matching)。5個多選題,它們之間相互獨立,要求考生針對日常交流對話,從三個選項中選出一個正確的回應(yīng)。五個匹配題是一個完整的對話語篇,從8個回答中匹配正確的回應(yīng),考察對日常對話的理解。
(4)判斷正誤題(right/wrong/doesn’t say questions)。7個問題,一個長篇文章,或三個短篇文章,要求考生理解較長文章主要意思和細(xì)節(jié)信息,判斷正誤。
(5)多選完形填空題(multiple choice cloze)。8個問題,根據(jù)文章,從3個選項中選擇正確的詞。測試對語法的理解,例如動詞的形式,限定詞,代詞等,以及對短語,從句,句子或者篇章結(jié)構(gòu)關(guān)系的理解。
2.KET 2006年閱讀樣題及評價
(1)測試的可靠性(Reliability)是指考試的結(jié)果是否是穩(wěn)定的,一致的??赡苡绊憸y試可靠性的因素有測試環(huán)境、試題說明、評分標(biāo)準(zhǔn)等。首先,從圖1我們可以看出該閱讀測試對考試的流程,測試任務(wù)的數(shù)量以及分?jǐn)?shù)都有了明確的說明。所以不論是對有沒有經(jīng)過考試訓(xùn)練的考試來說,都不會因為不了解考試規(guī)定或者任務(wù)形式的改變而導(dǎo)致結(jié)果不穩(wěn)定。其次,閱讀的五個部分均為客觀選擇題,考試的得分不受閱卷人主觀判斷的影響,所以結(jié)果是穩(wěn)定的。

圖1 KET考試閱讀試題說明

圖2 任務(wù)1
(2)測試的構(gòu)念效度(Construct Validity)是指測試結(jié)果多大程度上反映考生的語言能力。這一點可以從兩個方面進(jìn)行評價。一是試題任務(wù)與測試構(gòu)念的相關(guān)程度,二是是否存在由于任務(wù)特點出現(xiàn)的偏頗。在KET的考生手冊(handbook)里,對此階段考生閱讀能力的要求是能夠理解簡單的書寫信息,如標(biāo)識和報紙。這樣的構(gòu)念定義是否符合測試的目的呢?測試說明中是這樣表述的:“通過測試的考生可以達(dá)到用英文在簡單的情境中溝通”。這樣看來,閱讀部分是可以達(dá)到閱讀簡單情境中的語言。同時閱讀部分的每個任務(wù)都被明確的標(biāo)出測試的構(gòu)念。任務(wù)1(圖2)采用匹配的任務(wù)測試考生對不同種類的短文本的理解。任務(wù)2(圖3)采用選擇的任務(wù)考察對詞匯的理解。任務(wù)3-1(圖4)、任務(wù)3-2(圖5)考察對日常會話的理解。任務(wù)4是理解較長文章的主旨大意和細(xì)節(jié)信息。任務(wù)5(圖6)是對詞、句以及篇章結(jié)構(gòu)的理解。所以這五部分采取了不同的選擇題(selected response)的形式,考察了從詞到篇章書寫信息的理解。和前面的構(gòu)念描述是一致的。值得一提的是,從詞到短語到句的理解放到了不同的語境中,例如通知、對話、篇章中。與語言實際使用情景相匹配。并且這些情景都是日常話題,沒有涉及專業(yè)知識,所以作答不會因為考生的個人知識而造成測試成績的偏頗。

圖3 任務(wù)2

圖4 任務(wù)3-1
(3)真實性(Authenticity)是指現(xiàn)實生活中語言的使用任務(wù)與測試任務(wù)的相關(guān)程度,測試時的任務(wù)越接近實際語言運(yùn)用,就越真實。在這五個部分中,任務(wù)1(圖2),任務(wù)3-1(圖4)和 任務(wù)5(圖6)都是對實際生活場景任務(wù)的改編,有很強(qiáng)的真實性。實際生活中,我們經(jīng)常會看到通知或者廣告,進(jìn)而安排自己的活動,在測試中被改編成任務(wù)1與活動相匹配;在用英文交流時,會根據(jù)情景進(jìn)行回應(yīng),可能會涉及交際策略或者禮貌用語,在測試中被改變?yōu)槿蝿?wù)3-1選擇合適的答句;不論在閱讀報紙還是教室的閱讀活動中,都要求理解篇章的主旨和細(xì)節(jié),獲取信息,任務(wù)5就是語言使用時的縮影。剩下的部分雖然提供了生活中的話題,但是任務(wù)特點和實際語言使用還是有很大差別。但是可以理解的是,在這個水平階段的測試中,設(shè)計者必須在考察能力和真實性中尋找平衡。
(4)互動性(Interactiveness)是指在多大程度上語言使用模型的主要方面參與到測試中,模型包括語言知識,元認(rèn)知策略,話題知識,個人的性格及情感。在這套閱讀試題中,任務(wù)2和5雖然都涉及話題,但是由于都是選擇題型并且考核的多是詞匯和語法,所以沒有體現(xiàn)出話題知識對考試結(jié)果的影響,個人的性格和情感狀態(tài)的參與也沒有體現(xiàn)出來。但語言知識的互動是非常豐富的,有閱讀和語法、詞匯的結(jié)合。同時語言功能的考核也在任務(wù)3-1以及3-2中有很好的體現(xiàn),主要是交際語言的使用。所以在互動性方面,本文作者認(rèn)為還有可以改進(jìn)的空間。
(5)影響(Impact)是指測試對各類考生,教育體系甚至是社會產(chǎn)生的可能的影響。一,對考生來說一方面會根據(jù)閱讀測試的要求進(jìn)行詞、短語、句子和短篇閱讀的訓(xùn)練,另一方面,很有可能會為了考試成績而學(xué)習(xí),比如課堂閱讀時,對由閱讀產(chǎn)生的寫的任務(wù)不認(rèn)真對待,因為閱讀測試中沒有加入寫的部分。二,測試的結(jié)果中會分別標(biāo)出聽說讀寫四個部分的分?jǐn)?shù),并對應(yīng)CEFR標(biāo)準(zhǔn),所以成績報告的形式能夠讓考試更清晰的了解此階段的優(yōu)勢和不足,為接下來的學(xué)習(xí)制定相應(yīng)的策略。三,KET考試作為一個初級的語言測試,一般不會把它的成績作為某種決策的決定性因素,一般會考察考生其他方面的表現(xiàn)。所以它所產(chǎn)生的決策性的影響沒有那么大。四,對教師來說,閱讀測試的構(gòu)念會讓他們對此階段學(xué)生達(dá)到的目標(biāo)有個清晰的認(rèn)識,以此為根據(jù),會幫助教師設(shè)計教學(xué)活動。同時也有可能教師以考試為目標(biāo),只進(jìn)行這五部分的相關(guān)訓(xùn)練??荚嚱Y(jié)果對學(xué)生來說是學(xué)習(xí)成果的檢驗,對教師來說也是教學(xué)成果的檢驗,所以分項的成績報告讓老師對教學(xué)方面存在的問題也有了清晰的認(rèn)識。五,KET考試對我國的中小學(xué)英語閱讀方面的教學(xué)提供一個思路,有一定的指導(dǎo)作用。比如在教學(xué)材料的選擇上,以及對學(xué)生的能力要求上。

圖5 任務(wù)3-2

圖6 任務(wù)5
(6)可操作性(Practicality)是指研發(fā)和實施測試時需要投入的資源是否是在合理的范圍內(nèi)。這一點主要從整個測試的角度來解釋。KET測試時對考生來說,時長是合適的,報名費合理,同時對設(shè)備和考場的要求也相對簡單,能夠保證大規(guī)模的考生有機(jī)會參加。
綜上所述,KET的閱讀考試從可靠性,構(gòu)念效度,真實性以及互動性方面從測試研發(fā)的角度來看都做的非常好,筆者認(rèn)為在互動性方面還有提高的空間,比如讀和寫的結(jié)合,增加考生話題和情感的互動。