喬淑霞
(重慶三峽學院外國語學院,重慶萬州 404100)
教育界把測試對教學和學習的影響稱為反撥效應(washback effect)。后來,這一概念被運用到應用語言學領域,特指語言測試,尤其是外語測試對相應的教學和學習產生的影響。盡管早在18世紀人們就已經關注到了測試的影響,但對這種影響進行大量而深入的研究卻是20世紀80年代以后。[1-7]Buck[8]曾這樣評論反撥效應,為了適應測試的要求,教師和學生會調整他們的課堂活動,尤其是當某個測試涉及到升學率或者學生的前途時,測試對課堂教學的反撥作用是非常大的,因此測試的反撥效應可能是有益的或有害的;Hughes[1]提出了反撥的基本運作模式,這個模式有三個因素組成:參與者、行為和過程;Alderson & Wall[2]率先對反撥效應進行了比較全面和深入的探討,提出了15個反撥效應假設,為這一領域的實證研究奠定了一定的基礎;Cheng[6]則對香港英語證書考試對教學的影響進行了研究。隨著研究的深入,人們越來越認識到反撥效應的復雜性。測試的巨大影響及反撥效應的復雜性使反撥效應研究變得尤為重要。測試的正面反撥效應是指測試對教學產生人們所期望的影響,而負面效應是“某一被認為‘質量差’的考試對教學產生的不利影響。”[2]因此測試的合理設計與實施對實現教學目標和提高教學質量有著重要作用,也就是發揮正面反撥效應。而目前大多數高校英語教師在設計英語測試時,“命題中存在著很大的盲目性”“大多數考試往往遵循著老模式……老師命題時常常是利用手頭現有的資料……”。[9]這樣的考試自然難以對教學產生良好的反撥作用。本文以反撥效應研究專家對提高正面反撥效應途徑的理論闡述為基礎,著重探討如何在設計英語測試時保證測試質量,從而提高正面反撥效應,進而使教學和測試形成良性的互動。
如前所述,測試的反撥效應可以是正面的,也可能是負面的。進行反撥效應研究的重要任務之一就是探索減少負面效應,擴大正面效應的途徑和因素。就如何擴大正面反撥效應,一些專家提出了自己的看法。
Hughes[1]提出要提高正面反撥效應應注意七個方面:第一,測試要以培養學生的能力為目的;第二,使用那些能檢驗出被試真正能力的測試,而不使用那些滿是選擇題的測試;第三,要使用豐富廣泛且不易預測的測驗材料,以防教師為了備考去押題;第四,使用尺度參照考試,而不使用標準參照考試;第五,成就測試要以教學大綱為基礎;第六,要保證測試的形式、內容和目的能夠被教師和學生理解;第七,測試的開發者在必要時向教師提供一些所需的幫助。不難看出,這七條建議中有五條與測試效度相關,因為測試效度的高低取決于測試的正面反撥效應的大小。換言之,提高測試效度與提高正面反撥效應是相互依存的關系。Brown[7]指出要提高測試的正面反撥效應,測試的參與者應對測試的設計、測試的內容、測試的施考及測試結果的解釋等方面給予充分考慮。Brown所說的這幾個方面,分別涉及測試的其他質量因子,如互動性、內容效度、可操作性。Bailey[4]認為提高測試質量就是提高正面反撥效應。
盡管以上專家對提高反撥效應途徑的觀點各有側重,但都認為判斷一個測試是否發揮了正面效應主要依賴考試質量。正如 Heaton[10](16)所說:“如果考試質量好,那么它就會對教學產生正面影響;如果考試質量差,那么它就會對教學產生負面影響。”而影響考試質量的因素主要有信度、內容效度、結構效度、真實性,因此,在設計英語測試時應對這幾個方面給予重視,從而最大限度地發揮測試的正面反撥效應。
從以上的論述可以看出,測試質量的高低關乎正面反撥效應的大小。因此,我們在進行英語測試設計時,應著力考慮以下幾個方面:
信度指的是考試結果的一致性,即同一組受試者在同樣的兩次考試中排名順序是一致的。如果考試結果不穩定,就不能真實地反饋受試者的能力。而潛在的影響信度的因素,Bachman & Palmer[3](139-140)認為,主要存在于測試的指導語、測試語言饋入性質、測試預期回答性質以及饋入與回答的關系等幾個方面。比如,某一受試者參加兩次同樣的考試,一個考試的指導語長,而另一個考試的指導語短,這就會導致該考生的考試表現不一樣,考試結果有變化。
內容效度指“一測量工具內容上的代表性或所選樣本的充分性。”[11](38)簡言之,考試內容應參照教學內容和大綱對考生的知識和能力進行抽樣。“考生所掌握的語言知識和具備的能力是多方面的,不可能通過一次測試全面考察,而只能抽取一定量的樣本,從中推斷考生的能力。樣本必須具有代表性,即能通過部分內容的考查,全面、真實地反映考生的整體水平和能力。”[14]就英語測試來說,無論是大學英語,還是專業英語,都須參照有關的教學大綱。教學大綱往往對知識和能力進行了分解,提出了明確的要求,對各知識點和能力構成要素也進行了詳盡的說明。因此,對具體測試內容的抽樣應充分體現這些要求,同時也要注意知識點和能力構成要素的合理安排。否則,就會對教學和學習產生錯誤的導向,即負面反撥作用。例如,在考查學生的閱讀理解能力時,由于種種原因,題目過多的集中在某一、二項技能上,而忽視對其他技能的考查。如果這樣的測試內容反復出現,就會對學生和教師產生誤導作用。所以,要使測試真正地對教學產生良好的反撥作用,必須要保障其內容效度。
“結構效度指的是語言能力理論中假設的基礎能力或特征”,[1](26)如聽力能力、閱讀能力、寫作能力和口語能力就是典型的理論能力結構。如果一個考試表明能夠測量某個理論結構,它就具有結構效度。換言之,一個考試如能測量出考生的聽力、閱讀或者寫作能力,那么這個考試就具有結構效度。結構效度與考分的解釋功能有關,如寫作能力考試的分數能否解釋學生的寫作能力。不難看出,要使一個考試具有結構效度,考試方式的選擇非常重要。外語教學最終要培養的是實際語言運用能力,而考試方式的選擇應能強化和促進這種能力的培養,即它們要具有正面反撥效應。例如,要測試學生的寫作能力,最簡單的,也是最直接的方法就是讓學生寫一篇作文,因為學生在完成作文的過程中必須運用他們的寫作能力。“如果采用間接考試、分離式考試(多項選擇題)來考察寫作能力,勢必會導致消極的反駁作用,長此以往,教師和學生都不會對實際寫作能力的培養給予足夠的重視,而是會花很多時間去做多項選擇題。”[14]
當然,具體考試方式的選擇還需考慮其他一些因素。如直接考試便于考查被試的實際語言運用能力,但閱卷過程中就需要投入大量的人力和物力,不夠經濟。因此,在具體操作中,既力求保證測試的積極反撥作用,又要根據具體情況,兼顧其他因素。
測試的真實性是指被試在測試中使用目的語完成測試任務與其在現實生活中使用語言進行交際活動的相似程度。可以說,真實性在口語測試中體現得最為充分。正如Doye[12]所說,具有真實性的測試才能檢驗學生應對真實生活的語言能力。因此在英語測試設計時,務必要保證其具有真實性,使其具有較高的反撥作用,從而積極影響外語教學,激發學生的學習動力。當今語言測試界有兩種方法來實現考試的真實性:一種是從形式上盡可能對應目的語國家的真實生活狀況;另一種是要考慮確定成功的語言交際所需的能力的特性,以及那些決定語言使用者和背景、對話互動關系的情境特性。前者被Bachman[13](301)稱為“現實生活法”,后者為“交際/能力法”。兩種方法各有所長。現實生活法側重考試的表面效度、預測效度和內容效度;交際/能力法側重考試的結構效度。確定哪一種方法要考慮各種因素,如考試目的、考試用途、考生人數、考官人數、考試時間以及考試場地等。如果一個班有10名學生,可用的考試時間為兩個小時,考官有兩位教師,這時可以考慮采用現實生活法,考試形式可以是情景對話或小組討論;如果學生較多,考官只有教師本人的話,則考慮采用交際/能力法,運用錄音口試的形式。
“語言測試對教學及整個教育體系的潛在影響是不容置疑的。因此,測試的設計開發者必須高度重視測試對教學和學習的‘反撥作用’、從理論和實踐的角度對其進行充分的研究,使測試產生積極的影響”[14]。在設計英語測試時,首先要明確考試的性質和目的,其次要從考試的內容、考試方式、真實性等方面預測其對教學和學習可能會產生的影響,同時要對這些影響加以權衡,努力提高正面反撥效應。
[1] Hughes, A. Testing for Language Teachers [M]. Cambridge: Cambridge University Press, 1989.
[2] Alderson, C & D. Wall. Does washback exist? [J]. Applied Linguistics, 1993, (14/2): 115-129.
[3] Bachman, L. F & A. S. Palmer. Language Testing in Practice [M]. Oxford: Oxford University Press, 1996.
[4] Bailey, K. M. Working for washback: A review of the washback concept in Language testing [J]. Language Testing, 1996, (13/3): 257-279.
[5] Wall, D.Introducing new tests into traditional systems: Insights from general education and from innovation theory [J]. Language Testing, 1996, (13/3): 334-354.
[6] Cheng, L. How does washback influence teaching? Implications for Hong Kong [J]. Language and Education, 1997(11/1): 38-54.
[7] Brown, J. D. University Entrance Examinations: Strategies for creating positive washback on English Language teaching in Japan [J]. Shiken: JALT Testing & Examination SIG Newsletter, 2000, (3/2): 4-8.
[8] Buck, G. Testing listening comprehension in Japanese university entrance exams[J]. JALT Journal, 1988, (10): 15-42.
[9]江瀾,馮曉媛.對教師自行設計的英語考試內容效度和表面效度的調查和反思[J].外語教學,2003(5).
[10] Heaton, J. B. Classroom Testing [M]. Harlow: Longman, 1990.
[11]鄒申,楊任明.簡明英語測試教程[M].北京:高等教育出版社,2005.
[12] Doye, P. Authenticity in Foreign Language Testing [J]. Current Developments in Language Testing, 1991, (25):103-110.
[13] Bachman, L. F. Fundamental Considerations in Language Testing [M]. Oxford: Oxford University Press, 1990.
[14]李紹山.語言測試的反撥作用與語言測試設計[J].外語界,2005(1).