桂敏
摘要:進入21世紀人們對大學英語四、六級考試(以下簡稱為CET)的爭議從未停止。本文通過剖析CET的測量學屬性,分析了它的多重功能,即CET具有很強的選拔和區分功能,一定的判斷學生是否達到課程教學要求的功能,以及測量學生實際運用英語能力。從分析中得到的啟示是CET復雜的測量學屬性和多重功能有可能是引起人們對CET爭議的原因之一,為了讓CET更好地發揮它的作用,CET應該使其功能單一化。
關鍵詞:大學英語四、六級考試;常模參照的測試;尺度參照的測試;學業考試;水平考試
中圖分類號:G640 文獻標志碼:A 文章編號:1674-9324(2012)12-0110-03
一、引言
大學英語四、六級考試對中國英語教學和學生英語水平的提高起了較大作用,但是進入21世紀后對它的爭議從未停止(如韓寶成,2002;劉潤清,2003;錢冠連,2003;陳祖芳,2004;韓寶成 戴曼純等,2004;王初明,2006)。有學者質疑CET是否準確地測量學生的英語水平(如蔡基剛,2007;韓寶成、戴曼純等,2004)。有學者關注CET對大學英語教育和學習是否有促進作用。有些研究表明CET對大學英語教育和學習帶來負面影響(如井升華,1999;牛強,2001;肖云南 羅曉英,2002;李炯英,2002;高遠,2003);有的研究結果表明它的正面反撥效應大于其負面反撥效應(如辜向東,2007;葉菊仙,1998)。對CET進行改革已是大勢所趨,教育決策者、CET研究開發單位和語言教育專家都從不同的視角提出CET的改革發展方向(張堯學,2003,2008;金艷,2004,2006;王初明,2006;蔡基剛,2007)。基于分析CET復雜的測量學屬性和它的多重功能,本文探討了對CET爭議的原因。
二、CET的測量學屬性
分析CET的性質是理解對CET爭議的重要視角之一。它本身是一個什么性質的考試,考試研發者期望它能滿足什么樣的功能,而質疑者認為它應該是什么樣的考試,它應該在社會和教育界起什么樣的作用,角度不同,答案也不一樣,因此分析他們之間的偏差可以更好地理解對CET的爭議。用來描述語言考試和評估的專有名詞很多。根據不同的解釋測試結果的參照系,心理測量研究人員通常把測試分為標準參照(criterion-referenced)和常模參照(norm-referenced)考試;根據考試內容選取的依據,考試通常分為學業考試(achievement test)和水平考試(proficiency test)(Bachman,1990;徐強,2000;束定芳 莊智象,1996);根據不同的評估型式,考試分為形成性(formative)和終結性(summative)評估。下文將以測試的不同分類方法為視角對CET的測量學屬性進行剖析。
1.CET是常模參照-尺度相關的考試。心理測量理論認為如果測試的結果是參照某一標準進行解釋(語言能力等級量表或教學大綱標準),該考試被稱之為標準參照。比如雅思把語言能力分為十個等級,每一個等級用語言進行定性的描述,達到某個等級就表示該考生能用語言完成所描述的功能。根據雅思的能力等級量表如果一個考生“有能力運用英語,雖然在某些情況有時會發生不準確、不適當和誤解,基本上能很好地掌握復雜的英語句子,也能理解推理的細節”,該考生的語言能力為七級。而常模參照考試是以某一常模作為參照系來解釋考生的成績。常模是由測試單位選取的,呈正態分布的用均值和標準差來進行描述的標準化樣組。考生的成績是以它在常模中所處的位置來解釋的。如果某一考生的原始分數與常模的均值大一個標準差,他的能力就可以解釋為比84.13%的考生強。因此,從分數解釋的參照系的角度出發,CET是常模參照性的考試。常模是由北京大學,清華大學,上海交通大學,復旦大學,中國科技大學和西安交通大學本科生組成。這樣選取常模是因為考試的最初設計測量對象是重點大學本科生。后來CET擴展到全國普通高校,并用小于常模均值一個標準差作為及格線(楊惠中&Weir,1998;楊惠中 金艷,2001;蔡基剛,2007)。CET也是尺度相關的考試。楊惠中和Weir(1998:30)認為“這一常模的建立和某種事先確定的標準密切相關”因而稱之為尺度相關。CET研發中心按照國家教育委員會頒布的《大學英語教學大綱》(1985)中的要求:“重點大學經過一定時期的努力,基本上達到大綱所規定的四級要求”,把“基本上”理解為85%的學生達到要求。這樣常模累計比例85%,比平均分小一個標準差的分數就定為及格分。經過線性轉換,100制的60分就成為及格分;得60分的考生就達到了大綱所規定的四級要求。但是,自2005年起,CET總分改為710,平均分為500,標準差為70的常模正態分數,它的尺度相關的測量學屬性逐漸淡化。
2.CET是學業考試和水平考試的結合體。根據考試內容選取的依據,考試分為學業考試(achievement test)和水平考試(proficiency test)。前者的測試內容以教學大綱為依據,后者的測試內容以語言理論為基礎(Bachman,1990;徐強,2000;束定芳 莊智象,1996)。CET考試的內容基本上以大學英語教學大綱為基礎。比如教學大綱對聽、說、讀、寫、譯的速度和難度有量化的要求,CET也基本上是按教學大綱的量化標準考察學生的五項技能。所以,CET能對學生學完大學英語課程的結果進行一定的考核。從這個意義上講CET是學業考試。CET也是水平考試。CET是基于分立語言測試、綜合語言測試和交際語言測試理論的測試(楊惠中 金艷,2001)。基于五個分項(聽力、閱讀、詞匯與結構、完型填空和寫作)的相關系數分析以及因素分析,CET研發中心歷時三年的效度研究證明CET“能夠準確而有效地反映學生總的語言水平”(楊惠中 & Weir,1998:61)。因此,CET也是建立在語言能力理論和語言測試理論研究的基礎之上的水平測試。
3.CET是終結性的考試。根據考試的型式,教學考試或教學評估一般分為形成性和終結性評估。形成性評估是對學生的學習進展的評估,是在教學過程中為改進教與學而進行的評價。形成性評價注重對學習過程的指導和改進,強調評價信息的及時反饋,旨在通過經常性的測評,提高學生的學習效果,并改進教師的教學(Black & William,2003)。它的形式多種多樣,譬如學生自我評估,學生相互間的評估,教師對學生的評估。終結性評價是指在一個學習階段末,對學生的表現與能力所做的評價,它關注的是學習的結果。前者被稱作是為了學習而進行的評價(Assessment for learning),后者是對學習進行的評價(Assessment of learning)。CET是在學生完成一段時間的課程學習(一般為四個學期)對他們進行英語綜合能力的評價,所以它是終結性評估。綜上所述,CET是常模參照-尺度相關,融合了學業考試和水平考試的特點,對大學生的綜合英語水平進行終結性評價的考試。
三、CET的多重功能
一個測評系統能夠發揮什么樣的功能是與它的性質密切相關的。首先,CET是常模參照的考試,所以它具有很強的選拔和區分功能。它是標準相關的考試,所以它對考生是否達到大學英語教學大綱的基本要求或較高要求能進行判斷。其次,CET融合了學業考試和水平考試的特點,因此它能在一定程度上判斷學生是否達到課程教學要求,滿足教育管理者對督促教師貫徹教學要求和對教學效果進行評價的目的。它也能從一定程度上評定學生的英語水平,滿足社會對畢業生求職者的英語水平進行量化評判的要求,也滿足了打造“中國的民族品牌”與其他國家的大型標準化英語考試競爭的目的。最后,CET能對學生學完大學英語課程后進行終結性的測評。總之,目前的CET身兼多重功能。這種多功能的考試在上個世紀對教學和社會都起到了積極的作用。但是隨著人們對測評系統的專業化程度和精確度要求越來越高,這種多功能的考試引起了越來越大的爭議。
四、CET多重功能的局限性
對CET的爭議與其性質和功能是密切聯系的。有些爭議是由它的多重功能之間的矛盾性引起的。下面討論對CET的兩個主要的爭論:CET對大學英語教育和學習的影響;CET是否能準確測評學生修完大學英語四、六級課程后的英語語言水平。CET對大學英語教育和學習影響的研究結果并不一致。有的研究結果表明它的正面反撥效應大于其負面反撥效應(如辜向東,2007;葉菊仙,1998)。有的調查結果顯示它有很大的負面效應(如韓寶成 戴曼純等,2004)。雖然對CET的反撥效應的調查研究不多,但認為CET對大學英語教育和學習帶來負面影響的人卻不少(如井升華,1999;牛強,2001;肖云南 羅曉英,2002;李炯英,2002;高遠,2003)。對CET的質疑部分是由它的功能之間的矛盾性引起的:為英語教學服務和為社會對語言能力測評需要服務。這兩者之間雖然有統一性,但隨著社會對專業化需要越來越強,他們之間的矛盾日漸突出。他們之間的統一性在于能力高低的相關性:如果某個學生能很好地完成教學要求,他在學業考試中就會獲得高分,他在水平考試中也很可能得高分,雖然兩種考試的目的和內容不一樣。不同考試之間的相關性往往會掩蓋他們的差異性。但人們對測試標準的要求越來越高,他們之間的差異性就會逐漸顯現。首先,為教學服務的學業考試內容和重點可變性強,而基于能力結構的水平測試是相對穩定的。教育政策對教學要求和教學重點有很強的指導性,而教育政策是經常變化的,這樣基于教學要求的學業考試重點和內容也會不斷地變化。比如,1999年的大學英語教學大綱和2004年頒布的大學英語教學要求差異很大。前者強調培養學生較強的閱讀能力,后者突出要求學生的聽說能力。教學大綱和要求的改變使得CET的內容和比重作出相應的改變。張堯學(2008)明確指出CET必須隨著教學大綱的改變而改變。若干年之后,由“聽說領先”改為“讀寫領先”也不是沒有可能的,因為能讀會寫才不是文盲。但是基于能力結構的水平測試卻依然對聽、說、讀、寫有全面的要求。然而水平測試的內容相對穩定,雖然也會變化,但變化的依據是人們對于語言能力的認識,即語言理論。其次,為教學服務的學業考試的主要服務對象是學生,教師和教育管理者,而為社會服務的水平考試的主要服務對象是求職者和用人單位。形成性的學業考試對學生的學習過程進行評估,以幫助學生認清自己的強項和弱項,調整學習重點。考試結果也可以幫助教師調整教學方法、進度和教學重點。終結性的學業考試可以對一段時間的學習和教學進行總的評估,為教育管理者提供信息。而為社會服務的水平考試是對應試者的英語進行測評,為用人單位甄選人才提供信息。學業考試可以對學習的過程或者學習結果進行考評,而為社會服務的水平考試只關注考試結果。王初明(2006)認為CET改革的根本問題是考試如何實用和對誰使用的問題。再次,為教學服務的學業考試的構念(construct)是測評學生的“一般語言能力”,或“是否學會了自主學習和掌握了不斷提高英語實用水平的英語學習可持續發展能力”(金艷,2009),而為社會服務的水平考試的構念是測試應試者的“實用英語能力”。學業考試的主要內容是人文、社會、科普,而為社會服務的水平考試的主要內容是日常交際、國際交流、商務、旅游等。學業考試關注學生的“可持續發展能力”,而為社會服務的水平考試的主要使用者更關注應聘者此時此刻具有的實用英語的熟練程度和英語應用能力,他們對學生過去的學習過程和將來的發展可能并不十分關注。總之為教學服務的學業考試和為社會服務的水平考試之間的矛盾性使得CET這樣一個兼備學業考試和水平考試性質的測評系統很難充分發揮其為教學和為社會服務的雙重功能。
從測量學屬性來看,CET是常模參照-尺度相關、融合了學業考試和水平考試的特點、對大學生的綜合英語水平進行終結性評價的考試。因此,CET具有多重功能,如:很強的選拔和區分功能,判斷學生是否達到課程教學要求的功能,測量學生實際運用英語能力的功能。同時,CET打造了“中國的民族品牌”,與其他國家的大型標準化英語考試進行競爭,為社會對求職者的英語水平進行量化評判提供依據。但是,CET的多重功能性也使其難以滿足人們對語言測試系統的專業化程度和準確度的要求日益提高的要求。如果CET能夠使其功能更加單一化,目的更加明確,就可以更好地發揮它的作用。
參考文獻:
[1]Bachman, L. F. Fundamental Considerations in Language Testing[M].Oxford:Oxford University Press,1990.
[2]Black,P.&William,D.Assessment for learning:Putting it into practice(Inside the black box)[M].New York: McGraw-Hill House,2003.
[3]蔡基剛.大學英語四級考試新大綱目標定位修正及其意義[J].外語界,2007,(4):76-82.
[4]陳祖芳.學術討論要尊重事實——就四、六級考試問題與劉潤清先生商榷[J].外語界,2004,(1):74-77.
[5]方緒軍.楊惠中,朱正才.制定全國統一的語言能力等級量表的原則和方法[J].現代外語,2008,(4):380-387.
[6]高遠.外語教學改革要科學論證和放開搞活[J].外語教學與研究,2003,(3):222-223.
[7]辜向東.大學英語四、六級考試對中國大學英語教學的反撥效應實證研究[J].重慶大學學報(社會科學版),2007,(4):119-125.
[8]韓寶成.高校學生英語能力測試改革勢在必行[J].外語教學與研究,2002,(6):410-411.
[9]韓寶成,戴曼純,楊莉芳.從一項調查看大學英語考試存在的問題[J].外語與外語教學,2004,(2):17-23.
[10]金艷.大學英語四、六級網考的設計原則[J].外語界,2009,(4):61-68.
[11]金艷.提高考試效度,改進考試后效——大學英語四、六級考試后效研究[J].外語界,2006,(6):65-73.
[12]金艷.改革中的大學英語四、六級考試[J].中國外語,2004,(1):27-29.
[13]井升華.我國大學英語教學費時低效的原因[J].外語教學與研究,1999,(1):21-23.
[14]李炯英.中國現行大學英語四、六級考試的問題與思考——兼評國內外相關研究[J].外語教學,2002,(5):33-38.
[15]劉潤清.高校英語教學改革筆談之二[J].外語教學與研究,2003,(3):221.
[16]牛強.現行高校英語測試中的問題[J].外語教學與研究,2001,(2):140-143.
[17]錢冠連.還是要整合性考試——談純分析性考試為何是失誤[J].外語教學與研究,2003,(5):379-380.
[18]束定芳,莊智象.現代外語教學——理論、實踐與方法[M].上海:上海外語教育出版社,1996.
[19]王初明.外語學習的必要條件與大學英語四、六級考試改革的反思[J].中國大學教學,2006,(11):48-51.
[20]肖云南,羅曉英.關于英語測試的改革[J].外語教學與研究,2002,(4):294-299.
[21]葉菊仙.大學英語考試對教學反撥作用的調查和思考[J].外語界,1998,(3):40-43.