蘇長艷
語料庫是一個機(jī)器可讀的文本數(shù)據(jù)庫,包括在不同的上下文的自然話語。語料庫發(fā)展經(jīng)歷了20世紀(jì)60年代起的小型語料庫,80年代的大型語料庫,從90年代開始建立動態(tài)語料庫,其特點(diǎn)是對早期語料庫實(shí)行后期的內(nèi)容更新,建立開放性的滾動式發(fā)展的歷時性語料庫,從2005年起的電子網(wǎng)絡(luò)語料庫,其特點(diǎn)是在國際互聯(lián)網(wǎng)上設(shè)置檢索引擎,將互聯(lián)網(wǎng)上的語言信息作為一個巨大的、動態(tài)的和開放的語料庫[1],例如COCA、BROWN、Project Gutenberg、Shanghai Jiaoda Corpus等語料庫。瑞士認(rèn)知心理學(xué)家皮亞杰于20世紀(jì)60年代提出建構(gòu)主義理論,指出學(xué)習(xí)者在與周圍環(huán)境的相互作用過程中,逐步建構(gòu)起關(guān)于外部世界的知識,從而進(jìn)一步發(fā)展自身認(rèn)知結(jié)構(gòu)。利用在線語料庫學(xué)習(xí)語言,可以創(chuàng)造一個真實(shí)情景的外語環(huán)境,引導(dǎo)學(xué)習(xí)者架構(gòu)語言知識。
語料庫語言學(xué)作為一個新的分支,其在教學(xué)中的使用受到了廣泛關(guān)注。Gavioli和Aston[2]指出,利用語料庫學(xué)習(xí),學(xué)習(xí)者自主學(xué)習(xí)能力增強(qiáng),學(xué)會觀察語言,總結(jié)規(guī)律,這不僅符合語言學(xué)習(xí)理論,還能提升他們的語法意識[3],從而促進(jìn)二語習(xí)得。也有教師指出,利用語料庫教學(xué)有一定技術(shù)要求[4],所以一定量的訓(xùn)練必不可少,或者少量訓(xùn)練即可[5]。Yoon和Hirvela[6]討論了二語學(xué)習(xí)者對語料庫輔助寫作的態(tài)度,發(fā)現(xiàn)學(xué)習(xí)者認(rèn)為總體上有益于二語寫作的學(xué)習(xí)并能增強(qiáng)對寫作的信心。Elorza和Garcia-Riaza[7]指出,借助詞頻比較手段搜索到與原文最相近的文章并建立語料庫可增加高水平學(xué)習(xí)者的閱讀和詞匯習(xí)得途徑。Pascual和Pascual[8]發(fā)現(xiàn),高水平學(xué)習(xí)者更容易通過語料庫發(fā)現(xiàn)語言規(guī)律。
研究表明,語料庫教學(xué)可以在聽說讀寫各個方面輔助教學(xué),尤其是在同義詞辨析方面語料庫顯示出了卓越的功能。語料庫方法“有效地澄清了同義詞因部分義素重合而產(chǎn)生的理解和運(yùn)用的困惑,是對傳統(tǒng)的基于直覺判斷的同義詞辨析方法的一種有效的補(bǔ)充”[9]。王家義[10]指出,傳統(tǒng)的語義學(xué)和語體學(xué)視角下的同義詞辨析采用直覺判斷為主,依賴對詞匯定義的描述,而在語料庫語言學(xué)視角下,采用定性和定量相結(jié)合的方法,解釋類聯(lián)接、搭配關(guān)系和語義韻等語言特征,從而實(shí)現(xiàn)同義詞辨析。
根據(jù)研究現(xiàn)狀來看,語料庫應(yīng)用于教學(xué)的研究正在蓬勃發(fā)展,國內(nèi)相關(guān)研究雖然豐富,但只限于例證教師如何教,幾乎沒有涉及到學(xué)生如何學(xué),更少有研究通過定量研究探討語料庫對學(xué)習(xí)效果的影響。雖然蔡少蓮[11]采用“體驗(yàn)英語寫作”學(xué)習(xí)訓(xùn)練系統(tǒng)開展教學(xué)工作,發(fā)現(xiàn)學(xué)生六級作文成績顯著提高,對寫作更感興趣,增強(qiáng)了寫作信心,但與具有大規(guī)模真實(shí)語料的語料庫相比,訓(xùn)練系統(tǒng)的語料量小且多為中國外語學(xué)習(xí)者寫作內(nèi)容,可能對學(xué)習(xí)效果有一定負(fù)面影響。對于中國外語學(xué)習(xí)者的研究不能僅停留在探討教師如何使用語料庫,而是要拓展范圍,討論如何真正以“學(xué)生為中心”,遵循建構(gòu)主義理念,實(shí)現(xiàn)學(xué)習(xí)者自下而上的歸納學(xué)習(xí)和自上而下的演繹推理驗(yàn)證。本研究將主要針對在教學(xué)中利用在線語料庫學(xué)習(xí)詞匯、短語、句法,并調(diào)查學(xué)習(xí)者對使用語料庫教與學(xué)的態(tài)度。
基于以上研究,本文提出以下研究問題:
第一,應(yīng)用語料庫教學(xué)能否顯著提高學(xué)習(xí)者成績?
第二,如果能,語料庫在哪些方面提高學(xué)習(xí)者成績?
本研究涉及到的學(xué)習(xí)者為某高校英語教育專業(yè)二年級兩個班,每班各有51名學(xué)生,綜合英語每周6節(jié)課。第一學(xué)期該課程(1)班期末成績平均分71.84分,最高分85分,最低分52分,(2)班平均分為73.86分,最高分88分,最低分50分,獨(dú)立樣本T檢驗(yàn)顯示兩班成績無顯著差異(見表1),遂隨機(jī)確定(1)班為實(shí)驗(yàn)班,(2)班為控制班。

表1 控制班與實(shí)驗(yàn)班上學(xué)期期末成績獨(dú)立樣本T檢驗(yàn)
本研究將在實(shí)驗(yàn)班進(jìn)行一學(xué)期的綜合英語語料庫教學(xué),其中筆者示范教學(xué)兩周,學(xué)習(xí)者自主操作四個月,通過獨(dú)立樣本T檢驗(yàn)對比控制班與實(shí)驗(yàn)班下學(xué)期期末成績,并通過配對樣本t檢驗(yàn)對比實(shí)驗(yàn)班前后的學(xué)習(xí)成績是否出現(xiàn)顯著變化;通過問卷調(diào)查學(xué)習(xí)者對網(wǎng)絡(luò)語料庫教學(xué)的態(tài)度,以均數(shù)和標(biāo)準(zhǔn)差來分析語料庫在哪些方面有助于學(xué)習(xí)者的語言建構(gòu)。
本研究選用楊百翰大學(xué)提供的美國當(dāng)代英語語料庫(COCA)。其界面主要是為語言學(xué)家和語言學(xué)習(xí)者了解單詞、短語以及句子結(jié)構(gòu)的頻率及進(jìn)行相關(guān)信息比較而設(shè)計(jì)。COCA具有其它語料庫不可企及的突出優(yōu)勢。它內(nèi)容較新,包含1990年至今以來的各類語料,容量多達(dá)4.5億詞,文本包括口語,報(bào)紙、雜志、小說、學(xué)術(shù)文章書籍五大類,范圍較廣,以5年為一檔,時間劃分清楚。它是一種動態(tài)的語料庫資源,處于不斷的更新與發(fā)展中。語料已經(jīng)經(jīng)過分句處理,標(biāo)注了詞性。可以開展詞素、單詞、短語與搭配、結(jié)構(gòu)和句式、同義詞、反義詞、類義詞以及句法等方面的文本檢索。另外,該語料庫檢索界面同時提供BNC(英國國家語料,1億詞,1980s-1993),TIME(時代周刊,1 億詞,1923-2006),COHA(美國歷史語料庫,4億詞,1810-2009)和Google(1550億詞,1810-2009)四個大型通用語料庫的在線檢索,用戶可以根據(jù)需要選擇合適的語料庫或者比較檢索結(jié)果。通配符的使用可以擴(kuò)大搜索結(jié)果,保證檢索的有效性和科學(xué)性。例如,葉拉美[12]在討論語料庫教學(xué)時提到,“rob the cradle”和“have a crush on”兩個短語在 BNC 中檢索結(jié)果分別為0和4條檢索行。但是,使用表示詞元的通配符“[]”,在五個語料庫中分別搜索“[rob]the cradle”和“[have]a crush on”,結(jié)果顯示,Google提供了最多的例句(分別為 519,13791),其次是 COCA(19,329)、COHA(14,130)、TIME(1,31)、BNC(0,14),相比較之下,“have a crush on”檢索的例句有所增加。另外,雖然Google容量最大、內(nèi)容也較新、查詢結(jié)果較為全面,但其搜索結(jié)果為各個網(wǎng)站的內(nèi)容,而不是檢索行的形式,不利于保存檢索結(jié)果、比較文本信息,所以推薦學(xué)生使用COCA在線語料庫。
教學(xué)的最終目的是讓學(xué)習(xí)者掌握建構(gòu)語言的方法。Gavioli[13]指出語料庫教會學(xué)生把語言材料當(dāng)做樣本而不是例句,“辨別在某些特定語境中出現(xiàn)的復(fù)現(xiàn)句,推測句型”。這可以培養(yǎng)學(xué)習(xí)者對待數(shù)據(jù)的研究態(tài)度,而不是盲目相信教師。學(xué)生既是文本的參與者又是觀察者[2],對語言特定模式的觀察很容易在使用過程中得到“認(rèn)同”[14],學(xué)習(xí)者通過瀏覽語料庫搜索需要的信息,分析搜索結(jié)果,選擇合適的方法完成一定的學(xué)習(xí)目標(biāo)。
教師示范教學(xué)兩周之后,學(xué)生開始利用語料庫自主學(xué)習(xí),教師則主要負(fù)責(zé)檢查學(xué)生的學(xué)習(xí)情況,并對課文做背景知識拓展,分析寫作手法。班級分成9個小組,每組五至六名同學(xué),由一名學(xué)習(xí)成績較好的學(xué)生做組長,協(xié)助教師指導(dǎo)學(xué)生,教師按照課文段落分配查詢?nèi)蝿?wù),學(xué)生課堂利用語音室的互聯(lián)網(wǎng)完成搜索,展示搜索結(jié)果。網(wǎng)絡(luò)語料庫的學(xué)習(xí)按照難易級別循序漸進(jìn),兩周內(nèi)分別完成單詞、搭配、比較和句式查詢,其中搜索、研讀搜索行和展示大約花費(fèi)一節(jié)課時間。熟悉操作過程之后,從第二個月開始,學(xué)生利用課內(nèi)外時間自主完成學(xué)習(xí)中發(fā)現(xiàn)的問題,以作業(yè)形式提交到網(wǎng)絡(luò)教學(xué)平臺,教師每周通過教學(xué)平臺下載所有的作業(yè)后,共享到網(wǎng)絡(luò)平臺“文件”中。
為了檢測網(wǎng)絡(luò)語料庫對教學(xué)效果的影響,在期末時,對比實(shí)驗(yàn)班和控制班學(xué)生學(xué)習(xí)成績變化是否具有統(tǒng)計(jì)學(xué)上的顯著差異性,并調(diào)查學(xué)習(xí)者對語料庫的態(tài)度,探討究竟在哪些方面語料庫可能對其產(chǎn)生影響。
期末試卷題型與上學(xué)期相同,均包括詞匯(15%)、語法(20%)、完形填空(10%)、閱讀理解(20%)、翻譯(15%)、寫作(20%),其中詞匯、語法和翻譯屬于課本內(nèi)容,課內(nèi)外分別占50%,難度系數(shù)與上學(xué)期相近。獨(dú)立樣本T檢驗(yàn)顯示(見表2)實(shí)驗(yàn)班和控制班在下學(xué)期成績平均值差為4.38,出現(xiàn)顯著變化(p=.000)。

表2 控制班與實(shí)驗(yàn)班下學(xué)期期末成績獨(dú)立樣本T檢驗(yàn)
實(shí)驗(yàn)班兩學(xué)期期末成績配對t檢驗(yàn)顯示(見表3),經(jīng)過一學(xué)期的教學(xué),實(shí)驗(yàn)班學(xué)習(xí)者平均成績提高了4.62分,較上學(xué)期顯著提高(p=.000)。觀察學(xué)習(xí)成績可以看出,成績較好學(xué)習(xí)者上升較快,其中前15五名學(xué)習(xí)者平均成績提高5.8分,變化顯著(p=.000),而后15名學(xué)習(xí)者則變化不大(p=.238),平均成績只提高1.4分。

表3 實(shí)驗(yàn)班兩學(xué)期期末成績配對t檢驗(yàn)
鑒于兩組不同水平學(xué)習(xí)者出現(xiàn)的成績變化,有必要討論學(xué)習(xí)者在哪些方面受到了語料庫的影響,以及學(xué)習(xí)者在教學(xué)過程中使用語料庫的態(tài)度如何。為此筆者就詞匯、短語、句法、寫作和閱讀五個方面在該門課程成績前15名和后15名中間進(jìn)行了一份實(shí)名問卷調(diào)查,每個問題按照是否有用由高到低有5項(xiàng)分值。數(shù)據(jù)描述結(jié)果顯示(見表4),兩組學(xué)習(xí)者中前15名學(xué)習(xí)者在回答5個問題的均數(shù)均高于后15名學(xué)習(xí)者,這與現(xiàn)有的研究結(jié)果基本一致。兩組學(xué)習(xí)者中大部分認(rèn)為語料庫在詞匯和短語方面幫助最大,但不同于后15名學(xué)習(xí)者,前15名學(xué)習(xí)者認(rèn)為對短語習(xí)得的幫助高于詞匯,這可能是由于與低水平學(xué)習(xí)者相比較,高水平學(xué)習(xí)者詞匯量較大,無需頻繁查詢新單詞,其學(xué)習(xí)重點(diǎn)已經(jīng)轉(zhuǎn)向較高層次的短語學(xué)習(xí)。
學(xué)習(xí)者普遍認(rèn)為,語料庫在句法方面幫助較小(M=3.1,3.7)。詞匯和短語檢索方式比較簡單,通常直接輸入即可查詢,即使使用通用符也多數(shù)比較簡單,如限定單詞和詞性(如deal.[n]),查詢同義詞(如[=walk])、曲折形式(如[be]able to,[approach])等,學(xué)習(xí)者容易掌握,但句法往往用詞并不連貫(例如would rather…than),查詢難度較大,即使左右跨距加大也不一定找到滿意的句子,畏難情緒可能會影響學(xué)習(xí)者使用語料庫查詢句法的信心和興趣。另外,傳統(tǒng)的語法教學(xué)強(qiáng)調(diào)結(jié)構(gòu)分析和翻譯,不像詞匯和短語那樣能從詞典中查詢,定式思維也限制了語料庫的使用。

表4 學(xué)習(xí)者對使用語料庫的態(tài)度
在寫作方面往往涉及詞匯、短語,所以如果對詞匯和短語有幫助,對寫作可能也有一定幫助,調(diào)查結(jié)果證實(shí)了這一點(diǎn)(M=3.4,3.8),在閱讀方面標(biāo)準(zhǔn)差則為最低水平(M=2.7,3.0),閱讀過程中理解大意比認(rèn)識所有的單詞顯得更加重要,語言難點(diǎn)可以通過閱讀技巧部分解決,而在寫作過程中,學(xué)習(xí)者更重視語法準(zhǔn)確性,在詞匯和短語層面語料庫可以發(fā)揮積極的作用。另外,雖然每條搜索行均可顯示其所在原文段落,但通過上傳至網(wǎng)絡(luò)平臺的作業(yè)來判斷,學(xué)習(xí)者多局限于閱讀搜索行,而忽略閱讀原文語境,所以語料庫檢索并不會顯著增加學(xué)習(xí)者的閱讀量。
本文主要探討了網(wǎng)絡(luò)語料庫COCA在綜合英語課上對學(xué)習(xí)者成績的影響,結(jié)果證明,COCA語料庫可以幫助學(xué)習(xí)者獲得地道純正的英語,也為中國外語教師教學(xué)提供了真實(shí)的語言環(huán)境和可操作的教學(xué)方法。經(jīng)過一學(xué)期的學(xué)習(xí),學(xué)習(xí)者平均成績顯著提高。當(dāng)然,應(yīng)用語料庫也有其不足的地方,如對于低水平學(xué)習(xí)者來說有一定難度,對其學(xué)習(xí)幫助不大;在閱讀方面應(yīng)用不足,語料庫中文章地道,學(xué)習(xí)者閱讀的較少,多數(shù)僅停留在詞匯層面。未來研究中可加強(qiáng)傳統(tǒng)教學(xué)與多種語料庫,如漢英平行語料庫教學(xué)的結(jié)合,并在聽力、翻譯、閱讀等方面探討語料庫的應(yīng)用。
[1]何安平.語料庫輔助英語教學(xué)入門[M].外語教學(xué)與研究出版社,2010:4
[2]Gavioli,L.&Aston,G.Enriching reality:language corpora in language pedagogy[J].ELT Journal,2001,55(3):238-246
[3]Schmidt,R.The role of consciousness in second language learning[J].Applied Linguistics,1990,11(2):129-158.
[4]Boulton,A.Data-driven learning:Taking the computer out of the Equation[J].Language Learning,2010,60(3):534-572
[5]Boulton,A.Looking for empirical evidence for DDL at lower levels[C]//B.Lewandowska Tomaszczyk.Corpus Linguistics,Computer Tools,and Applications:State of the Art.Frankfurt am Main:Peter Lang,2008
[6]Yoon,H.&Hirvela,A.ESL student’s attitudes toward corpus use in L2 writing [J].Journal of Second Language Writing,2004,(13):257-283
[7]Elorza,I.&Garcia-Riaza,B.FL students’input in higher education courses:Corpus Methodology for implementing language representativeness[C]//T.Wolfgang&M.Michaela,Corpus-based Approaches to English Language Teaching,Research in Corpus and Discourse,2010:216-232
[8]Pascual P.&Pascual C.Some lessons students learn:Self-discovery and corpora [C]//A.Guy,B.Silvia&D.Steward.Studies in Corpus Linguistics,2004,(17):245-256
[9]張繼東,劉萍.基于語料庫同義詞辨析的一般方法[J].解放軍外國語學(xué)院學(xué)報(bào),2005,28(6):49-52
[10]王家義.英語同義詞辨析的多視角透視[J].外國語文,2011,(5):79-83
[11]蔡少蓮.基于語料庫的英語寫作教學(xué)實(shí)證研究[J].外語教學(xué),2008,(6),61-68.
[12]葉拉美.微型文本創(chuàng)建與教學(xué)效果提高[J].東華大學(xué)學(xué)報(bào)(社會科學(xué)版),2010,(2):119-125
[13]Gavioli.L.The learner as researcher:Introducing corpus concordancing in the classroom [C]//G.Aston.Learning with Corpora.Houston,TX:Athelstan/Bologna:CLUEB,2000
[14]Widdowson,H.G.Explorations in Applied Linguistics (II)[M].Oxford:Oxford University Press,1984