劉國兵
(河南師范大學 外國語學院,河南 新鄉(xiāng) 453007)
基于語料庫的英語學習者口語語塊發(fā)展特征研究
劉國兵
(河南師范大學 外國語學院,河南 新鄉(xiāng) 453007)
跟蹤國內(nèi)某大學英語專業(yè)學生四年時間,收集不同階段口語語料,基于語料庫的方法,從多方面探討學習者口語語塊的發(fā)展性特征。研究表明:學習者口語中使用語塊的數(shù)量、種類與語塊自身的長度成反比;學習者口語表達時過分依賴名詞+動詞語塊、名詞語塊和動詞語塊,而較少使用介詞語塊,與本族語者之間存在明顯差別;隨著學習者英語水平的提高,其使用語塊的數(shù)量呈現(xiàn)正態(tài)增長趨勢。研究結(jié)果對中國英語學習者語塊習得與教學具有啟發(fā)意義。
英語學習者; 口語語塊; 發(fā)展特征
過去二十多年來,在二語習得領域,語塊習得成為人們關(guān)注的焦點。研究發(fā)現(xiàn)人類語言中存在大量塊狀結(jié)構(gòu),這種塊狀結(jié)構(gòu)作為獨立的整體單位儲存于人類大腦的語言中樞系統(tǒng),并以類似網(wǎng)絡的形式相互聯(lián)系、交織在一起[1]25。人們在使用語言時,這樣的塊狀結(jié)構(gòu)有利于說話人從大腦中快速識別與提取出所需的語言單位,從而降低大腦信息處理負荷,提高語言處理的速度與效率。熟練的語言使用者大腦中儲存了大量的語塊,說話時將大量語塊建立聯(lián)系,成串地連接起來,進而實現(xiàn)意義的表達[2]。因此,語塊水平通常作為衡量學習者英語水平高低的標準之一。人們普遍認為對于學習者來說,大腦中記憶與儲存大量目標語語塊是其語言水平達到或接近本族語者水平的關(guān)鍵[3]。也就是說,英語學習者能否熟練掌握并使用目標語,在一定程度上取決于大腦中所掌握語塊量的多少。
目前國內(nèi)涉及語塊的研究主要有幾個方面:一是中國英語學習者書面語中語塊的使用特征研究,如濮建忠[4]、李文中[5]、管博和鄭樹棠[6]、王立非和張巖[7]、許家金和許宗瑞[8]、馬廣惠[9]等;二是語塊使用情況與英語水平之間的關(guān)系研究,如丁言仁和戚焱[10]等;三是研究英語學習者語塊知識的掌握情況,如黃強[11]、刁琳琳[12]、濮建忠[13]、張軍和李文中[14]、張建琴[15]等。從以上研究不難看出,多數(shù)學者針對中國英語學習者的二語語塊習得狀況進行橫斷描述,而對學習者語塊發(fā)展特征研究較少,特別是針對中國英語學習者口語語塊發(fā)展特征開展的研究更少。本研究跟蹤國內(nèi)某大學英語專業(yè)兩個自然班學生四年時間,收集不同階段學生口語語料,從多個方面分析學習者口語中語塊的使用情況。
(一)語塊的界定
關(guān)于語塊的研究最早可追溯至上個世紀20年代,Jesperson首次提出“程式語”的概念,用來指代不同于一般語言表達的一類特殊表達方式;它不是說話人按照某種語言規(guī)則生成的,而是作為一個整體拿來即用[16]。之后Fillmore、Brown和Bolander沿用并完善了Jesperson的定義,強調(diào)語言使用中語塊的預制性與易提取性[17-19]。在語料庫語言學領域,影響較大的是Wray對語塊的定義,即“整體儲存在大腦中的一連串連貫或不連貫的詞語或意義單元,人們在使用時直接提取,無需根據(jù)語法規(guī)則進行生成與分析”[20]9。
目前學界對語塊尚未形成統(tǒng)一的定義,據(jù)不完全統(tǒng)計,英語中至少存在40多種不同的叫法[20]9。近些年來,國內(nèi)學者使用較多的術(shù)語有語塊、詞塊、詞串、多詞序列、預制詞塊、N元組合等。由于研究目標不同,所使用的術(shù)語及其分類會有所差異。本研究使用“語塊”一詞,主要指的是語料中出現(xiàn)頻率較高、功能上能夠表達完整意義、且至少由兩個詞匯構(gòu)成的連續(xù)詞語序列。
(二)語塊的分類
目前學者對語塊進行分類,主要基于兩個標準:一是語塊的結(jié)構(gòu)特征,二是語塊的功能。最早對語塊進行分類的學者是Beeker,他從英語口語和書面語中提取語塊,并從結(jié)構(gòu)上把語塊劃分為六種類型:聚合詞語、限制型短語、元語篇、句子構(gòu)成成分、情景會話和原文片段[21]。同樣,基于其結(jié)構(gòu)特征,Nattinger和DeCarrico把語塊分為多元語塊、慣用語語塊、短語語塊以及句子構(gòu)建語塊[22]33。其次是根據(jù)語塊的功能進行分類。Pawley和Syder根據(jù)語塊在語篇中的功能,將其劃分為多詞詞匯、常用表達式、限制型短語以及句型框架四類[1]205;而Lewis將語塊分為具有習語性質(zhì)的聚合詞(如on the end)、共現(xiàn)率較高的搭配詞(v+n、adj+n等)、形式上固定以及半固定且具有一定語用功能的單詞序列(如if I were you)、句子框架引導詞(secondly、finally)等四類[23]。除以上學者的分類外,還有其他學者也對語塊進行過分類。限于篇幅,在此不一一贅述。
(一)研究問題
本研究重點回答以下兩個問題:一是英語學習者口語中常用語塊的總體特征是什么?二是在不同學習階段,英語學習者使用不同類別語塊時有何異同?體現(xiàn)了哪些發(fā)展性特征?
(二)數(shù)據(jù)收集
本研究所用語料來自于國內(nèi)某大學2012級英語專業(yè)兩個自然班的62名學生。從2012年9月開始,至2016年5月結(jié)束,筆者利用近四年時間,跟蹤英語專業(yè)兩個自然班的62名學生口語發(fā)展狀況。其中女生55人,男生7人。語料收集采用口語測試的方式,即提前5分鐘給定學生題目,要求學生圍繞題目發(fā)表觀點??荚嚥扇为殰y試的方式,每位考生均有5分鐘準備時間?;A階段即一、二年級時,測試時間為2分鐘,另有1分鐘回答問題時間,要求回答主考教師根據(jù)給定題目即席提出的問題;高級階段即三、四年級時,要求學生圍繞特定話題談論3分鐘,無回答問題環(huán)節(jié)。學生每次測試的內(nèi)容相同,即每次考試只提供一個話題。為保證考試公平公正,所有參加測試學生集中候考,測試結(jié)束后離開。學生所答內(nèi)容全程錄音,之后將錄音轉(zhuǎn)寫并整理,輸入計算機,創(chuàng)建小型語料庫。語料詳細情況見表1。

表1 語料收集情況
① 三年級時出國1人,四年級時1人修學,1人因故無法參加,總?cè)藬?shù)少了3人,3人均為女生。
(三)數(shù)據(jù)處理
語料收集完成之后,利用TreeTagger 3.0附碼軟件②該軟件為梁茂成的TreeTagger for Windows(Multilingual Edition)3.0.軟件,2013版。下載網(wǎng)址:http://www.bfsu-corpus.org/channels/tools。對語料進行詞性附碼,之后利用WordSmith Tools 6.0對語料中符合要求的語塊進行提取,并統(tǒng)計分析。因四個年級所收集語料多少不等,在對語塊進行統(tǒng)計分析時,同時提供標準化頻數(shù),即每1萬詞出現(xiàn)的頻數(shù)。本研究主要考察學習者口語中語塊的使用情況,相比較書面語而言,口語語料的收集更加費時費力。加上本研究屬于耗時較長的跟蹤研究,語料收集需要克服更大困難。參照已有文獻,本研究把語塊的界定標準適當降低,具體標準為:2詞≥10次/萬詞、3詞≥5次/萬詞、4詞及以上≥3次/萬詞。只要標準化頻數(shù)達以上標準,即認定為語塊中的一種。
(一)語塊使用總體特征
據(jù)表2顯示,學習者口語中語塊使用總體情況基本符合預期,學習者使用語塊的數(shù)量、種類與語塊自身的長度成反比。也就是說,2詞語塊使用數(shù)量最多,頻數(shù)達到3 834次,共計628種。隨著語塊長度的增加,如3詞語塊、4詞語塊等,其使用數(shù)量呈明顯的下降趨勢。特別是6詞及6詞以上語塊共出現(xiàn)394次,總數(shù)只有32種。從標準化頻數(shù)來看,隨著語塊長度的增加,使用數(shù)量下降趨勢非常明顯。從2詞語塊的312.6個/萬詞下降到6詞及6詞以上語塊的32.1個/萬詞。這與De Cock和Biber針對學習者書面語得出的研究結(jié)論基本吻合:基于相同標準的情況下,學習者使用的語塊越長,其數(shù)量與種類就越少[24][25]69。隨著語塊長度的增加,反映在數(shù)量與種類方面的遞減趨勢非常明顯。

表2 學習者語塊使用總體情況
根據(jù)Biber的研究發(fā)現(xiàn),本族語者每萬詞使用的3詞語塊為25個,4詞語塊為20個[25]66。與本族語者相比,在3詞與4詞語塊的使用上(標準化頻數(shù)分別達到了183.2與112.9),貌似學習者口語中使用更多語塊。但需要說明的是,本研究在提取語塊時,對語塊的界定標準更加寬泛。此外,從學習者的學習特點來看,過度重復使用某些熟悉的語塊是二語習得過程中的一個共性。特別是在詞匯量有限的情況下,學習者使用的語塊豐富程度遠遠不夠。這與De Cock的研究發(fā)現(xiàn)一致。
(二)語塊詞性分布情況
為進一步了解中國英語學習者口語中語塊的分布情況,我們對語料中2~6詞及6詞以上語塊進行提取,并統(tǒng)計分析他們的詞性。之所以把6詞及6詞以上語塊統(tǒng)計在內(nèi),是在提取過程中發(fā)現(xiàn),盡管此類語塊只有32種,多數(shù)屬于教材中出現(xiàn)的慣用語及常用句式,但該類語塊的熟練運用在一定程度上能夠體現(xiàn)學習者的語言水平。根據(jù)Biber的分類[25]66,提取并歸類后,在學習者口語語料中共發(fā)現(xiàn)9類語塊,分別是名詞+動詞語塊①按照Biber(1999)的做法,“代詞+動詞”語塊也歸為此類,即“名詞+動詞”結(jié)構(gòu)。、名詞語塊、動詞語塊、連詞語塊、介詞語塊、形容詞語塊、to語塊、慣用語語塊、從句語塊。此外,還有少部分無法歸入以上9類,也沒有較為明顯的一致特征,按照Biber的做法,將其歸為“其他”一類。語塊具體詞性分布情況見表3。

表3 學習者口語語塊詞性分布情況統(tǒng)計
從表3可以看出,學習者口語中使用最多的語塊主要有3類,分別是名詞+動詞語塊、名詞語塊和動詞語塊,百分比分別達到了28.2%、22.7%和19.6%。如果把三者相加,百分比達70.5%。特別是第一類名詞+動詞語塊,其數(shù)量占到了語塊總數(shù)的近1/3。這表明學習者在口語表達中傾向于使用傳統(tǒng)的主語+謂語結(jié)構(gòu)。此外,名詞語塊占到了1/5強,說明學習者在使用英語表達時明顯受到母語的影響??傮w來看,漢語中以名詞為核心的名詞短語結(jié)構(gòu)比英語要多得多,這與本族語者的語塊分布情況有明顯差別。Biber通過分析本族語者口語與書面語后發(fā)現(xiàn),本族語者表達時最常用的成分為動詞語塊,常用句式結(jié)構(gòu)為名詞(人稱代詞)+動詞+補語[25]112。對于本族語者來說,介詞語塊運用也較多,在部分語體如學術(shù)論文中能夠占到語塊總數(shù)的1/3以上。這從一定程度上說明中國英語學習者口語表達時,語塊量及相關(guān)目的語知識的儲備不夠,母語遷移現(xiàn)象明顯,表達思想時很大程度上依賴于漢語中常見句式結(jié)構(gòu)。學習者口語語塊詞性分布還有一個明顯特征,是從句語塊數(shù)量偏少,僅占語塊總量的0.8%。這不但大大低于本族語者的從句語塊使用比例,而且與學習者書面語中該類語塊相比,其使用量明顯偏低。
(三)不同階段英語學習者口語語塊特征分析
通過對不同階段英語學習者口語語塊的對比分析,我們發(fā)現(xiàn)了以下特征:
第一,隨著學習者英語水平的提高,其使用語塊的數(shù)量呈現(xiàn)正態(tài)增長趨勢。即學習者英語水平越高,其使用的語塊數(shù)量越多,種類也越豐富。從其標準化頻數(shù)來看(詳見表4),一年級時所有語塊共出現(xiàn)4 993次、821種,每萬詞出現(xiàn)的頻數(shù)為407.1次;隨著英語水平的提高,二年級時,語塊種類增加到了897種,頻數(shù)增長了近1 000次,達到5 842次;到了大學四年級,學習者使用的語塊種類達到了1 017種,共出現(xiàn)6 425次。從一定程度上來說,特定學習階段內(nèi)中國英語學習者口語中所用語塊的數(shù)量與種類會隨著語言水平的提高而增加,基本呈現(xiàn)出線性增長的趨勢。

表4 不同年級學習者語塊使用情況
第二,詞匯性語塊(Lexical chunks,也稱為Lexical phrases)的使用量隨著英語水平的提高而增長。Ketko研究發(fā)現(xiàn),與其他類語塊相比,詞匯性語塊的使用更能體現(xiàn)學習者的英語水平[26]。本研究專門對不同年級學習者口語中的詞匯性語塊使用情況進行提取與分析。在對詞匯性語塊進行識別時,參考了Nattinger和DeCarrico的做法,按照
其功能特點進行界定[22]112。他們的主要特點有:一是非形成性,即語義上具有約定俗成的特點,而不是根據(jù)具體語境臨時構(gòu)成;二是穩(wěn)固性,即語塊的形式相對穩(wěn)固,特殊情況下可以留有缺詞,比如“___days ago”,但其基本形式高度穩(wěn)定;三是具有慣用語特點,即在一定的語境下使用,其用法已經(jīng)形成慣例;四是具有特定功能,如打招呼用的“How are you?”等。在對不同年級學習者使用的語塊進行提取后,按照以上特征進行人工篩選①因人工篩選工作量較大,該部分僅對2012—2015年秋季學期采集的語料進行處理,春季學期的語料暫未處理。,剔除非詞匯性語塊。然后按照語塊的功能,將符合條件的語塊分主題相關(guān)語塊、語篇構(gòu)造語塊、交際功能語塊和其他語塊4個類別分別統(tǒng)計。統(tǒng)計結(jié)果見表5。
表5詳細反映了不同水平的英語學習者口語中詞匯性語塊的使用情況。首先,從詞匯性語塊的使用總數(shù)來看,不同年級學生之間并不存在明顯差異。一年級學生口語中使用的詞匯性語塊總數(shù)為2 935個,四年級學生使用了3 360個。四年級學生在使用數(shù)量上較一年級時有所提高,但一、二年級之間,二、三年級之間差別較小,進入高年級階段,使用數(shù)量沒有大幅度增多。其次,隨著英語水平的提高,學習者使用詞匯性語塊的頻率越來越高。一年級時,30 380詞的口語語料中共使用詞匯性語塊2 935個,平均每12.21個詞使用1次;二、三年級時,詞匯性語塊使用率分別下降到了11.7和9.66;四年級達到8.24。也就是說,二年級時學生口語中平均每11.7個詞會使用一個詞匯性語塊,三年級平均每9.66個詞使用一個詞匯性語塊,四年級學生在口語中平均每8.24個詞就使用一個詞匯性語塊??梢姡瑢W習者英語水平越高,口語中使用詞匯性語塊越頻繁。

表5 不同年級學習者詞匯性語塊使用情況②詞匯性語塊使用頻率的計算方法為語料總詞數(shù)減去詞匯性短語詞數(shù)之后除以詞匯短語總數(shù)。
下面分析不同水平英語學習者在使用不同類型詞匯性語塊方面表現(xiàn)出來的特征。首先是主題相關(guān)語塊。從表5來看,各年級之間不存在顯著差異。一年級學習者共使用了792個,占所有詞匯性語塊的27%;四年級使用該類語塊974個,占總數(shù)的29%。由此看出,英語學習者不管語言水平的高低,其口語表達均能緊扣主題,始終圍繞主題展開。其次是語篇構(gòu)造語塊,在該類語塊的使用方面,學習者不同階段表現(xiàn)出的差別非常明顯。一年級共使用263個語篇構(gòu)造類語塊,占詞匯性語塊的9%;隨著學習水平的提高,二年級語篇構(gòu)造語塊所占比例提高到了14%;四年級語篇構(gòu)造語塊使用量最多,所有語料中共使用了741個,占總數(shù)的22%。這說明隨著英語水平的提高,學習者能夠更多使用語篇構(gòu)造語塊,以增加話語的流利性與連貫性。第三是交際功能語塊。單從表5來看,四個階段學生口語中使用該類語塊的情況稍有差別,從一年級的24%增長到四年級的30%,呈現(xiàn)緩慢增長趨勢。但在對不同年級提取出的交際功能語塊進行定性分析時,我們發(fā)現(xiàn)不同語言水平學習者表現(xiàn)出顯著差異。例如學習者在一年級時使用最多的交際功能語塊是“I think”,占到了此類語塊總數(shù)的近30%。盡管四年級學生也用了很多“I think”,但比例已大大降低。第四是與低年級相比,學生高年級階段口語中使用詞匯性語塊的種類更加豐富,變化更加多樣。在表達同一內(nèi)容時,學生能夠選擇不同語塊進行自由表達,這恰恰是低年級時所欠缺的。
本研究基于語料庫的方法,通過跟蹤國內(nèi)某大學英語專業(yè)兩個自然班學生,重點探討了英語學習者口語中語塊使用的頻率、種類、詞性分布以及詞匯性語塊的使用情況。通過分析,我們得出以下結(jié)論:一是學習者口語中語塊使用總體情況基本符合預期,學習者使用語塊的數(shù)量、種類與語塊自身的長度成反比。二是英語學習者口語表達時過分依賴名詞+動詞語塊、名詞語塊和動詞語塊,較少使用介詞語塊,這與本族語者之間存在差異。三是隨著學習者英語水平的提高,其使用語塊的數(shù)量呈正態(tài)增長趨勢。即學習者英語水平越高,其使用的語塊數(shù)量越多,種類也越豐富。四是在詞匯性語塊使用方面,不同水平學習者盡管在不同類型語塊的使用方面存在差異,但其使用總量會隨著英語水平的提高而增長。
本研究還存在不足之處。雖然利用語料庫的方法,但該研究基于小樣本進行調(diào)查,要想深入研究英語學習者口語語塊的發(fā)展特征,還需擴大研究樣本。此外,為了增加研究結(jié)果的客觀性,研究形式可更加多樣化,如增加學生訪談、問卷調(diào)查等。期待英語教學界同仁今后對此進行更加深入的探討。
[1] PAWLEY A,SYDER H.Two puzzles for linguistic theory:native-like selection and native-like fluency [C]//RICHARDS J,SCHMIDT R.Language and communication.New York:Longman,1983.
[2] SINCLAIR J.Corpus,concordance,collocation[M].Oxford:Oxford University Press, 1991:16.
[3] 劉國兵.中國英語學習者虛化動詞TAKE詞匯型式研究[J].當代外語研究,2011(10):58-63.
[4] 濮建忠.中國學生英語動詞語法和詞匯型式使用特點初探[J].現(xiàn)代外語,2000(1):24-44.
[5] 李文中.基于COLEC的中介語搭配及學習者策略分析[J].河南師范大學學報(哲學社會科學版),2004(5):202-205.
[6] 管博,鄭樹棠.中國大學生英語寫作中的復現(xiàn)組合[J].現(xiàn)代外語,2005(3):288-296.
[7] 王立非,張巖.大學生英語議論文中高頻動詞使用的語料庫研究[J].外語教學與研究, 2007(2):110-116.
[8] 許家金,許宗瑞.中國大學生英語口語中的互動話語詞塊研究[J].外語教學與研究,2007 (6):437-443.
[9] 馬廣惠.英語專業(yè)學生二語限時寫作中的詞塊研究[J].外語教學與研究,2009(1):54-60.
[10] 丁言仁,戚焱.詞塊運用與英語口語和寫作水平的相關(guān)性研究[J].解放軍外國語學院學報,2005(3):49-53.
[11] 黃強.高年級英語學生詞匯搭配習得的實證性研究[J].解放軍外國語學院學報,2002 (4):76-79.
[12] 刁琳琳.英語本科生詞塊能力調(diào)查[J].解放軍外國語學院學報,2004(4):35-38.
[13] 濮建忠.英語詞匯教學中的類聯(lián)接、搭配及詞塊[J].外語教學與研究,2003(6):438-445.
[14] 張軍,李文中.COLEC中動名搭配模式及失誤分析[J].外語教學,2004(4):30-32.
[15] 張建琴.中國高、中、初級英語學習者詞匯短語使用的對比研究[J].外語界,2004 (1):10-14.
[16] JESPERSEN O.Living grammar[M]//BOR-NSTEIN D D.Readings in the theory of grammar.Cambridge:MA Winthrop Publishers,1976:82.
[17] FILLMORE L W.The second time around co-gnitive and social strategies in second language acquisition[D].Stanford:Stanford University,1976.
[18] BROWN R.A first language[M].London:Allen & Unwin,1973.
[19] BOLANDER M.Prefabs, patterns and rules in interaction? Formulaic speech in adult lea-rners’ L2 Swedish[M]//HYLTENSTAM K,OBLER L K.Bilingualism across the lifespan.Cambridge:Cambridge University Pre-ss,1989:73-86.
[20] WRAY A.Formulaic language and the lexicon[M].Cambridge:Cambridge University Press,2002.
[21] BEEKER J.The phrasal lexicon[M]//SHANK R,NASH-WWBBER B I.Theoretical issues in natural language processing.Cambridge:Bolt Beranek and Newman,1975: 60-63.
[22] NATTINGER J,DECARRICO J.Lexical phr-ases and language teaching[M].Oxford: Oxford University Press,1992.
[23] LEWIS M.Pedagogical implications of the lexical approach [M]//COADY J, HUCKIN T.Second language vocabulary acquisition.Cambridge:Cambridge University Press,1997:255-270.
[24] DE COCK S,GRANGER S,LEECH G,et al.An automated approach to the phrasicon of EFL learners [C]//GRANGER S.Learner English on computer.London:Longman,1998: 78.
[25] BIBER D,JOHANSSON S,LECCH G,et al.Longman grammar of spoken and written English[M].London:Pearson Education Limited,1999.
[26] KETKO H.A comparative study in the use of multi-word chunks between English native speakers and Japanese learners of English[D].Birmingham:Aston University,2000.
(責任編輯:李曉梅)
The Developmental Features of Learners’ Chunks in Written Corpus
LIU Guobing
(Faculty of Foreign Languages, Henan Normal University, Xinxiang, Henan 453007, China)
Based on the spoken materials collected from the English majors in the past four years, the developmental features of Chinese EFL learners’ chunks in their spoken English are reported. The results indicate that there is an inverse increase between the length of learners’ spoken chunks and their number and type. Chinese EFL learners depend too much upon the n.+v. chunks, n. chunks and v. chunks, but use less prep. chunks. With the development of learners’ English ability, they use more and more chunks in their spoken English.
English learner; chunks in written English; developmental feature
2017-04-20
國家社會科學基金項目“英語學習者書面語語篇連貫自動評價系統(tǒng)研究”(14BYY084)
劉國兵(1978—),男,河南滑縣人,河南師范大學語料庫應用研發(fā)中心學術(shù)帶頭人,校聘教授,外國語言學及應用語言學博士,碩士生導師,研究方向:語料庫語言學及外語教學。
H319.3
A
1674-0297(2017)04-0111-06