語料庫顧名思義就是存放語言材料的倉庫。現在人們談起語料庫不言而喻地指存放在計算機里的原始語料文本或經過加工后帶有各種語言學信息標注的文本。語料庫語言學是基于語料庫提供的語言材料展開的語言研究。因此,語料庫語言學與其說是一個新學科的名稱,還不如說它是一個新的語言研究手段。近年來,隨著各種大型語料庫的建立和語料庫檢索工具的研發,語料庫以其容量大、語料真實、檢索快捷準確等獨特的優勢在現代語言學研究和語言教育中發揮著越來越重要的作用(何安平1997)。然而迄今為止,語料庫還未在國內各級學校的英語教育中得到廣泛應用。因此,本文試圖通過基于語料庫的中國英語學習者習得原因狀語從句的調查研究,來展示語料庫語言學在英語教學與研究中的應用及其優越性并同時得出對英語詞匯教學的啟示。
研究設計和數據統計
原因狀語從句是中國學習者最先掌握的狀語從句之一。在英語中,原因狀語從句可以由because,since,as,for等連詞引導。其中because為最常用的連接詞,所連接的主從句表達了強烈的因果關系。本研究的調查對象是國內非英語專業大學二年級的英語學習者,共使用了兩個語料庫:中國學習者英語語料庫(CLEC)和自行建立的英語本族語語料庫(NEC)。
中國學習者英語語料庫由廣東外語外貿大學桂詩春教授和上海交通大學楊惠中教授領銜編著,于2003年建成。該語料庫運用語料庫語言學和計算機科學技術建成一個包括我國中學生、大學英語4級和6級、英語專業低年級和高年級學生在內的共五個子庫一百多萬詞的書面英語語料庫(ChineseLearner English Corpus,簡稱CLEC),并對所有的語料進行語法標注和言語失誤標注,是世界上第一部正式向外公布的含有言語失誤標注的英語學習者語料庫。
自行建立的在文章體裁和主題上與CLTST4相匹配的英語本族語語料庫(NEC)包括了80篇總詞數為42,221的文章。這些文章選自大學非英語專業一、二年級學生所用的教材《大學體驗英語》3、4冊和《新概念英語》第4冊。
本文選取了中國學習者英語語料庫中的全國大學英語六級考試作文子語料庫即CLTST4中的部分語料,并以其中由because,since,as,for引導的部分原因狀語從句為例,以NEC語料庫中的原因狀語從句作為參照對象,通過對比分析,研究中國學習者對英語原因狀語從句的習得情況。研究方法和步驟如下:

(1)隨機選取CLTST4中的部分語料和建立英語本族語語料庫(NEC)。
(2)借助語料庫的檢索工具Miero Comeord(MCO)在兩個英語語料庫中對because,smee,as,for進行檢索,正確統計它們在語料庫中的出現頻率,以考察中國學習者使用because,since,as,for時有別于英語本族語者的現象。
(3)采用MCO對CLTST4和NEC兩個語料庫中because,since等的出現頻率分別進檢索和歸類分析,得出以下結果:

(在NEC語料庫中,檢索到since共有19處,其中引導原因狀語從句的有9處。在CLTST4語料庫中,檢索到since共有6處,其中引導原因狀語從句的有3處。)
結果與討論
由上表可以看出,中國學習者使用because的頻率遠遠高于本族語者使用的頻率,比例接近3:1,而且還遠遠高于其它原因狀語從句連接詞的頻率。而在英語中,原因狀語從句可以由because,since,as,for等連詞引導。因此我們可以推斷:中國學習者比以英語為母語的本族語者過多地使用because引導的原因狀語從句,而很少使用since,as,for來引導原因狀語從句。在中國學習者的英語學習過程中,他們最先接觸了because引導的原因狀語從句,其后在原因狀語從句中頻繁使用的也是because這個連接詞,這就表明大學非英語專業學生在作文詞匯選擇方面過分依賴中學詞匯來表達英語思維。一篇文章的好壞雖然不以用詞的難易作為唯一評判標準,然而僅僅用高中英語詞匯甚至初中英語詞匯寫出的文章按照大學生的標準要求顯然過于簡單甚至淺顯(蔡焱2005)。另外大多數中國英語學習者認為since表達“自從……”的意思,as意為“正如……;作為……”,for相當于漢語的“為了……”或者作為介詞表示“由于……”,而且通過對兩個語料庫的檢索也證明了這一點。還有的學生知道這三個詞也可以引導原因狀語從句,但是又不太確定或是不知道怎樣使用,因而大多采用回避、消極的選詞策略,反映在寫作中就是在表達原因狀語從句的時候過多地使用because,而較少使用since,as,for甚至完全忽略。這樣就導致詞匯不豐富,復現率過高。
另外原因還有可能是NEC語料庫中的文章篇數只有80篇,每篇文章的篇幅在500詞左右,而CLTST4語料庫中所含的文章篇數超過400,大部分語料分別來自CET六級的試卷作文,學習者在命題作文里為了闡明觀點往往需要借助更多的因果關系結構,因而導致中國學習者使用because的頻率遠遠高于本族語者的使用頻率。
結論
本文通過語料庫的調查研究和統計分析,就學習者和英語本族語者在使用引導原因狀語從句的連接詞上做出了一個相對客觀、真實的描述,我們認為為了有效地提高學生二語習得過程中詞匯表達方面的能力,必須督促學生擴大詞匯量,要引導學生多注意詞義的學習,掌握單詞的恰切英文釋義,并讓學生養成在語境中學習詞匯的習慣,熟悉詞語用法,多辨析同義詞、近義詞。
本文的意義主要在于使用語料庫及檢索工具和檢索結果對詞進行研究的方法,而且這些真實的數據會對英語教學與研究具有積極的作用。教師可以通過學習者語料庫了解學習者在英語使用方面的大量的真實情況,通過英語本族語語料庫向學生展示英語本族語者使用語言的真實情況,鼓勵學生在英語詞語的使用上遵循英語本族語者的習慣。