王家義 李德鳳
(1.湖南工程學(xué)院 外國語學(xué)院,湖南 湘潭 411104;2.澳門大學(xué) 人文學(xué)院,澳門)
詞匯知識在語言學(xué)習(xí)中至關(guān)重要。已有的研究主要集中于詞匯知識的廣度、深度以及二者的關(guān)系上(Haastrup et al., 2000; Read,2000; Bogaards et al., 2004; Milton, 2009; Akbarian,2010 )。詞匯的廣度主要指語言學(xué)習(xí)者擁有詞匯量的數(shù)量(Nation 2013),即詞匯量的大小。詞匯深度是指語言學(xué)習(xí)者在多大程度上了解一個詞(Read, 1993, 2000)。二者是密切相關(guān),不可分離的關(guān)系(Milton 2009)。研究表明,詞匯知識具有復(fù)雜性和多層面性,涵蓋了詞匯的發(fā)音、拼寫、語域、語體、形態(tài)特征(Richards 1976; Haastrup et al.,2000; Nation, 2013),以及與其他詞匯一起構(gòu)詞的句法、語義關(guān)系,包括搭配、同義反義、上下義關(guān)系等(Chapelle, 1994; Henriksen, 1999; Read, 2000)。
國內(nèi)學(xué)者對二語詞匯廣度的研究重點(diǎn)討論了英語學(xué)習(xí)者詞匯量的調(diào)查,詞匯的獲取與詞匯量的擴(kuò)大,詞匯量與語言綜合能力的關(guān)系等(桂詩春,1985; 喻愛菊,1991; 周大軍, 文渤燕, 陳莉,李春榮,1999; 周大軍, 文渤燕,2000; 鄧昭春,2001; 邵華,2002)。隨著二語詞匯知識的理論探討和實(shí)證研究的深入,詞匯研究的重點(diǎn)從詞匯量或詞匯寬度的發(fā)展轉(zhuǎn)移到對詞匯深度習(xí)得的研究(劉紹龍 2001:436)。國內(nèi)學(xué)者開展了一系列英語詞匯深度的實(shí)證研究和量化分析(劉紹龍,2001; 濮建忠,2003; 李曉陸,2004; 呂長竑,2004; 李曉,2007; 張萍,2009)。他們的研究嘗試從“深度”的層面分析二語學(xué)習(xí)者的詞匯知識習(xí)得模式、發(fā)展路徑和具體特征,并為詞匯教學(xué)提供建議和參考。總體上這些研究更多的側(cè)重詞匯深度與語言綜合能力的關(guān)系,通常以二語學(xué)習(xí)者的作文為語料進(jìn)行對比分析。目前詞匯深度習(xí)得的另一方面,即針對具體詞匯如何開展英語詞匯深度學(xué)習(xí)與教學(xué),哪些資源可以幫助學(xué)習(xí)者開展英語詞匯深度分析等問題的研究尚不多見。基于此,本研究在簡要介紹BNCweb (CQP-Edition)的使用后,以“commit”為例通過具體操作從詞匯深度的不同層面探討基于BNCweb (CQP-Edition)的英語詞匯深度分析方法。
了解了一個詞的音、形、義,只能說是完成了對該詞的認(rèn)知,而要真正掌握一個詞就必須知道該詞的詞匯深度知識。Richards (1976)首先提出了詞匯知識的七大標(biāo)準(zhǔn),即:(1)單詞的頻率預(yù)測和同義聯(lián)想;(2)單詞使用的得體性;(3)單詞的句法行為或語法特征;(4)單詞的基本形式和派生形式;(5)詞間聯(lián)想;(6)概念意義;(7)一詞多義。這七大標(biāo)準(zhǔn)實(shí)際囊括了構(gòu)成個體單詞知識的七個不同層面和能力(肖善香 等,2003:85)。之后, Richards (1985)又把掌握詞匯知識概括為: (1)知道在口語或書面語中遇到該詞的概率;(2)知道該詞的句法行為;(3)知道該詞與其他詞構(gòu)成的關(guān)聯(lián)網(wǎng)絡(luò)。
在Richards的基礎(chǔ)上,Nation(1990)提出了詞匯多維框架理論,他認(rèn)為,了解一個詞意味著知道它的形式(口頭和書面)、位置(語法句型、搭配)、功能(頻率、得體性)和意義(概念意義、聯(lián)想意義)(Laufer et al., 1998:367)。
隨著語料庫語言學(xué)的興起,基于語料庫的詞匯共選理念和工作程序被廣泛應(yīng)用于詞匯教學(xué)與研究。在語料庫研究的基礎(chǔ)上,研究者(Sinclair et al.,1988; Willis 1990; Lewis 1993)提出了詞匯大綱和詞匯中心教學(xué)法的思路和設(shè)想并得到廣泛認(rèn)同,詞項作為語言的基本單位被放在了更加突出的位置。Sinclair & Renouf (1988:148)明確指出英語教學(xué)的重點(diǎn)應(yīng)放在:(1)語言中最常見的詞形;(2)這些詞形的核心用法模式(patterns of usages);(3)它們的典型組合(combinations)。
在對詞匯知識構(gòu)成成分的分類描述、分析詞匯的意義和用法的基礎(chǔ)上,借助語料庫語言學(xué)的研究方法和技術(shù)手段,本研究認(rèn)為詞匯深度分析的維度應(yīng)包括以下幾個方面:(1)詞的語域分布(口頭、書面);(2)詞的常見使用形式;(3)詞的核心用法模式(類聯(lián)結(jié));(4)詞的典型搭配;(5)詞的語義傾向(語義韻)。
BNC(英國國家語料庫)是較早被介紹并引入國內(nèi)的大型語料庫(張煤,1997; 王建新,1999; 李賽紅,2002)。目前該庫已成為最常用、最權(quán)威的參照語料庫之一,為推動語料庫語言學(xué)的發(fā)展和研究做出了巨大貢獻(xiàn)。
隨著“網(wǎng)絡(luò)語料庫”(WaC,Web as Corpus)和“云計算”(cloud computing)的興起,有學(xué)者研究開發(fā)了在線檢索語料庫工具,如WebCorp(A. Renouf)、Phrase in English(W. Fletcher)、BYU系統(tǒng)(M. Davies)、Sketch Engine(A. Kilgarriff)、BNCweb(S. Hoffmann等)和CQPweb(A. Hardie)(許家金 等,2014:10)。根據(jù)McEnery & Hardie ( 2011:37-48)對語料庫分析工具的進(jìn)時代劃分,上述檢索工具[基于瀏覽器—服務(wù)(B/S)模式的語料庫檢索工具]屬于第四代語料庫分析工具。基于網(wǎng)絡(luò)的第四代語料庫分析工具實(shí)現(xiàn)了語料庫與分析工具合二為一,降低了語料庫使用技術(shù)得門檻。不僅使普通用戶可以像瀏覽網(wǎng)頁一樣輕松便捷地使用語料庫,也便于語料庫專業(yè)人員深入、充分地挖掘語料庫資源。
基于CQP的BNCweb是語料庫與分析工具合二為一的第四代語料庫工具的典型代表(參見https:∥cqpweb.lancs.ac.uk/bncxmlweb/)。作為開源語料庫,BNCweb (CQP-Edition)的用戶界面友好、操作簡便靈活,主界面見圖1。BNCweb (CQP-Edition)不僅實(shí)現(xiàn)了語料庫的在線檢索,而且支持更復(fù)雜的高級檢索。相比第三代語料庫工具BNCweb (CQP-Edition)的用戶檢索響應(yīng)速度更快,操作更簡單,功能更全面。能實(shí)現(xiàn)的主要功能包括:(1)在線生成語料庫的詞頻表(frequency list);(2)查詢(query)字詞、語言結(jié)構(gòu)等,以獲取大量語言實(shí)例或相應(yīng)結(jié)構(gòu)的出現(xiàn)頻次(frequency),并可以按語體、年代、性別、難度、寫作題材等分別呈現(xiàn)查詢結(jié)果;(3)計算特定詞語在語料庫中的典型搭配(collocation);(4)計算語料庫中的核心關(guān)鍵詞(keywords)等。BNCweb (CQP-Edition)對檢索結(jié)果還可進(jìn)行包括搭配計算等在內(nèi)的后續(xù)操作(見表1)。

圖 1:BNCweb (CQP-Edition) 語料庫查詢界面

New query新查詢Thin查詢結(jié)果隨機(jī)抽樣Frequency breakdown頻數(shù)分解Distribution查詢結(jié)果的分布展示 Sort查詢結(jié)果排序設(shè)定Collocations搭配計算Download下載保存查詢結(jié)果Categorise hits對檢索結(jié)果手工分類標(biāo)注 Save current set of hits保存檢索結(jié)果
英語中一些實(shí)詞(如名詞、動詞)等存在多種屈折形式,如TAKE就有take、takes、took、taking、taken五種屈折形式。在BNCweb (CQP-Edition)的查詢界面輸入“{關(guān)鍵詞原形}”我們獲得該詞在BNC中的各種屈折形式。通過輸入“{commit}”(下文中我們用COMMIT表示通過 “{commit}”檢索commit的各種屈折形式),并在檢索結(jié)果右側(cè)New query選項框中選中Frequency breakdown按鈕,點(diǎn)擊后“commit”的各種屈折形式按使用頻率和百分比從高到低分別呈現(xiàn),其結(jié)果見表2。表2中,“commit”有六種詞形,按頻率高低分別為“committed”“commit”“committing”“commits”“commited”和“commiting”。結(jié)果中我們發(fā)現(xiàn)兩個值得注意的情況。其一,“committed”在各種屈折形式中使用頻率最高,超過了其他幾種形式的總和,達(dá)到了所有詞形的67.59%。在BNCweb (CQP-Edition)的查詢結(jié)果中點(diǎn)擊“committed”,語料庫中4486例“committed”居中顯示,在右側(cè)New query選項框中選中并點(diǎn)擊“Thin”(隨機(jī)抽樣)按鈕,并把隨機(jī)抽樣數(shù)量定為23,得到圖2結(jié)果。通過對圖2的分析,我們發(fā)現(xiàn),18例為be+committed,即78%為被動形式,這一結(jié)果表明,“commit”在英語中主要以被動形式出現(xiàn)。其二,我們通常認(rèn)為“commit”的“-ed”形式和“-ing”形式為“committed”和“committing”,即雙寫“t”再加“-ed”和“-ing”。但在BNCweb (CQP-Edition)的查詢結(jié)果中卻出現(xiàn)了“commited”和“commiting”各3次,如:

(1)public art galleries in the area , iscommitedto showing a wide range of fine(2)Chelsea or Arse , although hecommitedhis fair share of blunders(3)down the search for a man whocommitedat least two rapes , because
語料庫的研究以樣本量的龐大取勝,但并不排斥少數(shù)例外情況。Sinclair特別強(qiáng)調(diào),觀察索引行時我們應(yīng)該注重中心性(centrality)和典型性(typicality),在尋找語言規(guī)律的同時應(yīng)容忍大型語料庫中的少數(shù)例外情況(梁茂成 等,2010:70)。我們認(rèn)為以上6例中的“commited”和“commiting”屬于這種例外情況,并不影響本研究的結(jié)果。

表2 COMMIT的詞頻與詞形

圖2 committed抽樣
BNCweb(CQP-Edition)提供了關(guān)鍵詞的在語料庫中的分布情況。查詢結(jié)果后續(xù)操作分項功能中,有一個Distribution按鈕,點(diǎn)擊該按鈕,即可獲得關(guān)鍵詞在BNC中的6類分布情況(如圖3)。包括口筆語(written, spoken),衍生文本類型(Derived text type),文本類型(Text type),文本領(lǐng)域(Text Domain),作者年齡(Age of Author),作者性別(Sex of Author)。
我們對COMMIT在BNC語料庫中的分布情況進(jìn)行了統(tǒng)計。COMMIT在口、筆語中的頻率分別為393和6244,折算成每百萬詞的比例后,頻率分別為37.75和71.03,表明COMMIT更常用于書面語。圖4中的語域分布情況表明,COMMIT在不同語域中的出現(xiàn)概率依次為社會科學(xué)(Social science)、國際事務(wù)(World affairs)、信仰和思想(Belief and thought)、商業(yè)和金融(Commerce and finance)、藝術(shù)(Arts)、應(yīng)用科學(xué)(Applied science)、散文(prose)、自然科學(xué)(Natural and pure sciences)。

圖3 關(guān)鍵詞在BNC語料庫中的語域分布

圖4 “{commit}”在BNC語料庫中的的語域分布
3.3.1 類聯(lián)結(jié)
類聯(lián)結(jié)是語法層面搭配關(guān)系,是比搭配更高一級的抽象(衛(wèi)乃興,2001:22)。類聯(lián)結(jié)體現(xiàn)了有關(guān)詞類或語法類別的共現(xiàn)關(guān)系,是關(guān)于詞語組合類別的抽象表述,而搭配則是類聯(lián)接的具體實(shí)現(xiàn)。衛(wèi)乃興(2001:22)認(rèn)為一個類聯(lián)接代表了一個類別的詞語搭配,可稱為搭配類(collocational class)。比如, V+ N就是一個類聯(lián)接,表示“動詞+名詞”這一類的搭配關(guān)系,而“make money”“take notes”和“give birth”等都是V+ N搭配的具體實(shí)例。

圖5 COMMIT抽樣
本研究中,把COMMIT的索引提取后,發(fā)現(xiàn)commit 的各種屈折形式在BNC中的頻數(shù)為6637。大型語料庫提取索引行后,往往頻數(shù)較多。為避免研究者淹沒于數(shù)據(jù)之中,有學(xué)者如Sinclair(2003)提出,在形成自己的假設(shè)時,首先可以從少量的假設(shè)開始。Sinclair(2003)主張每次從大型語料庫中抽取一屏左右的索引行(約23行)進(jìn)行觀察。參照Sinclair的做法,我們對索引進(jìn)行了隨機(jī)抽樣(23行)。觀察抽樣,我們發(fā)現(xiàn)commit的類聯(lián)接形式主要有以下三類:V+N(13),V+PREP(8)和V+PNX+to(2)。V+N又主要分為“commit+名詞”和“commit+冠詞/修飾詞+名詞”,如“commit crime”“commit a wonderful act”。V+PREP中的PREP主要是介詞to(占88%)。
3.3.2 搭配
搭配是“在文本中實(shí)現(xiàn)一定的非成語意義并以一定的語法形式因循組合使用的一個詞語序列,構(gòu)成該序列的詞語相互預(yù)期,以大于偶然的概率共現(xiàn)”(衛(wèi)乃興,2001:100)。通常我們可以通過觀察索引行來了解關(guān)鍵詞的搭配情況。一定跨距內(nèi)的詞項與關(guān)鍵詞的共現(xiàn)次數(shù)是重要參考指標(biāo),但并不能完全決定關(guān)鍵詞與其他詞項的搭配是否具有顯著意義。語料庫語言學(xué)主要借助統(tǒng)計手段來確定。如計算Z值、MI值等。Z值計算需要考慮關(guān)鍵詞的頻數(shù)、搭配詞的頻數(shù)、跨距、關(guān)鍵詞與搭配詞共現(xiàn)的頻數(shù)和整個語料庫的容量。Z值給人一種把握,使他可以判斷共現(xiàn)的詞語間在多大程度上存在著典型搭配關(guān)系,而非偶然共現(xiàn)(衛(wèi)乃興 等,2005:74)。互信息值(MI)可以測量詞與詞的搭配強(qiáng)度。其意義在于表明兩詞共現(xiàn)的概率。互信息值(MI)值的大小主要取決于兩個頻數(shù)的比值,即搭配詞與關(guān)鍵詞共現(xiàn)的頻數(shù)和搭配詞在語料庫中的總頻數(shù)之比。
BNCweb(CQP-Edition)提供了計算特定詞在語料庫中的典型搭配的多種供選擇的統(tǒng)計手段,如互信息(MI/mutual information)、MI3、Z-Score、對數(shù)似然率(log-likelihood)等多種測量搭配強(qiáng)度的方法。其操作方法為,在查詢界面輸入關(guān)鍵詞獲得關(guān)鍵詞的索引行并居中顯示。然后在查詢結(jié)果后續(xù)操作分項功能選中collocations,點(diǎn)擊后進(jìn)入搭配參數(shù)頁面,在statistics欄中可以根據(jù)自己的需要對統(tǒng)計手段進(jìn)行選擇。圖6為COMMIT按照Z-score值搭配強(qiáng)度由高到低的搭配詞。

圖6 COMMIT的搭配詞
COMMIT的前10位的搭配詞分別為:suicide,offense,crimes,offenses,crime,atrocities,two-phase,to,arrestable,murder。這些詞中名詞8個,形容詞和介詞各1個。為了更全面分析COMMIT的搭配情況,我們把考察范圍擴(kuò)大到COMMIT的前50個搭配詞。發(fā)現(xiàn)其中名詞36個。按照類別主要為表示犯罪、謀殺、傷害、自殺、欺騙、通奸等,反身代詞4個,分別為themselves,himself,itself,ourselves和yourself。副詞6個,fully,ideologically,irrevocably, firmly,totally,deeply。形容詞兩個 alleged和naturalistic。介詞1個,to。疑問代詞1個,who。BNCweb (CQP-Edition)在提供了搭配詞的同時在提供關(guān)鍵詞和搭配詞共現(xiàn)的頻率。圖6第5列顯示COMMIT與to的共現(xiàn)頻率相當(dāng)高,總數(shù)達(dá)到了4523,超過了COMMIT與其他顯著共現(xiàn)之和。因此,有必要進(jìn)一步考察COMMIT to 及其右搭配詞。
COMMIT to在BNC中的頻率情況如表3所示,總頻率為1949,按頻率高低依次為committed to,commit to,committing to,commits to,commited to其中“committed to”占了絕大多數(shù),達(dá)到了1872次,占到COMMIT to總詞頻的96.05%。按照之前的抽樣方法,我們考察了“committed to”的23例隨機(jī)抽樣如圖7,其中15例(65%)用于被動語態(tài)。由此可以判斷COMMIT to的主要形式為“committed to”,這一結(jié)構(gòu)主要用于被動語態(tài)。
圖8為COMMIT to的右搭配詞情況。同樣的方法,我們考察了COMMIT to按Z-score值顯著性搭配的前50右搭配詞,結(jié)果顯示COMMIT to的右搭配詞主要有兩種形式,均表示“致力于做某事”。其一為commit to+動名詞,這類詞為表示建立、維持、保持、發(fā)展、促進(jìn)、提升、增加的詞:maintaining,improving,achieving,supporting,ensuring,providing,establishing,retaining, bringing,introducing,developing,promoting,accepting;表示降低減少的詞reducing,cutting。其二為commit to+名詞,這些名詞包括:監(jiān)獄、庇護(hù)的詞,如 prison,asylum,trial;概念、規(guī)則、原則、標(biāo)準(zhǔn)的詞:concept,standards,principle, provision, rule;目標(biāo)的詞: aims ,goals;改革、發(fā)展、提高的詞:reform,development,improvement,change,struggle;防衛(wèi)、斗爭、維持、保持、實(shí)施的詞:defence,struggle,maintenance,implementation;觀點(diǎn)、想法、策略的詞:idea,view,strategy,scheme,社會主義,民主自由的詞:democracy,peace,freedom等。

表3 {commit} to在BNC中的頻率統(tǒng)計

圖7committedto的抽樣

圖8 COMMIT to 的右搭配詞
3.3.3 語義韻
語義韻是語料庫語言學(xué)研究的重要課題。語義韻可分為積極、中性和消極三類。在消極語義韻里,關(guān)鍵詞吸引的詞項幾乎都具有強(qiáng)烈或鮮明的消極語義特點(diǎn),它們使整個語境彌漫一種濃厚的消極語義氛圍。積極語義韻的情況正好相反:關(guān)鍵詞吸引的幾乎都是些具有積極語義特點(diǎn)的詞項,由此形成一種積極語義氛圍;在中性語義韻里,關(guān)鍵詞既吸引一些消極涵義的詞項,又吸引一些積極涵義或中性涵義的詞項,由此形成一種錯綜的語義氛圍。因此,中性語義韻又可稱錯綜語義韻。絕大多數(shù)英語詞的搭配行為呈現(xiàn)出錯綜語義韻現(xiàn)象,一些詞項具有強(qiáng)烈的消極語義韻,另一些詞項則有明顯的積極語義韻(衛(wèi)乃興,2002:300)。衛(wèi)乃興(2002:300)提出了語義韻研究的一般方法即:(1)建立并參照類聯(lián)接,用基于數(shù)據(jù)的方法(data-based approach)研究;(2)計算節(jié)點(diǎn)詞的搭配詞,用數(shù)據(jù)驅(qū)動的方法(data-driven approach)研究;(3)用基于數(shù)據(jù)與數(shù)據(jù)驅(qū)動相結(jié)合的折中方法研究。通過觀察節(jié)點(diǎn)詞的索引行能對節(jié)點(diǎn)詞的語義韻特征進(jìn)行分析。
通過對COMMIT搭配詞和COMMIT to右搭配詞的分析,我們可以歸納出commit具有的兩類語義韻律特征。作為“做……”和“犯……”意思時,周邊詞幾乎都是具有消極語義特點(diǎn)的詞項,如“犯罪、謀殺、傷害、自殺、欺騙、通奸”等,均指生活中那些消極之事或不好的事,呈現(xiàn)出消極的語義韻特征。與to搭配作為“使承擔(dān)義務(wù)”“致力于某事”時,周邊詞是表示保持維持改革發(fā)展提高的詞項,或是降低費(fèi)用、減輕負(fù)擔(dān)的詞項,整體上呈現(xiàn)出一種積極的語義氛圍。
長期以來,詞匯教學(xué)并沒有在英語教學(xué)中引起足夠的重視,濮建忠(2003:438)把原因歸結(jié)為以下兩點(diǎn),即:1)對詞匯知識關(guān)鍵要素的認(rèn)識還不夠充分。2)缺乏有效的教授詞匯的方法。本研究在厘清詞匯知識關(guān)鍵要素的同時,以commit為實(shí)例介紹基于第四代語料庫工具BNCweb (CQP-Edition)的詞匯深度分析方法。研究表明,“committed”在該詞各種屈折形式中使用頻率最高,COMMIT在英語中主要以被動形式出現(xiàn)。COMMIT更常用于書面語。COMMIT to在不同語域中的出現(xiàn)概率依次為社會科學(xué)(Social science)、國際事務(wù)(World affairs)、信仰和思想(Belief and thought)、商業(yè)和金融(Commerce and finance)、藝術(shù)(Arts)、應(yīng)用科學(xué)(Applied science)、散文(prose)、自然科學(xué)(Natural and pure sciences)。commit的類聯(lián)接形式主要有三類:V+N,V+PREP和V+PNX+to。COMMIT的典型搭配詞有:suicide, offense,crimes,offenses,crime,atrocities,two-phase,to,arrestable,murder等。該詞呈現(xiàn)出兩類完全不同的語義韻特征。作為“做…”和“犯……”時表現(xiàn)出消極語義韻特征。與to搭配表示“致力于某事”時,呈現(xiàn)出一種積極的語義韻特征。