高 軍 楊 璐
(上海理工大學 外語學院,上海 200093)
詞塊(lexical bundle)表現為三詞或多詞的共現關系,即擴展搭配,如as a result、on the other hand和in the case of the等。詞塊在學術語篇中具有頻率高和分布廣的特征,是語篇構建的主要話語手段,承載著重要的語篇功能(Biber et al. 1999; Biber & Conrad, 1999)。Haswell(1991)的研究發現,在特定學科社團中,能否恰當使用該學科的標志性詞塊是區分專家與新手的主要標志。因此,學術新手,尤其是二語寫作者要在國際學術期刊發出自己的學術聲音,提升學術影響力,必須熟練掌握和恰當使用所在學科領域的詞塊。
近年來,國內外學者運用語料庫手段對詞塊的使用特征進行了大規模的實證性研究,對比分析了英語本族語學者與非本族語學者、學術新手與專家學者、期刊論文作者和英語學習者以及不同學科作者之間在詞塊使用上的異同(Chen & Baker, 2010; Hyland, 2008a, 2008b; 胡元江等,2017;魯莉、王敏,2015),但是針對國內理工科研究生英文學術論文中詞塊使用的實證研究尚不多見。Scott和Tribble(2006)指出,對比分析英語學習者論文和本族語學者論文可以找出學習者與本族語學者在詞塊使用上存在的差異,幫助英語學習者有效習得和正確使用詞塊,提高語言表達的地道性,從而成為熟練的論文寫作者。鑒于此,本文采用語料庫分析的方法,以國際期刊論文為參照語料,對比中國理工科研究生和英語本族語學者學術語篇中四詞詞塊的結構和語篇功能的異同,以期對理工科研究生學術英語寫作教學和詞塊教學提供一定有益的啟示。
二語習得理論注重詞塊,認為詞塊在語言習得過程中發揮著關鍵作用 (Larsen-Freeman, 2011)。Granger(1998)和Meunier & Granger (2008)的研究顯示,二語學習者撰寫的英文論文語言不流暢、不地道與詞塊少用或誤用有關。Biber等(2014)對比了期刊論文作者和非本族語學習者的論文,發現期刊論文作者使用的短語類詞塊多于學習者,高水平非本族語學習者使用的短語類詞塊遠多于低水平非本族語學習者。Hyland(2008a, 2008b)對比了電氣工程、商業、生物學及應用語言學四大學科領域的期刊論文和香港的中國學生碩博論文,發現碩博論文的四詞詞塊數量多于期刊論文,而且在50個最高頻四詞詞塊中,期刊論文和碩博論文的共用詞塊數量不足二分之一。Cortes(2004)通過分析歷史和生物兩個學科的學生論文和專家論文發現,學生不僅較少使用詞塊,而且使用的詞塊與專家論文相比存在較大差距。Cortes(2006)進一步提出了在寫作教學中實施詞塊教學的必要性以及具體措施,認為詞塊教學可以提高學生在特定學科領域論文寫作的語言產出質量。
國內學者以中國英語學習者為研究對象進行了相關研究。例如,徐昉(2012)探究了英語專業語言學方向學士、碩士和博士等不同教育層次中國學生的學術詞塊使用及發展特征;王麗和李清婷(2014)考察了外國語言學及應用語言學專業的碩博論文引言中詞塊的結構、功能及語步特征;Huang(2015)分析了英語專業本科生的詞塊使用頻率和準確性;李夢驍和劉永兵(2017)對比了不同語言水平的中國英語學習者與本族語學者結論語步中的詞塊結構和語篇功能的系統性差異。
總體而言,雖然已有研究運用語料庫手段考察了英語學習者和本族語學者學術語篇中的詞塊特征,但是依然缺乏針對國內理工科研究生英文學術論文中詞塊使用的實證研究。詞塊的恰當使用體現了學術的表達規范性,但在寫作中恰當地運用詞塊對于二語學習者而言存在一定的難度(Hyland,2008a)。鑒于詞塊在學術語篇中的重要性以及二語學習者習得詞塊的困難,研究中國理工科研究生與英語本族語學者學術英語詞塊使用的異同具有一定價值和意義。
本研究嘗試回答以下問題:
(1)國內理工科研究生和本族語學者英語學術論文中詞塊使用的頻率分布和結構特征如何?有何異同?
(2)國內理工科研究生和本族語學者英語學術論文中詞塊使用的語篇功能如何?有何異同?
本研究的語料來自兩個自建的語料庫:中國理工科研究生英語學術論文語料庫(以下稱為“corpus 1”)和英語本族語學者期刊論文語料庫(以下簡稱“corpus 2”)。
Corpus1的語料選自江、浙、滬三所理工類高校的碩士研究生的英語學術論文。論文作者在本科期間都通過了大學英語六級考試,在研究生階段選修了“學術英語寫作”課程,接受了系統的學術英語寫作訓練。Corpus1所收錄的論文是在作者修讀了“學術英語寫作”課程后根據自己的研究課題撰寫的實證性研究論文,未經專家或英語本族語者審校修改,可以真實反映作者的學術英語水平。論文涵蓋能源、動力、光電、計算機、環境、建筑、機械、材料和物理等理工類學科領域,庫容為112個文本、324712個形符、15906個類符,平均每篇篇幅2899詞。Corpus2的語料來自“科學引文索引”(SCI)影響因子較高的國際學術期刊,發表于2013年至2017年,涵蓋的學科領域與Corpus1基本相同,論文作者全部滿足Wood(2001)對母語使用者的定義,即第一作者的名字是英美國家本族語者常用名,且署名科研機構或學校隸屬于以英語作為母語的國家。Corpus2的庫容為55個文本、323914個形符、15802個類符,平均每篇篇幅5889詞。所有語料僅保留正文,刪除了圖表、參考文獻、致謝、腳注及附錄等部分,以方便對目標詞塊的檢索。
絕大多數四詞詞塊本身包含了三詞詞塊,而且使用頻率比五詞詞塊高出10倍,在結構和功能上也更具代表性(Cortes,2004)。因此,本研究以四詞詞塊作為研究對象。根據Biber(1999)等人的研究,每百萬詞復現至少10次且至少出現在五個及以上不同的文本中的詞塊語義相對固定,體現了學科特色而非論文作者的個人風格。結合本研究語料庫容量,我們將四詞詞塊的提取標準定為每百萬詞出現40次且至少在5個不同文本中復現。因此,兩個語料庫四詞詞塊提取的最低頻數均為13。
根據上述界定的詞塊提取標準,我們首先使用檢索工具AntConc 3.2.4的詞叢功能檢索出兩個語料庫中的四詞詞塊,利用Concordance功能查看并刪除復現少于5個文本的詞塊;其次,通過人工篩選,排除結構零碎、不合語法或語義明顯不連貫的詞語組合,分別計算出兩個語料庫的四詞詞塊以及每百萬詞復現的頻數;第三,使用Excel表格中的Vlookup功能找出兩個語料庫中的共用詞塊,并利用對數似然率和P值進行顯著性檢測;第四,根據Biber et al.(1999)的結構分類標準和Hyland(2008a)的語篇功能分類標準,分別對兩個語料庫的四詞詞塊進行結構類型和語篇功能的頻數統計,并進行對比分析,從而找出理工科研究生與英語本族語學者在學術英語詞塊結構和功能方面的異同。
表1為兩庫中四詞詞塊的數量、原始頻數、標準化頻數以及對數似然率的檢驗結果。

表1 兩庫四詞詞塊的頻數及對數似然率
表1顯示,理工科研究生英語學術論文中四詞詞塊的數量和使用頻率顯著高于英語本族語學者,說明國內理工科研究生囿于學術英語寫作經驗的不足更依賴程式化的詞塊構建英語學術語篇。這與De Cock(1998)、Hyland(2008a)和Paquot(2013)等學者的研究結論相呼應。他們一致認為,與本族語者相比,二語學習者由于語言水平的限制對詞塊的依賴程度較高,使用的詞塊往往更多。
進一步檢索顯示,兩庫中的共用詞塊為11個。我們利用對數似然率對11個共用詞塊進行了顯著性檢測。

表2 兩庫共用詞塊的頻數及對數似然率
(注:*** p <.001,** p <. 01,*p <. 05,下同)
如表2所示,在這11個共用詞塊中,理工科研究生比本族語學者使用頻繁的詞塊為“the center of the, the performance of the”。此外,理工科研究生和本族語學者都傾向于頻繁使用“as shown in Fig”,但是本族語學者還高頻使用了與其語義相近的替換詞塊“are shown in Fig”和“is shown in Fig”,而這兩個替換詞塊是理工科研究生顯著少用的詞塊。導致這一差異的主要原因可能在于理工科研究生往往習慣于機械性地記憶和使用固定短語類的詞塊,對詞匯共現的內部要求了解不夠,忽視了詞匯知識向深度發展。這也從側面反映了本族語學者在詞塊的選擇和使用上豐富性更強,理工科研究生詞塊使用的多樣性則稍顯欠缺。
我們進一步統計了兩庫的高頻四詞詞塊,如表3所示:

表3:兩庫高頻四詞詞塊
注:加粗詞塊為兩庫中的共用詞塊
將表2的11個共用詞塊和表3的兩庫高頻四詞詞塊進行檢索對比發現,在本族語學者使用的11個高頻四詞詞塊中,有六個詞塊屬于兩庫共用詞塊,其余五個詞塊在理工科研究生論文庫中從未出現。相比之下,在理工科研究生使用的11個高頻詞塊中,只有二個詞塊屬于兩庫共用詞塊,其余九個詞塊在本族語學者論文中從未出現,是理工科研究生特有的高頻詞塊。例如,理工科研究生使用詞塊“can be divided into”(44頻次)表示將實驗對象分成幾個組別,而該詞塊在本族語學者論文庫中未檢索到一例。相反,本族語學者使用“assign”等核心動詞表示將實驗對象隨機分配到幾個組別。同樣,理工科研究生高頻使用的詞塊“at the same time”(77頻次)也未在本族語學者論文庫中出現。再比如,理工科研究生使用的高頻詞塊“with the increase of、the development of、the rapid development of、can be seen from”等是按照字面對應的直譯方法表達相應的概念。上述例子分析表明理工科研究生在寫作時仍然受到漢語思維和表達的影響,而且使用的詞塊缺乏多樣性,與本族語學者存在一定差異。
Biber et al.(1999)通過對朗文英語口筆語語料庫的分析把詞塊結構劃分為12種類型。為方便討論,我們進一步將其歸納為名詞詞塊、介詞詞塊、動詞詞塊、句干詞塊和其他詞塊五大類范疇。圖1呈現了兩庫中四詞詞塊結構范疇的頻率比重分布。

圖1 兩庫四詞詞塊結構范疇的頻率比重分布
由圖1可知,理工科研究生和本族語學者使用的四詞詞塊結構呈現出相同的分布特征,按照使用頻率由高到低依次為:名詞詞塊、介詞詞塊、動詞詞塊、句干詞塊和其他詞塊。其中,名詞詞塊、介詞詞塊和動詞詞塊是兩庫中均高頻使用的四詞詞塊結構。為進一步對比兩庫的詞塊結構特點,我們統計了12種結構類型的頻數和對數似然率及P值,見表4。

表4 兩庫四詞詞塊的結構類型分布
表4顯示,理工科研究生使用名詞詞塊和介詞詞塊的頻率均顯著高于本族語學者。這與已有研究結果基本一致,徐昉(2012)的研究發現中國學習者以名詞詞塊和介詞詞塊使用為主。在動詞詞塊的使用方面,理工科研究生比本族語學者更傾向于高頻使用“被動動詞+介詞短語”和“系動詞be+名詞/介詞/形容詞短語”兩種類型。我們認為,這可能是由于理工科研究生在學術英語寫作課程中學習和掌握了科技英語語篇的主要特點,在論文撰寫中有意識地使用名詞和介詞短語壓縮和整合信息,同時盡可能地使用被動結構描述實驗研究的客觀性,以符合科技英語語篇名詞化和被動化的要求,因而導致相應的詞塊結構類型使用過多。兩庫的另外一個顯著差異是理工科研究生未使用過“動詞短語+that從句”結構,而本族語學者使用此結構的頻數為55;與之形成鮮明對比的是,在“代詞/名詞短語+動詞短語”結構的使用方面,理工科研究生的使用頻數有63次之多,而本族語學者的使用頻數為零。這是一個很值得關注的現象。進一步語料檢索對比發現,理工科研究生和本族語學者分別使用的這兩類結構類型之間存在一定的關聯性。
例(1)
a) Itcanbeseenthatthe depth of cut increases with time as more and more particles impact the surface, and stabilizes only in the red highlighted region which has received one complete pass of the jet diameter. (corpus2)
b) By comparison of complete stress-strain curves of granite and sandstone samples after temperature-treatment,wecanseethatthe brittleness of the two rock types gradually decreases and the ductility gradually increases as temperature rises. (corpus1)
例1顯示,本族語學者使用的“動詞短語+that從句”詞塊“can be seen that”表達的語義概念在理工科研究生的學術論文中是由“代詞/名詞短語+動詞短語”詞塊“we can see that”來體現的。本族語學者傾向于使用更客觀的“can be seen that”陳述事實和發現,而理工科研究生可能由于對此類詞塊結構掌握和使用的熟練程度不夠,或者受漢語思維習慣的影響更傾向于使用比較主觀的詞塊結構“we can see that”,表現出典型的“學習者詞塊”特征。
另外值得一提的是,理工科研究生使用的句干詞塊范疇下的“副詞從句”詞塊的種類和頻數也顯著高于本族語學者,使用的三種形式分別是“as shown in Fig、as can be seen、as shown in Table”,而本族語學者僅使用了“as shown in Fig”這一種形式。我們認為,導致該差異的原因正如前3.1所述,理工科研究生可能認為他們對這類固定短語類詞塊的用法感覺更有把握,因為學習者總是傾向于使用自己感覺有自信的特定表達式(Granger 1998)。
Hyland(2008a)根據學術語篇的語域特征,把詞塊的語篇功能劃分為研究型、文本型和參與型三大類。研究型詞塊旨在對研究活動進行定性和定量的描述,是體驗真實世界和描述客觀環境的體現;文本型詞塊用來表明篇際、句際及句內的關系,體現行文的連貫性與邏輯性;參與型詞塊用于建立作者和讀者之間的互動,表達作者的觀點和態度,包括立場詞塊和介入詞塊。我們依據上述分類框架統計了兩庫中四詞詞塊的語篇功能的頻率比重分布,如圖2所示。

圖2 兩庫四詞詞塊語篇功能的頻率比重分布
圖2顯示,兩庫中詞塊語篇功能的比重分布呈現出大致相同的特征,都是研究型詞塊最高,參與型詞塊最低,文本型詞塊介于兩者之間,這表明理工科研究生在詞塊語篇功能的使用上和本族語學者相近,已經基本具備和掌握使用詞塊表達不同語篇功能的意識和能力。相比較而言,理工科研究生使用的研究型詞塊顯著多于英語本族語學者,但是文本型詞塊少于后者,參與型詞塊則與后者接近。表5進一步匯總了四詞詞塊語篇功能的分類統計數據。
由表5可見,理工科研究生和本族語學者在研究型詞塊的使用方面對比最鮮明。理工科研究生使用的位置、過程、數量以及描述性詞塊無論在種類上還是頻數上都顯著多于本族語學者。觀察發現,理工科研究生傾向于高頻使用“the performance of the、in the process of、the development of the和the size of the”等描述實驗數據、研究過程和步驟的詞塊,突顯研究的客觀性和嚴謹性。這與Hyland(2008b)對中國香港碩博論文的研究發現一致,“新手作者在論文中更強調真實世界研究的具體步驟和方法,多用研究型詞塊展示他們對于話題的熟悉及研究方法的熟練”(Hyland 2008b)。 相比之下,在主題類詞塊方面,理工科研究生使用的種類和頻數均顯著少于本族語學者,說明理工科研究生在這類詞塊的輸入和輸出上仍不充分。

表5 兩庫四詞詞塊的語篇功能分類統計
在文本型詞塊方面,理工科研究生和本族語學者使用的類型分別為14個和12個。值得指出的是,盡管在使用的類型上理工科研究生高多于本族語學者,使用頻數卻低于后者,尤其是銜接性詞塊明顯偏低,說明作為二語學習者的理工科研究生明顯缺乏靈活使用這類詞塊的能力。我們認為,造成這種現象的原因是,“漢語是一個高語境語言,讀者可以通過上下文、自己的知識和表意性的漢字,即使不用‘但是’‘如果’這些連接詞表明邏輯關系,也能讀懂一組句子的關系。這種習慣也影響了學生英語寫作中缺少銜接手段的使用”(蔡基剛,2017)。其結果是學生在語篇組織,特別是語篇銜接和行文邏輯等方面稍顯欠缺,文本的可讀性不強。
參與型詞塊又分為立場詞塊和介入詞塊兩類,是作者和讀者進行溝通和交流的橋梁。與本族語學者相比,理工科研究生使用的立場詞塊和介入詞塊雖然類型數量上一致,但是使用頻數略高于后者。進一步對比發現,理工科研究生使用的介入詞塊的四種形式都與核心動詞see有關,分別涉及see的主動態和被動態及相關搭配,如“can be seen from、as can be seen、it can be seen和we can see that”;而本族語學者使用的介入詞塊中的核心動詞相對要豐富一些,使用了包括can be seen that、should be noted that、it should be noted等多種形式在內的詞塊構建作者和讀者的互動功能。這在一定程度上說明了理工科研究生掌握了如何利用詞塊表達自己的立場和觀點并與讀者之間建立互動,但是在使用上仍然缺乏多樣性,可能是由于理工科研究生對相關詞塊的熟悉度還不夠,同時缺乏靈活運用該類詞塊的能力。
基于理工科研究生學術論文和英語本族語學者期刊論文語料庫的定量統計和定性分析表明,理工科研究生在學術語篇構建中基本具備運用四詞詞塊的意識和能力,但是較之本族語學者,理工科研究生傾向于高頻使用四詞詞塊;結構上,顯著多用名詞詞塊、介詞詞塊、“被動動詞+介詞短語”“系動詞be+名詞/介詞/形容詞短語”和“代詞/名詞短語+動詞短語”詞塊,未使用“動詞短語+that從句”結構;部分詞塊的使用受到漢語遷移的影響;功能上,使用的研究型詞塊顯著偏多,但是銜接性詞塊的輸入和輸出不充分,明顯偏少。
是否掌握本族語者常用的詞塊直接關系到學習者語言的準確性和地道性(濮建忠,2003)。丁言仁和戚焱(2005)也指出,詞塊可以緩解臨時組裝語句的壓力,使作者將更多的注意力轉移到內容的深化和意義的表達上,寫出更好的文章。但是,本研究發現,理工科研究生的詞塊知識和運用能力相對薄弱,表現為某些類型的詞塊使用過多或使用不足。對于這種現象教師在學術英語寫作教學中要予以重視,應有意識地強化詞塊知識,引導學生大膽運用多種形式的詞塊,避免簡單重復。除了課堂教學外,還要培養學生的自主學習能力,將詞塊學習融入課外的文獻閱讀中,鼓勵學生在語境中學習和掌握詞塊的用法,學會運用多種銜接詞塊豐富語篇,提高詞塊運用的準確性和語言表達的地道性。
本研究也存在一定的局限性。首先,因樣本數量有限,本研究結果可能存在一定偏差,不能概括中國理工科研究生詞塊使用特征的全貌。其次,限于篇幅,本研究未能對理工科研究生詞塊運用情況與學術論文寫作質量開展相關研究。這些將是后續研究中要重點關注和突破的方向。