■王慧敏/黃河科技學院
20多年的詞塊研究表明,詞塊在語言使用和語言習得中有重要作用。專門用途英語和學術英語的發展使得詞塊研究滲入到學術英語領域,“詞塊知識是學術寫作的先決條件”(王芙蓉&王 敏,2013)。2010年,Simson-Vlach和 Ellis在語料庫的基礎上,通過多方驗證的方法研制了學術詞塊表(AFL),對于學術英語詞塊研究和教學有指導意義。
然而,AFL是跨學科編制的,它能否全面反映具體學科中高頻詞塊使用的具體情況呢?基于此,本研究將通過研制醫學研究領域的學術英語詞塊表并描述其特征來展示醫學學術研究領域的詞塊使用情況,以期為醫學學術英語寫作和教學提供幫助。
本研究將通過定量分析和定性分析相結合的方法,采用基于語料庫的計算機自動提取和人工篩選的方式研制醫學學術英語詞塊表,并描述本詞塊表高頻詞塊的特征。
本研究所采用的語料來自“西安交通大學醫學研究論文語料庫”。該庫包含128篇醫學研究論文,均為英語本族語者撰寫,共515024詞。該語料庫具備一定規模,建庫方法科學,所選語料具有代表性,能滿足本研究需求。本研究使用AntConc軟件進行詞塊的自動提取。
基于對詞塊界定的研究,采用許家金(2007)的界定標準,即“詞塊是結構相對完整,使用達到一定頻率,能表達某種意義的連續詞語片段”。據此,本研究詞塊的提取標準包括:
(1)詞塊長度:詞塊長度應大于等于2個單詞,本研究設定詞塊長度為3~5詞。
(2)詞塊頻率:Cortes(2004)認為出現頻率是詞塊的決定性特征。以往研究中,對詞塊頻率的設定從10到40次每百萬詞不等。本文將采用20次每百萬詞,保證提取的詞塊具有代表性。
(3)分布范圍:根據 Biber(1999)的研究,詞塊至少應在目標語料庫中的5篇語料中出現。本研究亦采用此標準。
(4)詞塊的合理性:不少研究者認為,為了保證所選取詞塊有意義,應在語料庫軟件自動提取后,對初步所得詞塊進行人工篩選,剔除“語法結構不完整或意義表達相對不完全的噪音序列”(許家金,2007)。本研究人工剔除諸如 is in the、and in the、and of the等結構或意義不明確、不完整的無意義詞塊。
利用AntConc軟件Cluster/N-Grams選項卡,按照已設定的標準進行目標詞塊的提取,得到初步的醫學學術英語詞塊表,其中總類符數為1630,總形符數為33398。
接著,對1630個詞塊進行人工篩選,剔除結構和意義不完整的詞塊、非語言單位、人名、地名,同時查閱醫學英語詞典,以保證在醫學上常見的、有意義的詞塊不被剔除,最終得到包含1118個詞塊的醫學學術英語詞塊表。
將依據提取標準和人工篩選所得到的1118個詞塊按在目標語料庫中出現頻次高低排序,得到最終的醫學學術英語詞塊表,本研究重點關注所研制詞塊表中的前200個高頻詞塊。
作為詞塊的決定性特征,頻率也是詞塊研究的重點。在本文所研制的醫學學術英語詞塊表的前200個高頻詞塊中,有67%的詞塊頻率在40~98次每百萬詞,33%的詞塊頻率甚至大于等于100次每百萬詞。這表明,這200詞塊是醫學學術英語中具有代表性的詞塊,也是本文將要研究的重點詞塊。
在200個高頻醫學學術英語詞塊中,有一部分詞塊揭示了醫學研究領域的內容、主題、研究對象、研究方法等,或者包含醫學術語、半術語,屬于具有鮮明醫學學科特征的詞塊。
例如,在這些具有醫學特征的詞塊中,“in patients with”在整個醫學學術英語詞塊表中占據第二位,共出現了215次。在醫學英語中,這個結構確實很常見,一般“with”后面會接某種疾病的名稱,表示“在患有……病的病人中”的意思,例如:“in patients with acute pancreatitis in which none of the common causes of pancreatitis can be indentified,drugs should be considered as a possibility”(該例句來自目標語料庫)。而“patients with a”“patients who had”“for patients with”后也常接疾病名稱,表示某種疾病的患者。這些詞塊揭示了醫學研究領域的研究對象:病人(患者),且在醫學研究論文中很常見。
除此之外,還有詞塊包含有醫學術語,同樣也具有鮮明的醫學特色:the presence of,the incidence of,the prevalence of,the treatment of,the immune system,the diagnosis of,follow up period,for the treatment of,the progression of等。 其 中“the presence of”表示(疾病、癥狀)的出現,“the incidence of”“the prevalence of”表示發病率/患病率。
另外,在醫學術語學中還有一些詞,稱為“半醫學術語”,即普通詞匯,但在醫學英語中具有特殊含義(王重稼,1995,p799)。包含“半醫學術語”詞匯的詞塊例如:“the duration of(一般指治療、用藥、疾病、癥狀等的持續時間)”“the onset of(發病)”“the management of(治療)”“follow up period(隨 訪 期 )”“the efficacy of(藥效、療效)”“the progression of(疾病進程)”也展現了醫學學科特色。
還有詞塊如“the control group”“men and women”在醫學研究論文中也常出現,揭示了研究方法和研究對象。在醫學實驗中,常需要對照組“the control group”,而 性 別“men and women”也是常用的對比指標。但是這些詞塊在其他學科中或許也很常見,需進一步通過跨學科詞塊使用對比來驗證是否為醫學特有的高頻詞塊。
本研究主要以醫學研究論文語料庫為基礎研制了一個醫學學術英語詞塊表并描述了其特征。通過研究該詞塊表中頻率最高的200個詞塊發現:這些詞塊的頻率均在40次每百萬詞之上,且這些詞塊中包含不少能揭示醫學研究主題的詞塊,具有鮮明的學科特色。
研制醫學學術英語詞塊表有一定意義,在醫學學術英語寫作與教學中,結合AFL與醫學學術英語詞塊表,能夠為醫學學術英語寫作與教學提供有益的指導,提高英語學習者醫學學術英語論文寫作的質量。