摘 要:本文是對衛乃興的《基于語料庫和語料庫驅動的詞語搭配研究》而進行的述評,首先對原文的內容進行了簡要的介紹,指出了研究的重要性,強調了詞語搭配研究的兩種基本方法和三種具體做法,之后分析該篇文章的優缺點,在評述其對研究的重要性、邏輯層次、索引方法選取等方面建樹的同時,也指出寫作角度選取和預料選材上的欠缺。最后綜合評論了該篇文章,肯定了其在教學方面不可忽視的作用。
關鍵詞:詞語;搭配;語料庫
作者簡介:關雪(1986-),女,黑龍江省勃利人,廣西師范大學外國語學院2011級外國語言學及應用語言學專業研究生。
[中圖分類號]:H31 [文獻標識碼]:A
[文章編號]:1002-2139(2013)-26--02
一、簡介
《基于語料庫和語料庫驅動的詞語搭配研究》由上海外國語大學衛乃興發表于《當代語言學》第4卷2002 年第2 期101-104頁。該篇文章對詞語搭配研究的基本方法和主要原則進行了介紹和討論。文章主要從以下幾個方面來進行論述:
首先,筆者對研究的重要性進行了簡單的介紹。衛指出:語料庫是語料庫語言學研究的基礎資源,語料庫語言學以大量精心采集而來的真實文本為研究素材,主要通過概率統計的方法得出結論,因此語料庫語言學從本質上講是實證性的。相較于傳統的基于直覺的數據,語料庫語言學在實證方面無疑是強有力的。伴隨著語料庫語言學的興起,詞語搭配研究有了廣闊的發展前景,詞語搭配也被賦予了新的思想。同時,簡單介紹了詞語搭配研究的兩種基本方法和三種具體做法。
其次,逐一討論了詞語搭配研究的三種具體做法,并概括了研究的重要原則。第一種方法是基于索引證據,參照類聯接,檢查和概括詞項的搭配行為。在這一部分,衛首先對類聯接和索引的定義給予了充足的分析,之后通過提取 “commit”一詞在COBUILD語料庫中的部分索引,以及“行為”一詞上海交通大學一個漢語語料庫中的有關索引,觀察并分析關鍵詞的搭配特點。進而概括出該研究方法的主要環節,同時對其適用范圍進行了說明。第二鐘方法是計算搭配詞方法,筆者首先說明了計算搭配詞方法的概念,并指出這種方法的優缺點,在這里有兩個步驟被提及,一是提取節點詞在語料庫中的所有搭配詞,該處研究中節點詞(Node)、跨距(Span)和搭配詞(Collocate)都起到了一定的作用,同時強調了該方法的基本思想是提取節點詞的2SN個搭配詞,通過觀察詞形performed的有關搭配詞,得出節點詞在所研究的詞庫中搭配行為的大致規律和模式;二是統計測量,筆者提及了統計測量的兩種手段,并詳盡介紹Z值(或T值)測量和MI值測量在詞語搭配研究中的使用情況,同時指出影響Z值(或T值)高低的關鍵因素和對M1值高低其決定作用的因素,最后對其優缺點進行了說明。第三種是提取詞叢方法,根據詞語搭配研究人員的設計,詞叢序列長短不定。筆者列舉了“point” 一詞在 LOB語料庫頻數最高的2O個四詞詞叢,之后通過公式計算出期望頻數值和觀察頻數值以及二者之比,從而觀察出其常用搭配。
再次,指出通過觀察上面提到的三中研究方法的理念、環節、步驟和統計測量手段,體現并揭示了研究的基本原則。關于研究原則主要有四點:以“自然數據”為基本依據;定量分析和定性分析相結合的原則;采用詞項中心的研究方法;以發現詞組為研究目的。最后,筆者對整篇文章進行了總結,指出該篇文章基于語料庫證據和語料庫證據驅動的詞語搭配研究的主要理念、方法、統計測量手段和技術措施,也提到了研究應遵循的基本原則。
二、評述
優點:
首先,合理強調了語料庫對于詞語搭配研究的重要性。語料庫在詞典編撰、自然語言處理、語言研究等領域有著重要的作用。在詞語搭配的研究中,基于語料庫的研究有諸多功能:如生成詞頻表;檢索詞語及結構模式;檢索結果的KWIC顯示及重新排序;生成特定詞語的搭配信息;生成特定詞的搭配框架;基于搭配框架的近義詞辨析等等。 以前對于詞語搭配的研究也有,如果不強調本文是結合語料庫的知識來進行的研究,那么該篇文章的價值便得不到很好的體現。個人認為,在教學的過程中,最直接的載體就是課堂中的教學材料。在英語課堂中,教師利用教學材料為學生提供很重要的語言輸入,在一定程度上,教學材料可以決定整個教學活動的成敗,因此,運用語料庫的方法來篩選教材有著非常重要的意義,本文研究結果有助于學生對詞語搭配研究的深入理解。而這種理解無疑對教師改進課堂教學,提高學生對搭配詞組的記憶能力有很大的意義。
其次,邏輯上層次遞進,思路清晰。在對檢索結果的分析上,作者首先分析節點詞可以進行哪些類的聯接,然后具體分析各類型聯接的實現形式出現的頻率。最后對節點詞的搭配特點進行概括和描述。具體來說,commit一詞可用于V+N,V+N+PREP和V+PREP等三個類聯接。V+N的搭配占多數,有24例,占全部索引的80%,而V+N+PREP和V+PREP搭配例有索引11,13,25,28,29,30這6例。通過簡單的分析所得結果并不能滿足基于語料庫的搭配研究的需求,因而作者進一步詳述了計算搭配詞的方法。緊接著作者指出詞匯僅是用來填充一定語法結構的材料,但這并不反應語言運用的真實情況。語言使用中的形式選擇在很大程度上不是由句法驅動的逐詞填缺,而是取決于成語選擇原則。依據該思想,研究者設計了提取詞叢的方法。作者按照研究的順序一步步地推進來行文,邏輯思維縝密,層層遞進,一步步引導讀者更好地了解如何運用語料庫的知識來做進一步的英語學習的研究。這種思維方式是值得所有語言研究者學習的。
再次,隨機提取索引方法的提出恰到好處。在提取索引時,作者考慮到了大型語料庫中可用的關鍵詞索引的數量可能非常龐大,工程繁瑣、不便于分析研究,而采用中、英語料庫各隨機提取一詞的方法則恰到好處,使其更具代表性,同時,中、英語料庫中都有提取一詞的方法也使索引的提取研究不失偏頗,對二者的研究顯得更為詳盡。由此可見,作者并不是紙上談兵,而是有實際操作經驗的,作者以自己的實際經驗考慮到了研究中的困難,從而提醒讀者在進行研究時需要注意的問題,這是非常難能可貴的。
最后,總結具有建設性意義。在文章最后,作者總結了幾項基本原則和方法。這幾項基本原則是語言研究者在運用語料庫做研究時需重點注意的。從這點看出,作者不僅僅向我們介紹了基于語料庫詞語搭配研究的具體方法,同時也提供給讀者運用語料庫的知識做其他研究的基本準則。為讀者提供了一定的研究方向以及指導方針。同時,也指出了本文較前人所做出的努力,望大家給予建議和意見。
缺點:
第一,此文作者的寫作僅僅停留在方法的介紹上,并沒有進一步提出此研究的作用。筆者認為此研究成果可廣泛用于外語教學與研究中,例如在教材的編寫過程中,可以選出最適宜該學段學生使用的搭配詞組與短語等,同時教學過程中,教師的語言輸出的質與量不僅對學生的語言輸入至關重要,而且起著言語示范作用。因而教師也可以此為依據向學生講授詞語的使用,避免學生將中文意思與英文意思進行一一對應而寫出中式英語,從而真正實現以學生為中心的課堂教學。
第二,本文在語料的選擇上稍有欠缺。雖然中英語料庫都有涉及,但選擇過于單調,倘若語料的選擇上更加多樣化一些,會使研究成果更具說服力。語料庫的類型主要是依據研究的目的和用途而分類的,有研究者將其分為異質的(Heterogeneous)、同質的(Homogeneous)、系統的(Systematic)、專用的(Specialized)四類。也有研究人員按照語料庫語種分類,為單語的(Monolingual)、雙語的(Bilingual)、多語的(Multilingual)三類。還有根據采集單位而分類的。
三、總結:
《基于語料庫和語料庫驅動的詞語搭配研究》是一篇命題視角獨特,理論觀點新穎,學術風格科學嚴謹,研究邏輯思路縝密的基于語料庫的文章。該篇文章中,衛乃興采用的是基于語料庫數據和語料庫驅動的研究方法。作者依據有關聯接分類的科學理論,并用語料庫的詞語搭配方法來統計,嚴格遵循基于語料庫的研究方法步驟,并靈活根據自己研究目的在借鑒前人理論成果的同時做出相應的修改,以使得該研究更具說服力和科學性。本文研究成果具有很強的應用價值,它對于改善中學英語課堂教學資料的選取以及教學重點的選擇具有很好的指導性作用。
參考文獻:
[1]秦平新.基于語料庫的詞語搭配個案研究——以knowledge為例[J].新疆師范大學學報(哲學社會科學版,2007,(第3期).
[2]申修瑛. 現代漢語詞語搭配研究. 復旦大學博士論文,2007.
[3]田宏梅.基于語料庫研究“有點”的搭配與語義分布.暨南大學碩士論文,2006.
[4]王儉.統計學在英語詞語搭配研究中的應用[J].嘉興學院學報,2010,(第1期).
[5]衛乃興.基于語料庫和語料庫驅動的詞語搭配研究[J].當代語言學,2002,(第2期).
[6]楊巖勇.基于語料庫的同義詞辨析.暨南大學碩士論文,2007.
[7]楊永紅.“搭配”國內研究綜述[J].語文學刊,2010,(第22期).
[8]張婧.外向型單語漢語學習詞典例證初探:以動詞搭配為例.北京語言大學碩士論文, 2009.
[9]周泓.基于統計面向領域的分詞研究以及在產品設計中的應用.西安電子科技大學碩士論文,2010.
[10]周潞.基于大規模語料庫的方式描摹性副詞搭配研究. 暨南大學碩士論文,2012.
[11]論文指要-豆丁網.http://www.docin.com/p-418393704.htm. 互聯網文檔資源,2012.