董玉雙
(四川外國語大學 研究生院,重慶 400031)
范疇化是語言研究的核心問題,詞類研究一直被認為是漢語語法研究的一個老大難問題,[1](P34)其中,語法多功能現象(兼類)問題尤為凸顯。[2-5]王仁強指出,兼類是指“一個多義的概括詞或詞項在社群語言系統層面詞庫中兼屬兩個或兩個以上詞類范疇的語法多功能現象,在語文詞典中體現為兼類詞”。[6]兼類問題是漢語詞類問題研究的難點,同時也是語文詞典編纂研究的核心和關鍵。
鑒于此,筆者通過查閱漢語/漢英詞典對多音節詞“斗爭”進行個案研究,并發現,漢語詞典將“斗爭”標為動詞,部分漢英詞典將其標注為動名兼類詞。鑒于現代漢語是典型的分析語,其兼類比例應高于現代英語。因此,筆者以現代英語詞典為輔助,對“斗爭”的對應詞“struggle”進行查閱發現,《牛津高階英語詞典》(第9版)(以下簡稱《牛津9》)將“struggle”標為動名兼類。由此可見,現代漢語對詞類范疇劃分尚存在問題。基于此,本文以雙層詞類范疇化理論為指導,探討漢語多音節詞“斗爭”的詞類范疇,同時對比漢英“斗爭”/“Struggle”在各自詞類系統中的標注情況,旨在更深層面揭示漢、英動詞和名詞在漢語詞典和英語詞典中的標注異同及背后影響因素。
雙層詞類范疇化理論(Two-level Word Class Categorization Theory)是針對漢語、英語等上千種分析語中概括詞在社群語言層面詞庫中普遍存在的語法多功能性,基于近些年在國際上涌現出的復雜適應系統語言觀以及 Croft和 Van Lier所主張的跨語言詞類本質觀而提出的一種新的詞類范疇化理論模型。[7](P345-347)該理論的主要內容包括:言語層面(個體詞例)的詞類范疇化和社群語言層面(概括詞)的詞類范疇化。言語層面詞例的詞類是說話者對指稱、陳述、修飾等命題言語行為功能的表達過程。社群語言層面詞庫的詞類是一個語言社群集體的自組織過程,其核心是規約化/相變。概括詞的詞類屬性會隨著個體詞例在言語中反復使用而發生演變,概括詞的兼類現象與使用頻率(包括個例頻率和類型頻率)密切相關;概括詞的詞類歸屬(單類或兼類)是其意義潛勢,是個體詞例在句法中所體現出來的規約性表述功能。基于語料庫的使用模式調查,判斷規約化有四個維度的標準:個例頻率、類型頻率、歷時分布、語域分布,[8]其中個例頻率與類型頻率是判斷規約化的主要標準。
1. 基于詞典的使用調查
首先,調查權威漢語詞典《現代漢語詞典》(第6、7版)和《現代漢語規范詞典》(第3版)中“斗爭”的微觀結構,調查三部漢語詞典中“斗爭”詞類標注是否準確,釋義與詞類是否協調,配例與詞類是否一致。依次再查閱其他五部權威漢英詞典,觀察“斗爭”詞類標注情況。其次,鑒于“牛津3000關鍵詞”(Oxford 3000TM)是基于英國國家語料庫(BNC)和牛津語料庫集成(Oxford Corpus Collection),并按照使用頻率和語域廣度進行精選的,據此我們調查現代英語詞典《牛津9》中“struggle”的微觀結構。最后,對比漢語、英語詞典對于“斗爭”/“struggle”的詞類標注情況以及主流漢英詞典對“斗爭”詞類標注的異同。
2.基于語料庫的使用調查
首先,基于國家語委現代漢語語料庫(以下簡稱“語委語料庫”)對“斗爭”一詞的用法進行檢索和判定,從個例頻率和類型頻率兩方面對其規約化程度進行數據分析。其次,由美國楊百翰大學Mark Davies領銜學術團隊開發的美國當代英語語料庫(COCA)是目前在線免費的最好的英語語料庫之一,它是當今世界上最大的免費使用的英語平衡語料庫。基于此,檢索“struggle”在COCA的個例頻率和用法類型頻率。最后,對比分析兩者異同。
首先,筆者查閱七部權威漢語/漢英詞典對“斗爭”的標注情況,并以現代英語詞典《牛津9》為參照,結果如表1、2所示。

表1 “斗爭”詞條在七部漢語/漢英詞典中詞類標注情況

表2 “struggle”詞條在《牛津高階英語詞典》(第9版)中詞類標注情況
1.基于國家語委語料庫的調查結果
首先,筆者基于語委語料庫對“斗爭”詞例進行檢索,得出“斗爭”詞例在語委語料庫中共有3 183條。基于此,筆者進行了全樣本分析。通過初步統計,在3 183條索引中,僅有744條標注為動詞,占23.37%;2 439條標為名詞,高達76.63%。但通過分析,筆者發現以下問題: “斗爭”在做主賓語時前后的詞類標注不一致;“斗爭”在動詞后并在句中做中心語受其他詞修飾,仍標注為動詞;“斗爭”表示詞素用法時標注前后不一;“斗爭”在介詞后做賓語卻標注為動詞。故此,筆者從個例頻率和類型頻率兩方面進一步統計分析全樣本數據。
(1)個例頻率
在數據處理過程中,首先區分了詞用法和構詞用法(語素組用法),如索引中出現的“斗爭性”“斗爭會”“斗爭史”等,其用法頻繁出現,已然獨立使用,因此,筆者將其視為構詞用法,在此研究中不對其進行討論。通過分析所得詞用法共2 598條,占81.62%,語素用法有585條,占18.38%。通過命題言語行為功能進行重新標注后,2 598條“斗爭”詞條中表示指稱用法的有2 217條,占總數的85.33%,其次381條表示陳述用法,占總數的14.67%。
(2)類型頻率
鑒于“斗爭”詞例在語委語料庫中標注情況存在明顯差異,因此,筆者對“斗爭”的2 217條指稱用法(作主/賓語)和381條陳述用法(作謂語)分別進行類型頻率分析。如表3、表4所示,“斗爭”一詞的指稱用法模式各有五類。

表3 2 217條“斗爭”指稱用法在各結構中的分布情況

表4 381條“斗爭”陳述用法在各結構中的分布情況
2.基于COCA的使用調查
(1)個例頻率
筆者通過檢索COCA,發現“Struggle”作為動詞和名詞的個例頻率都很高,而且使用域也很廣泛,在五個語域都有很廣的分布,見表5。

表5 “Struggle”動詞和名詞用法在COCA的分布情況
(2)類型頻率
筆者再次檢索“Struggle”在COCA中作為動詞和名詞時的使用類型,調查中取其使用搭配的間距為+4。調查結果發現,“Struggle”能產性較高,可一起搭配不同的使用類型,其中動詞用法有867個,名詞用法有10 628個,具體如表6所示(其頻率最高的前15)。

表6 “Struggle”在COCA中的類型頻率
首先,基于語委語料庫的調查,從表3、4可知,“斗爭”的指稱用法在各結構中分布眾多,其中“動詞+斗爭”和“(修飾語)+斗爭”兩種結構類型占有較高頻率,分別為37.75%和35.05%。“揭露斗爭”“爭取斗爭”“加強斗爭”“復雜的斗爭”和“艱苦卓絕的斗爭”等范例在語料庫中頻繁出現。不僅如此,個例頻率較低于名詞用法個例頻率的動詞用法,在其類型頻率上卻也是分布廣泛。其中“動詞單獨使用”和“連動用法”占較高比例,分別為51.71%和30.44%。其次,基于COCA的調查,從表5、6可得,“struggle”的動詞用法和名詞用法明顯都有著超高的個例頻率,且類型搭配結構多樣。
個例頻率和類型頻率,導致了不同語言單位的鞏固。個例頻率促成個體詞例的固化,類型頻率促成更抽象圖式的規約化,[9](P118)類型頻率是語言結構能產性的重要決定因素,且與語言結構的能產性成正相關。[10](P95)因此,“斗爭”表示指稱和稱述的用法都已達到規約化程度,概括詞“斗爭”在漢語社群語言系統層面理應兼屬動詞和名詞詞性。
標注與詞典的微觀結構和宏觀結構有密切關系,而漢英詞典中兼類詞的處理問題主要是漢語詞目的兼類處理問題。兼類問題是漢語詞類問題研究的難點,同時也是詞典編纂研究的核心和關鍵。
由表1、2所知,《牛津9》將“Struggle”標為動名兼類詞,《現代漢語詞典》(第6、7版)和《現代漢語規范詞典》(第2版)將“斗爭”標為動詞。基于漢語詞典為藍本編纂的漢英詞典《新時代漢英詞典》和《漢英英漢雙解詞典》都將“斗爭”標為動詞,而另外《漢英詞典》(第3版)、《新世紀漢英大詞典》(第2版)和《漢英翻譯詞典》(2015)將其標為動名兼類。不僅詞典之間對于同一詞的釋義不同,各個詞典內釋義與詞類標注、配例與詞類標注也不協調。具體如下所示:
1.配例與詞類標注不協調
【斗爭】動:(1)“跟歪風邪氣做堅決的斗爭”“開斗爭會”(《現代漢語詞典》〈第6、7版〉);(2)“開展武裝斗爭”(《現代漢語規范詞典》〈第3版〉);(3)“新與舊的斗爭”|a conflict between the old and new(《新時代漢英詞典》);(4)“你死我活的斗爭”|life-and-death struggle(《漢英英漢雙解詞典》)。
2.釋義和詞類標注不協調
【斗爭】動 :群眾用說理、揭發、控訴等方式打擊敵對分子或壞人(《現代漢語詞典》〈第6、7版〉)。
不僅在詞典的微觀結構中出現諸多問題,在詞典的宏觀結構中也存在相應問題。在已有的一些定量研究中,王仁強通過調查發現:《現代漢語詞典》(第5版)共收錄65 815個條目,僅有3 479個兼類詞條,占總數的5.29%。[11]楊旭、王仁強指出《現漢》(第6版)收錄了69 232個條目,有3 746個兼類詞,占標注詞目的6.65%(標注詞目有56 325條)。[12]然而,在《牛津高階英語詞典》(第7版)整部詞典46 380個詞條中,有10.48%的兼類詞(共4 861個),共有125種兼類情況,其中以兼兩類為主(占兼類詞條總數的91.15%),名動兼類詞占 59.65%。[6]因其現代漢語和現代英語都是典型的分析語,[13](P295)而現代漢語的分析性高于現代英語,那么現代漢語兼類比例應該適度高于現代英語才真正符合現代漢語的現狀。但從上述數據得知,事實并非如此。由此可見,同為分析語的現代英語在處理兼類時,并沒有因為兼類增多及其他連鎖反應而給英語語法研究者帶來很多擔憂。相反,現代漢語的兼類問題處理方式卻是截然不同。出現這些情況的主要原因是受“簡約原則”的影響,“兼類要盡可能少”原則被視為金科玉律。不少學者在對兼類詞進行處理時也采取根據需要分情況進行,堅持“詞義不變,詞類不變”。王仁強、周瑜則指出,“簡約原則”存在誤用邏輯關系的現象,一階邏輯只能解釋言語句法層面的詞類范疇問題,而社群詞庫層面的詞類范疇問題則需要高階邏輯才能進行合理解釋。[14]由此可見,兼類問題處理的好壞直接關系到詞典的編纂質量,嚴重影響詞典微觀結構的準確表征,并且會影響漢語學習者的學習效率。相對應的,如果兼類問題研究的理論出現偏差,則會導致詞典微觀結構表征的實踐沖突。
此外,根據雙層詞類范疇化理論,詞典中詞目詞屬于社群語言詞庫層面,它標注的是概括詞的詞類歸屬,語料庫中的文本屬于言語層面的詞庫,它需要根據詞例在特定句子中的命題言語行為功能進行標注。楊惠中認為組合關系具有豐富的形式和內容,且組合軸上的意義也非常豐富。[15](P87-88)因此,只有通過強大的語料庫才能支撐詞語的組合關系,使準確發現詞義成為可能,而基于語料庫的使用調查能清楚地查看一個詞目的語法功能和詞義。基于對上述兩大中型語料庫調查得知,“斗爭”理應設立動詞和名詞兩個義項。基于語料庫編纂的現代英語詞典《牛津9》在其義項、釋義和范例設立方面都遵循大數據的統計分析,將“斗爭”對應詞“struggle”標注為動名兼類。但不同的是,即使在一個語料選材類別廣泛、時間跨度大,且庫容約為1億字符的大規模的平衡語料庫——國家語委語料庫原始數據中,盡管已明確“斗爭”詞類屬性,但漢語詞典卻在某種程度上因“簡約原則”而精簡其詞性,仍未增設其名詞義項。①
鑒于詞典的收錄對象是規約化的詞匯單位,表征的是語言層面詞庫中語言單位的意義潛勢,因而詞典中的詞項被視為語言系統中的一部分。所以,要想實現這些詞項的常規用法,只能通過大型語料庫分析。[16](P349-350)因此,要想提高詞典編纂效率,保證詞典使用質量,明確漢英詞類范疇,基于語料庫的使用模式調查是關鍵。再者,詞類的本質是表述功能,只有基于語料庫的調查,才能把握語言事實,確認其是否是兼類。根據雙層詞類范疇化理論可知,詞類是指社群語言層面詞庫中所屬的概括詞,個體詞在言語層面達到固化模式之后形成概括詞,即規約化后的詞。通過上述語料庫檢索數據可知,“斗爭”兼類詞分布模式符合言語(即使用中的語言)作為復雜系統表現出的“二八法則”。②兼類詞雖是少數,但卻是“關鍵少數”。由此可見,在一階邏輯指導下的“簡約原則”問題尤為明顯。
由上述結果和討論可知,“斗爭”在漢語社群語言系統層面應兼屬動詞和名詞詞性。因此,建議對漢語詞典“斗爭”的釋義和配例作出以下修改:
【斗爭】:dòuzhēng
動 (1)矛盾的雙方互相沖突,一方力求戰勝另一方:要勝利,就得~ ;(2)揭露批判;打擊:對危害人民利益的言行必須堅決~;(3)努力奮斗:為祖國的繁榮昌盛而~ 。
名(1)為爭取自由、政治權利等而采取的一種方式;一種長期艱苦的奮斗:權利~|爭取獨立的~ ;(2)用武力手段打擊敵對分子或壞人:兇殺現場沒有~痕跡|他正同對手進行一場激烈的~ ;(3)(對某人而言)是困難的,是難事:這個~是很困難的。
參照漢語詞典以及語委語料庫和COCA的調查分析為藍本,對漢英詞典中“斗爭”的釋義和范例作出以下修改建議:
【斗爭】:dòuzhēng
動(1)to struggle;fight;strive;combat: ~ 到底 fight to the end||同不正之風~ struggle unhealthy tendencies.(2)to expose;denounce;accuse:~貪污分子 to denounce embezzlers.(3)to strive; fight; work energetically:為真理而~ to fight for truth || 為完成五年計劃而~ strive for the fulfillment of the five-year plan.
名(1)a hard fight:權利~ a power struggle||善與惡的~the struggle between good and evil.(2)a physical fight:兇殺現場沒有~痕跡There were no signs of struggle at the murder scene||進行~ carry on/conduct/wage a struggle.(3)something that is difficult for you to do or achieve:這個~是很困難的this struggle is so difficult.
通過以上分析可知,漢英“斗爭”/“Struggle”做名詞表指稱的個例頻率和類型頻率均達到規約化程度,在社群語言系統層面理應標注為動名兼類詞。而通過“斗爭”的個例研究再次證明,雙層詞類范疇化理論兼顧經典邏輯和模糊邏輯,有效區分了概括詞和個體詞不同的范疇化過程,對分析語的詞類范疇化難題能夠提供更加完整合理的解釋。此外,詞典編纂應注重詞類標注、釋義模式和配例之間的同一性。語言是基于使用的,是歷史文化的積淀,在對兼類問題進行處理時,我們更應基于大中型語料庫的使用模式,采取自下而上的方式,系統而全面地調查,擺脫“簡約原則”的束縛,促進漢英詞典的發展,從而更好地服務于“漢語國際化”的戰略。
注釋:
①在3 183條“斗爭”索引中,2 439條為名詞,占總數的76.63%,744條為動詞,占總數的23.37%。
②語委語料庫中“斗爭”名詞2 217條,占總數的85.33%,381條動詞詞性用法,占總數的14.67%;在COCA中,動詞有8 387個,名詞有24 808個。