1.引言
機器翻譯(簡稱MT) 是相對于人的翻譯而言的,就是應用計算機實現從一種自然語言文本(稱為“源語言”)到另一種自然語言文本(稱為“目標語言”)的翻譯。MT 要實現對自然語言的翻譯,必然涉及對自然語言的理解。因此, MT 是自然語言處理研究領域的一個分支。從美國人維弗(Warren·Weaver)于1949 年發表《翻譯》備忘錄并正式提出機器翻譯的思想以來,機器翻譯可以說經歷了一條曲折而漫長的道路,從初期的發展到六十年代的停滯狀態,再到復蘇和八九十年代的發展,當今,隨著國際互聯網的日益普及和國際經濟文化交流的日益頻繁,對語言的自動翻譯系統的需求變得更加迫切。然而,機器翻譯的研究與開發卻極為困難。機器翻譯的譯文質量仍然讓人望而卻步。由于機器翻譯所要處理的自然語言是豐富而復雜的,尤其是漢語重意合輕形式,以意馭形的特點,使得對語言的分析要把語法和語義分析結合才能取得較好的效果;另外漢語語用上的眾多的省略現象使漢語理解非常依賴于語境知識;同時,漢語的歧義現象嚴重,詞法分析上的兼類現象,句法分析上的同形異構等對計算機來說都是很難處理的。計算機只是利用構成無限多句子的有限的詞和語法規則等來對自然語言進行理解。因此,在句子的層面上,機器翻譯的過程就轉化為依據某種語法理論提供的規則或計算機所存儲的一些知識庫來分析自然語言句子的過程。本文就變換分析在機器翻譯中的運用作了一些嘗試,指出了變換分析在自然語言理解與機器翻譯中的作用。
2.變換分析
變換分析是語法研究中的一種理論和方法。語言中大量同形異義格式和異形同義格式的存在,使得很多語法學家運用格式之間的可變換關系來研究語言問題。變換(transformation) 在西方語言學中有三種含義,第一種含義是指英國語言學家納斯菲爾德(J.C.Nesfield)的“把一個語法形式改為另一個語法形式而不改變它的意義”的句子“改換”,如疑問句和陳述句的改換、主動句和被動句的改換等等;第二種含義是指美國語言學家海里斯(Z.Harris) 在20世紀50年代初提出的不同結構的序列之間的等價“替換”;第三種含義是指美國語言學家海里斯的學生喬姆斯基(N.Chomsky) 創立的“轉換生成語法”的“轉換”,即指的是句子從深層結構如何生成表層結構的“轉換”。我國語言學界一般把海里斯的“transformation”稱為“變換”。在我國,將變換作為漢語語法分析的一種重要方法的是朱德熙。他認為,變換可理解為存在于兩種結構不同的句式之間的依存關系,可以作為語法分析或句法分析的手段或方法來運用。
變換分析,一般先要對某一句法結構(通常稱原式) 進行移位、刪除、添加、替代、合并等的操作整合,得出另一不同形式的句法結構(通常稱變換式) ,再通過比較、分析、歸納等抽象概括,揭示出句法性質,得出語法規律或解釋語法現象。
彭玉蘭在《變換分析法在漢語中的運用》(人大復印資料《語言文字學》,1997年第3期)中根據原式與變換式之間的語義是否相當把變換類型分為句義內變換和句義外變換兩種。句義內變換即變換前后句子的意義相當,變換的結果是構成同義句式。它又分為三種情況: ①移位變換,變換式中同現成分與原式的位置不同。②補丟變換,補是通過添加,讓變換式把原式隱含的語義成分、關系和結構表現出來;丟是通過刪除來給語言成分定性。③替詞變換,變換式中某詞語替換原式中某一相應詞語,變換前后的非同現成分具有相互注釋性。句義外變換一般表現為變換式在原式句義之外的添加成分,變換的結果是構成非同義句式。
3.變換分析在機器翻譯中的運用
英譯漢時,通常先分析句子的結構、形式,再確定句子的功能和意義;而漢譯英時,往往要先分析句子的功能、意義,才能確定句子的結構和形式。機器翻譯在源語是英語時,從結構到功能、從形式到意義的分析正好符合這種順序;而當源語是漢語時,則應在分析句法形式和語義結構的基礎上去探求合理的形式。因此,對句子的變換分析就比較符合這種漢—英翻譯的需要。
3.1 可變換句式之間的平行性原則決定了可變換句式之間的同義關系,通過變換可以發現、了解、確定句式之間的同義關系,為語用選擇提供了可比較的前提條件,從而也為語篇翻譯中的前后一致、主題一致提供了可能實現的手段。
在語用中,存在著話語的焦點,即表達的重點;在語篇中,主語一致可使文章更加流暢易懂,句式之間的同義變換可用于機器翻譯后期,對已生成的粗糙的目標語言進行修改、潤色,使之在與原文意義相符的基礎上主題更加突出,語句間銜接更加連貫。在語用上,把字結構的規律是它始終處于一個明確的因果關系的意義范疇之中,當需要強調這種因果關系時,便使用把字句,其語義重心或焦點在謂語部分;被字句是依靠介詞“被”引進謂語動詞的動作主體于動詞前作狀語,而把動作涉及的對象置于句首的句式,被字句中主語的被處置性對主語來說通常是不如意的,其信息焦點一般在句末。下面以主動句和帶“被”字的被字句之間的變換來說明,如:
(1)他不小心摔碎了花瓶?!?)他不小心把花瓶摔碎了。→(3)花瓶被他不小心摔碎了。→(4)花瓶是他不小心摔碎了。
在這些句子里,題元關系是一致的,即[施事:他][受事:花瓶],但話語的焦點則不同,(1)句是陳述句式。(2)句中,“把”字后面的“花瓶”為句子焦點;(3)句中,“被”字后面的“他”“不小心”都可以成為句子焦點;(4)句中,“花瓶”是主題,“他”或“不小心”是句子焦點。
在機器翻譯中,主動句和帶“被”字的被字句之間的變換可以描寫為:
⑴ S → NP1 VP
⑵ VP → V NP2
⑶ NP1 V NP2 → NP2 被 NP1 V
同義句式變換的處理流程圖可表示為:

3.2 變換分析可以用來分化歧義結構,
如:他誰都不相信。其內在語義特征有兩種:

這句話結構可以描寫為Np1+Np2+Vp,變換后對應著兩種句式:
⑴Np1+Vp+Np2
⑵Np2+Vp+Np1
其對應的英文翻譯分別為:
⑴He believes in nobody.
⑵Nobody believes in him.
3.3 機器翻譯中,當處理復雜的長句時,變換分析可以加深對原語的理解,從而對目的語句式的選擇和語義的分句表述提供借鑒。以漢英翻譯為例,下面將對漢語中的述補結構,連動句,兼語句作具體分析說明。
在漢語述補結構中,表層句法結構相同,深層語義結構可以不同,補語的語義指向也可以不同,通過變換分析可以發現其中的不同,有利于機器翻譯中原語與目標語的意義一致。
⑴他喝完了水。他喝水,水完了。
⑵他喝飽了水。他喝水,他飽了。
從上面的變換可以看出,⑴句中的補語“完”的語義指向是作為受事的“水”, ⑵句中的補語“飽”的語義指向是作為施事的“他”,因此,在進行漢英翻譯時,如果漢語中的補語在譯為英語時用從句或復句來表達的話,基于變換的原語分析則為從句種類的選擇或復句連詞的選用提供了語義上的依據。
由于漢語動詞沒有定式和不定式之分,使得漢語句子謂語中可以連用多個動詞性短語作謂語 ,這是現代漢語謂語部分復雜性的主要表現。而動詞連用的格式又可以分為連動句和兼語句兩類。同時,現代漢語的賓語部分也比較復雜,可以用一個完整的句子來做賓語。對這三類句子可以用變換分析來區分。先看下面的例子:
⑶我出去打電話。我出去,我打電話。
⑷我通知他買書。我通知他,他買書。
⑸我知道他買書。我知道他買書這件事。
⑶句為典型的連動句,“出去”和“打”兩個動詞共享一個施事主語“我”。
⑷句是典型的兼語句,“他”既是“通知”的受事賓語,又是“去北京”的施事主語。
⑸句“他買書”是動詞“知道”的受事。三句的變換規則可以形式化表述為:
⑶S V1 V2 O?S V1,S V2 O.
⑷S V1 O1 V2 O2?S V1 O1,O1 V2 O2.
⑸S V1 O1 V2 O2?S V1(O1 V2 O2).
由此,可以比較容易地得出三句的句法樹結構:
(3) 連動句 (4) 兼語句

4.結語
在MT語言處理過程中,對原語的變換分析可以把復雜長句的句法分析和邏輯語義分析充分地結合起來,變換規則庫的嵌入,對目標語的生成在句式的選擇上、歧義分化翻譯,以及篇章一致基礎上的語用選擇上,都提供了手段與可供選擇的基礎。雖然,機器的自然語言理解還處于不盡如人意的階段,變換規則庫的使用條件與完善,都有待進一步地細化與研究,但是變換分析在機器翻譯中所能起到的積極意義是值得進一步探索的。
參考文獻:
[1]陳昌來.現代漢語句子[M].華東師范大學出版社,2000.
[2]王祁.格語法在英漢機器翻譯系統中的應用研究[J].東北大學學報,2005,(11).
[3]劉倬、傅愛平.機器翻譯中漢語的形式和語義分析二題[J].中文信息學報,第13卷第5期.
[4]曹翔.漢語語法變換分析與變換類型研究述評[J].河海大學學報,第5卷第3期.
(李培培,河北大學人文學院)