宋廣波
(山西大同大學煤炭工程學院,山西大同037003)
原文預處理法在漢英機器翻譯中的應用
宋廣波
(山西大同大學煤炭工程學院,山西大同037003)
隨著機器翻譯技術的發展,越來越多的人嘗試使用機器翻譯來完成或輔助完成翻譯任務。然而,由于當前機器翻譯技術存在局限性,導致了機器翻譯質量尤其是漢譯英的翻譯質量低下,準確性和可讀性往往較差,從而限制機器翻譯的應用范圍。我們要根據漢英基本句型對應理論以及簡潔性原則,只需對原文進行快速、簡單的預處理,即可大幅度提高譯文的準確性與可讀性,從而大幅度地提高機器翻譯的質量。
漢譯英;機器翻譯;基本句型;預處理;翻譯質量
用計算機自動完成翻譯任務是人類長期以來的夢想。如今,機器翻譯已經成為職業和非職業譯者、翻譯機構不可或缺的得力幫手。[1]機器翻譯是建立在語言學、數學、信息學、計算機科學等學科基礎上的多邊緣學科。[2]然而,由于中西語言、文化等差異以及當前機器翻譯發展水平的局限性,漢英機器翻譯質量總的來說不夠理想,準確率不高,可讀性差,可用率低,后期處理難度高、工作量大。從某種意義上講,機器翻譯似乎該為晦澀難懂、低質量的譯文泛濫“負全責”。
那么,機器翻譯真的是“低質量譯文”的代名詞嗎?對此,筆者進行了針對性的探索,通過大量的理論研究和對比實驗,發現漢英基本句型對應關系對于機器翻譯質量的研究具有基石作用。鑒于在國內漢譯英的應用者一般為受過良好中文教育的國人,中文理解、表達能力相對較強是一大優勢,利用這個優勢,在保持原文意義不變的情況下,根據這兩種語言之間的基本句型的對應關系,只需花少量的時間和精力先改寫中文的句型結構,并盡量簡化詞句的表達方式,然后再放入翻譯引擎中進行翻譯,即可得到準確性、可讀性均大幅度提高的譯文,為后期的修改、潤色及其他后期處理提供了莫大的便利。[3]可以說這個方法省時省力,效果好,具有明顯的推廣價值。
中文是東方的象形文字,英文卻是西方的拼音文字,似乎兩者之間無任何“默契”可言。而一些淵源相近的語言,例如法語和英語之間的互譯用機器翻譯來做又快又好。筆者在瀏覽法語、德語網頁的時候,往往會利用“百度翻譯”等網絡翻譯引擎把這些網頁翻譯成英語而不是漢語進行閱讀,這是因為西方語言和漢語在語法等方面差異實在太大了,機器翻譯的結果往往令人費解,給人的感覺往往是既不準確,也不可靠。
幸運的是,當前語言學者的研究成果表明,經過“格式化”的漢語和英語在語法結構上也有驚人的相似性。這些基本對應的句型有主謂結構、主謂賓結構、主系表結構、雙賓語結構以及主謂賓補結構。[4](P57-64)為了更好地說明這個基本句型對應理論,筆者在下面給出各種基本句子結構的例句。為了便于對照,各例句主語用著重號表示,謂語用斜體表示,賓語用下劃線表示,賓語補足語用波浪線表示,表語用虛下劃線表示。鑒于狀語明確性高,為了簡便起見,例句中的狀語一般予以省略。
1.船沉了?!鶷he ship sank.
2.他們消失了。→They disappeared.
3.價格已經下降了?!鶷he price has dropped.
1.我愛你?!鶬 love you.(賓語為代詞)
2.愛麗絲討厭螞蟻?!鶤lice hates ants.(賓語為名詞)
3.他們喜歡爬山。→They like climbing mountains.(賓語為動名詞)
4.他想喝一杯啤酒?!鶫e wants to have a glass of beer.(賓語為動詞不定式)
5.我們不知道他喜歡什么?!鶺e don't know what he likes.(賓語為從句)
6.她在看著那個玻璃杯。→She is looking at the glass.(不及物動詞+介詞結構可以看成等同于及物動詞)
7.彼得擅長數學?!鶳eter is good at math.(系動詞+形容詞+介詞結構可以看成等同于及物動詞)
1.她(是)漂亮(的)?!鶶he is pretty.(表語為形容詞)
2.我是一名學生。→I am a student.(表語為名詞)
3.湯姆(是)在圖書館里?!鶷om is in the library.(表語為介詞)
4.目的是幫助其他人?!鶷he purpose is to help others.(表語為不定式)
5.它不是你所喜歡的。→It is not what you like.(表語為從句)
需要注意的是在漢語中形容詞可以直接做謂語,而在英語中一般不可以。因此一個翻譯引擎若出現無法有效識別形容詞做謂語的情況,原文應該改寫為標準主系表結構,以便機器識別。
1.我教他英語。→I teach him English.
2.他遞給我一只鋼筆→He passed me a pen.
3.那個男人搶走了他的手表?!鶷hat man robbed him of his watch.
第三組例句中“of his watch”構成了介賓結構,可以看成是雙賓語結構的變形。
主謂賓補結構即主謂賓+賓語補足語結構,用法非常靈活,表達能力極強。在英文中,賓語補足語成分可以由多種詞性充當。
1.他讓我生氣了?!鶫e made me angry.(賓補為形容詞)
2.我們選舉他為總統?!鶺e elected him president.(賓補為名詞)
3.他叫我過來?!鶫e asked me to come.(賓補為動詞不定式)
4.我看見她在讀一本書?!鶬 saw her reading a book.(賓補為現在分詞短語)
5.讓窗戶關住。→Keep the window closed.(賓補為過去分詞,表示被動)
6.湯姆發現她在圖書館里?!鶷om found her in the library.(賓補為介詞短語)
基本句型對應關系是所有機器翻譯引擎的基礎。由于技術限制,機器翻譯中的長句中斷句、斷詞往往不夠準確,造成誤譯或譯文晦澀難懂,但是翻譯引擎依然擅長處理簡單句。因此,從理論上說,在使用機器翻譯進行漢譯英前,花少量時間把漢語句子盡量改寫為機器可識別的最基本句型并盡量簡化表達方式,即可大幅度提高譯文質量。這個方法,筆者稱之為“基于漢英基本句型對應理論和精簡原則的預處理法”。具體的做法是:1、如果主句或從句過于復雜,內含多個從句或者修飾、限制成分,則拆分為最多包含一個從句的基本句型;2、如果有成分省略,則予以補全。3、生僻、繞口、晦澀或機器難以識別的表達方式,更改為簡單、直接的表達方式。
中文原文:曾經看到那些假日垂釣者,獨釣一天,空手而歸。
百度翻譯結果:Ever see those holiday anglers,fishing day,empty handed.
原文預處理后:以前我經常在假日看到那些垂釣者,他們勞動了一整天,可是他們空手而歸。
百度翻譯結果:I used to see those holiday anglers,they work all day,but they left empty handed.
后期處理、潤色結果:In holidays,I used to see those anglers who worked all day but left emptyhanded.
由于機器翻譯往往用于輔助翻譯,或用在要求不太高的場合,如網頁即時翻譯等,因此,機器翻譯給傳統翻譯的普遍性原則“忠實、通順”賦予了更多的含義。為了更好地進行量化以便打分評估,在此筆者采用“準確性”和“可讀性”兩大指標來量化這個翻譯標準。[5]所謂準確性,主要在于信息的完整性,既不添加多余的信息,又不遺漏重要的信息和必要的細節,不會造成讀者誤解。所謂可讀性,主要指譯文的閱讀難度。越容易閱讀,可讀性就越高;而句子結構越復雜,可讀性就越低。有趣的是,中英5種基本句型都是最簡單的句型,天生就具有很高的可讀性,因此看起來簡單,卻值得深入探討、研究。
為了更好地說明本文中所提出的方法的實效性,筆者以準確性和可讀性兩大指標,設計了漢英機器翻譯質量對比實驗。準確性主要由筆者和從事英語教學的同事把關、打分(共5人),而可讀性主要由筆者和其他4名以英語為母語的、受過高等教育的英、美、加拿大籍人士通過互聯網打分(共5人)。分值為去掉最高分、最低分后的平均分。這兩個指標均采取百分制。為了簡化實驗,不牽涉其他問題,專業詞匯由專業詞典提供,不計入準確性考察范圍。本實驗建立在知名度較高、應用較為廣泛的“百度翻譯”引擎的基礎上,一共對比了10段不同題材的漢譯英翻譯質量,每段原文大約為80至120個漢字。
應用“預處理法”后,漢英機器翻譯質量明顯提升。

表1 利用預處理法前后機器翻譯質量對比表
機器翻譯有著廣泛的應用前景,技術進步不但需要人工智能專家的算法改進,還需要語言學者對語言規律的深入挖掘。通過本文實驗表明,在漢英機器翻譯過程中,只需花很短的時間,用很少的精力對漢語原文進行“預處理”,就可以大幅度地提高翻譯質量,得到較為滿意的翻譯結果。譯文準確率更高,可讀性更強。對于輔助翻譯的譯者來說,僅需要進一步勘誤和加工潤色,即可最大程度地提高翻譯效率,降低翻譯成本。
[1]范文.機器翻譯.原理、方法與應用[J].廣西師范學院學報(哲學社會科學版),2015(05):106.
[2]戴新宇,尹存燕,陳家駿等.機器翻譯研究現狀與展望[J].計算機科學,2004,31(11):176-183.
[3]崔啟亮.論機器翻譯的譯后編輯[J].中國翻譯,2014(06):68-73.
[4]宋廣波,黃月花,趙偉寧.大學英語筆譯教程[M].長春:吉林大學出版社,2015.
[5]周光父,高巖杰.論機器翻譯質量的評估[J].上??萍挤g,1989(04):16.
A Study of a Pre-processing Method in Improving the Output Quality of Chinese-English Machine Translation
SONG Guang-bo
(School of Coal Engineering,Shanxi Datong University,Datong Shanxi,037003)
With the development of Machine Translation Technology,more and more people try to apply it to fulfill or help fulfill translation tasks.However,due to the limitations of current technology,Machine Translation suffers from low output quality,with poor accuracy and readability,which in turn limits the application of Machine Translation.This article is based on the theory of“Equivalence of Basic Sentence Patterns”and simplicity principles,as long as a pre-processing method is employed,which is fast and simple,the accuracy and readability of the output can be dramatically improved,which ultimately improves the translation quality in a large scale.This study also provides a new thinking for the development of Machine Translation technology in the perspective of linguistics.
Chinese-English translation;Machine Translation;basic sentence patterns;pre-processing;translation quality
H315.9
A
1674-0882(2016)05-0074-03
2016-06-30
宋廣波(1972-),男,江蘇沭陽人,碩士,講師,研究方向:翻譯理論與實踐、英美文學。
〔責任編輯 裴興榮〕