袁曉慧
(湖南工業大學,湖南 株洲 412007)
“機器翻譯”的概念由Weaver 提出,他將翻譯過程視作“解碼”的過程[17]。 機器翻譯借助計算機系統,自動地將一種自然語言轉換成另外一種自然語言[6]。 最初提出機器翻譯的構想是為了實現完全自動化的高質量翻譯,即無需人工參與,據后來的實踐發現機器翻譯雖提高了效率,但譯文的質量卻不盡如人意。 據此,機器翻譯無法脫離人工審校。 狹義的“譯后編輯”指直接對通過機器翻譯得到的譯文進行修改[3];廣義的“譯后編輯”是在集成翻譯環境中,為了保持譯文質量和翻譯效率,資深的編輯人員基于規定的質量目標,對輸出的初始譯文進行人工評審或部分自動化修訂的過程[2]。 由于狹義的“譯后編輯”的研究成果具有普遍性,且譯后錯誤明顯,故文章特以法律文本為例展開研究,探討法律文本的譯后編輯方法。
英國翻譯理論家Peter Newmark 將文本分為表達型文本、呼喚型文本、信息型文本三種類型[11]。其中,信息型文本旨在以通俗易懂的方式,用便于理解的語言向讀者傳遞文本信息[11]。 信息型文本的核心是內容的真實性,其重點在于真實且準確地傳達文本信息,而說話者的語言形式則是次要的[18]。 信息系統中的信息分為已知信息和新信息[5]。 已知信息是指已經出現過或可根據語境斷定的成分;新信息和已知信息相悖,是指未出現過或無法根據語境斷定的成分[7]。
法律文本具有嚴謹、專業、精確、邏輯性強的特點[1],且中文法律文本風格簡明。 因而,編輯人員在處理法律文本的機翻譯本時,需要斟酌是否有隱藏的已知信息尚未翻譯。 文章研究的法律文本均選自紹興文理學院的中國法律法規漢英平行語料庫(大陸),該語料庫內容齊全,涵蓋傳染病防治法及殘疾人保障法,對外貿易法與商標法等。
目前市場上較為認可的翻譯管理平臺有YiCAT、DeepL、Google Translate、有道翻譯、搜狗翻譯等,其中YiCAT 是翻譯項目管理平臺,使用過程中可以選擇有道翻譯、搜狗翻譯等引擎,故在此不做研究考慮。 DeepL 是一款德國研發的在線翻譯平臺,支持中文、英語、德語等九種語言之間的全文翻譯,其運行方式是利用人工智能技術和神經網絡來不斷訓練和提升翻譯能力[4]。 2020 年3 月19 日,DeepL 翻譯平臺將中文納入系統,逐漸打敗谷歌,成為后起之秀。 在選取2020 年《政府工作報告》段落為原文進行試譯后,DeepL 的準確度最高。 鑒于此,文章選擇DeepL 為研究工具。
功能派翻譯理論代表人物主要是德國學者Katharina Reiss、Hans J. Vermeer、Justa Holz Mantari 和Christiane Nord 等[21]。 該理論的發展大致可看作四個重要階段,分別為Reiss 的功能主義翻譯批評理論、Vermeer 的目的論及其延伸理論、Mantari 的翻譯行為理論和Nord 的功能+忠誠原則[9]。 Nord 對翻譯學的貢獻是多方面的[20],文章主要探討功能+忠誠原則,此概念在《翻譯中的語篇分析》中首次提出[12]。 “功能”原則指譯文在目標譯文中實現預期的功能[9],“忠誠”原則要求譯者協調翻譯任務發起者、原文作者以及譯文讀者之間的人際關系,譯者在協調好三者人際關系的情況下運用自己的專業技能去實現譯文的功能[9]。 諾德的理論雖然不能解決所有的翻譯問題[20],但足以為譯員提供借鑒。
相較翻譯能力,譯后編輯能力是新興概念[10]。現代技術發展日新月異,越來越多的學者開始把工具或技術能力視為翻譯能力的有機組成部分,翻譯學正在發生技術轉向[16],而機器翻譯錯誤可以為專門的譯后編輯工具研發提供依據[3]。 文章按照李梅、朱錫明[8]的研究框架,最終確定的考查方面有:詞匯術語(術語誤譯為一般義)、詞匯連詞(and 和when 等誤譯)、詞匯漏譯(源語言未完全譯為目標語言)、句法次序(次序錯誤,如定語后置等)、句法被動態(主被動語態轉換錯誤)等。
例1 原文:甲類傳染病病原體
DeepL 譯文:Category A infectious disease pathogens
譯后編輯:the pathogen of A Class infectious diseases
錯誤類型:詞匯術語,句法次序。
錯誤解析:①詞匯術語:Category A—A Class。
②句法次序:病原體前置至句首。
例1 說明的是名詞誤譯現象。 短語中的甲類傳染病已有標準譯法,系法律規定的專業術語,指鼠疫與霍亂。 而機器翻譯對已經標準化的術語,依然無法準確翻譯。 因此,在處理術語時,譯者必定要查看語料庫以求證準確性,做到“忠誠”于翻譯任務發起者、原作者。 DeepL 譯文采取了直譯的翻譯策略,但將“病原體”放在末尾,模糊了短語的核心詞匯,故在譯后編輯的過程中對其位置進行修改。
例2 原文:情節嚴重的,吊銷營業執照。
DeepL 譯文:Serious cases, revoke the business license.
譯后編輯:If the case is serious, the company's business license shall be revoked.
錯誤類型:詞匯漏譯,句法被動態,句法次序。
錯誤解析:①詞匯漏譯:原文隱含假設的邏輯關系,在譯文中應體現出來,且DeepL 譯文中缺少連詞,“serious cases”沒有謂語,與后面的分句并不能并列。
②句法被動態:revoke—shall be revoked。
③句法次序:情節前置至句首。
例2 為陳述句,DeepL 顯然繼續運用直譯,導致語句缺少銜接。 原文暗含的主語是“營業執照”的持有者,即“the company”,此處可根據語境判斷為已知信息。 但DeepL 顯然不能發現原文中隱藏的邏輯關系,導致已知信息出現漏譯。 詳盡分析這些錯誤后,按照功能+忠誠原則對DeepL 譯文進行一一修改。 在DeepL 譯文的基礎上,添加主語,補假設充邏輯關系,做到忠誠于原文,避免誤譯,正確傳達信息型文本想要傳遞的信息,充分發揮信息型文本的功能,從而忠誠于原作者意圖。
例3 原文:注冊商標需要改變文字、圖形的,應當重新提出注冊申請。
DeepL 譯文:If the registered trademark needs to change the text or graphics, it should reapply for registration.
譯后編輯:Where any word or device of a registered trademark is to be altered, a new registration shall be applied for.
錯誤類型:詞匯連詞,詞匯術語,句法次序。錯誤解析:①詞匯連詞:If—Where。
②詞匯術語:text—word, graphics—device。③句法次序:“重新申請”前置作主語。
例3 為祈使句,句中的“If”表示假設,為了忠實于任務發起者,嚴謹準確地傳達原文內容,特在譯后編輯中將其改為“Where”,即“在……情況下”。原文結構簡單,無特殊句型。 但英文常把重點放在句首,鑒于此,對DeepL 譯文的次序調整,使其符合英文的行文結構,更加忠誠于譯文讀者。 DeepL 的術語翻譯和例1 類似,無法處理專業性強的術語,為譯文帶來了風險和不確定性。
以上選取了含有名詞短語、陳述句、祈使句等不同類型語料,借助DeepL 翻譯根據功能+忠誠原則對其譯后編輯。 通過以上示例,可以發現相同或類似的錯誤重復率高,尤其是詞匯術語和詞匯漏譯,這種漏譯基本都因DeepL 無法處理原文的邏輯關系導致。 翻譯記憶庫(translation memory)在術語運用及術語一致方面能夠發揮很好的作用,是非常必要的,然而這僅限于解決詞匯、詞組等層面的問題,卻無法從語篇角度解決問題。 從語塊到語篇,還需注意銜接與連貫[15],而這一過程依賴人工譯后編輯。
譯后編輯是機器與人工共同合作的結果,但譯后編輯也需要由具體的翻譯原則指導。 文章探究了功能+忠誠原則對信息型文本的指導作用。 借助中國法律法規漢英平行語料庫(大陸),文章對法律文本進行了分析。 盡管示例僅是語料分析中的極小部分,但機器翻譯的常見錯誤可見一斑。 機器翻譯在詞匯層面,術語誤譯最多;在句法層面,次序紊亂和主被動語態轉換錯誤頻繁出現。 語料庫詞匯術語錯誤可以通過收集語料,建立語料庫解決,而由于無法理解邏輯關系造成的句法次序紊亂才是攻克的難關。 通過將機器翻譯產出的譯文與標準譯文對比,歸納機器翻譯錯誤的主要類別語言規律,使得機器妥善處理邏輯關系,為譯后編輯軟件的研發提供基礎,并將逐漸引起關注。