摘要:機器翻譯雖然可以較好實現(xiàn)文本翻譯的目的,但所生成的譯文質(zhì)量仍然難以達到高水平人工翻譯的質(zhì)量水平。基于此,“機器翻譯+譯后編輯”的人機合譯模式的出現(xiàn)使翻譯效率得到了革命性的提升,實現(xiàn)了重大語言技術(shù)突破。然而,譯后編輯存在一定的局限性。在進行機器翻譯譯文校對和修改時,需要人工反復對照原文本,識別并糾正機翻譯文的錯誤,不僅降低整體翻譯效率,也會增加成本。該文將借助人工干預的譯前編輯,提高民族文化文本《民族文化經(jīng)典故事叢書:土家族》的機器翻譯譯文質(zhì)量,并以其產(chǎn)出譯文作為研究對象,從術(shù)語翻譯、原文本刪減與增補等方面提出策略,并通過實例進行論證,探討如何通過譯前編輯改善機翻譯文質(zhì)量。
關(guān)鍵詞:民族文化翻譯;機器翻譯;譯前編輯;人工干預;人機交互;術(shù)語翻譯
中圖分類號:H315.9 文獻標識碼:A 文章編號:2096-4110(2024)06(c)-0035-04
Application and Exploration of Pre-translation Editing for Machine Translation in the Translation of National Culture Classic Story Series: Tujia Nationality
PENG Jingyi
(School of Foreign Languages, Hubei Minzu University, Enshi Hubei, 445000, China)
Abstract: Although machine translation can achieve the purpose of text translation, its quality is still difficult to reach the quality of high-level human translation. Therefore, the emergence of the human-machine translation mode of "machine translation + post-translation editing" has greatly raised translation efficiency and achieved a breakthrough in language technology. However, post-translation editing has certain limitations. When proofreading and modifying machine translation, human beings are required to repeatedly check the original text to identify and correct errors in the machine translation, which not only reduces the overall translation efficiency, but increases the cost. This paper will improve the machine translation quality of the ethnic culture text National Culture Classic Story Series: Tujia Nationality with the help of human intervention of pre-translation editing, take its output translation as the research object, and put forward strategies from the aspects of terminology translation, original text deletion and addition, etc., demonstrating them through examples,in order to explore how to improve the quality of machine translated text through pre-translation editing.
Key words: Ethnic cultural translation; Machine translation; Pre-translation editing; Manual intervention; Human-computer interaction; Term translation
當前,國家大力推動中國文化“走出去”,少數(shù)民族文化外譯成為其中重要組成部分。尤其是隨著“一帶一路”建設(shè)的發(fā)展推進,少數(shù)民族文化外譯也成了“一帶一路”沿線國家和地區(qū)了解認識中華文化的重要途徑。目前,基于神經(jīng)網(wǎng)絡(luò)技術(shù)的機器翻譯給機器翻譯的譯文質(zhì)量帶來了革命性的提升,并以其經(jīng)濟、快速的特點在各個領(lǐng)域都得到了廣泛的應(yīng)用[1]。因此將機器翻譯應(yīng)用于民族文化外譯也是大勢所趨。然而,機器翻譯雖然可以較好完成文本翻譯的任務(wù),但所生成的譯文質(zhì)量仍然難以達到高水平人工翻譯的質(zhì)量水平。尤其是處理一些特定文體的翻譯時,理解錯誤、表達生硬等問題層出不窮。因此機器翻譯的應(yīng)用仍然需要搭配人工干預來保證譯文質(zhì)量。
1 譯前編輯研究現(xiàn)狀審視
人機交互的機器翻譯主要包含兩種類型,一種為譯前編輯(pre-editing of machine translation),另一種為譯后編輯(post-editing of machine translation)。譯前編輯指在人工干預、編輯和修改源語文本的前提下,運用機器翻譯軟件對源語文本進行翻譯處理,最終生成目的語文本的過程[2]。譯后編輯則指的是對機器翻譯的初始譯文進行修訂和編輯的過程,已廣泛應(yīng)用于全球語言服務(wù)行業(yè),例如Microsoft、SDL International等很多大型公司和機構(gòu)都擁有自己的譯后編輯團隊。
當前,人機交互翻譯的研究主要集中在譯后編輯上,尤其是針對某一類型文本譯后編輯的錯誤及實施策略的研究[3]。然而,譯后編輯在實際應(yīng)用中存在一定的局限性。例如,在對機器翻譯譯文進行校對和修改時,人工需要反復對照原文本以識別并糾正機器翻譯文本的錯誤,不僅耗時耗力,也會增加成本[4]。因此,可以考慮采用譯前編輯進一步提高機器翻譯的效率,減少譯后編輯工作量。
譯前編輯會根據(jù)語言差異,在譯前對原文本進行編輯,尤其是將在機器翻譯中可能會遇到問題的詞語或句子列出,進行人工修改或移除,提高原文本的可譯性。譯前編輯可以使原文本語言結(jié)構(gòu)更易被機器翻譯引擎識別,一定程度上提高機器翻譯譯文的準確性與可讀性[5]。基于以上優(yōu)勢,譯前編輯對保障譯文質(zhì)量起著不可忽視的重要作用。然而文獻檢索表明,當前翻譯界對譯前編輯沒有表現(xiàn)出足夠重視。目前,有關(guān)譯前編輯研究的文章數(shù)量不足,研究主題集中在譯前編輯策略對機器翻譯質(zhì)量和譯后編輯效率的影響,且主要關(guān)注的文本類型為新聞文本與技術(shù)文本[6]。由此,本研究擬探索采用譯前編輯提高民族文化文本機器翻譯譯文質(zhì)量的路徑與策略。
2 譯前編輯在民族文化文本機器翻譯中的應(yīng)用
本研究采用DeepL在線翻譯工具(DeepL Translator)作為技術(shù)手段,DeepL翻譯工具是由德國DeepL GmbH公司于2017年8月推出的免費神經(jīng)機器翻譯服務(wù)。該翻譯器采用世界上最大的人工翻譯數(shù)據(jù)集之一——Linguee,利用人工智能和神經(jīng)網(wǎng)絡(luò)訓練翻譯能力,產(chǎn)出的譯文流暢通順,準確率高。根據(jù)DeepL官方網(wǎng)站數(shù)據(jù),在2020年和2021年,該公司聘請了外部專業(yè)譯員對DeepL 翻譯、谷歌翻譯、微軟翻譯及Facebook 的NMT系統(tǒng)的譯文進行盲測,專業(yè)譯員需要在對譯文出處不知情的情況下選擇最準確的譯文,最終DeepL翻譯以 3:1的系數(shù)優(yōu)勢遠超其競爭對手。
本研究選擇的文本對象是《民族文化經(jīng)典故事叢書:土家族》。該書是由外語教學與研究出版社出版的少數(shù)民族民間故事集,由一系列趣味橫生的土家族民間故事串聯(lián)起來,每個故事均配有精美手繪插圖。其中既有大量的少數(shù)民族文化專有項與專業(yè)詞匯,又有土家族服飾、飲食、建筑、姓氏等方面特色的解說性內(nèi)容,是了解土家族民族風俗習慣等的絕佳讀本[7]。
2.1 術(shù)語翻譯
2.1.1 統(tǒng)一民族文化術(shù)語翻譯
在民族文化文本的翻譯中,具有民族特色的術(shù)語或?qū)S许棾霈F(xiàn)頻率較高,且部分術(shù)語有多種翻譯版本混用,造成意義指代不明的情況。這就需要人工在機器翻譯前對原文進行術(shù)語統(tǒng)一,進行詞義選擇,使其符合該文本語境,從而避免譯后審校時再逐一統(tǒng)一術(shù)語表達。
例1:從內(nèi)蒙古大草原蒙古族的“那達慕”賽馬競技,到云南西雙版納傣家山寨的潑水節(jié)……
DeepL譯文:From the "Naadam" horse racing competition of the Mongols in the Inner Mongolia prairie to the Water Splashing Festival in the Daijia cottage in Xishuangbanna, Yunnan Province...
根據(jù)原文語境,此處“蒙古族”在文中特指中國內(nèi)蒙古自治區(qū)的少數(shù)民族“蒙古族”,而DeepL給出的翻譯“the Mongols”也有蒙古國人的意思,所以該翻譯版本會產(chǎn)生歧義,在譯前選擇“Mongolian”或“the Mongol nationality”對術(shù)語進行統(tǒng)一可以提高譯文準確性。
2.1.2 民族文化術(shù)語的預翻譯處理
DeepL數(shù)據(jù)庫中儲存的中華民族術(shù)語數(shù)量有限,尤其是少數(shù)民族術(shù)語,因此譯者可通過在譯前先行確定部分文化意義深厚的術(shù)語翻譯,從而避免機翻譯文中出現(xiàn)大范圍的直譯或硬譯,減少譯后編輯的工作量,提高機器翻譯的效率。
例2:從舞動在白山黑水間的朝鮮族長鼓舞,到響徹青海湖畔的土族“花兒”;從在綠得醉人的新疆吐魯番葡萄溝翩翩起舞的維吾爾族舞蹈……
DeepL譯文:From the Korean long drum dance that dances among the white mountains and black waters to the "flower children" of the Tu ethnic group that resonates along the shores of Qinghai Lake; from the Uyghur dance that dances in the intoxicatingly green Turpan Grapevine in Xinjiang to ...
《金史·世紀》:“生女之地有混同江、長白山。混同江亦號黑龍江,所謂‘白山黑水’是也。”[8]由此,原文中的“白山黑水”特指長白山和黑龍江,泛指我國東北地區(qū),并非真的是白色的山和黑色的河水。所以在英譯時,應(yīng)將“白山黑水”的指代意義翻譯出來,即“Changbai Mountain and Amur River”或“the Northeast of China”。但由于DeepL數(shù)據(jù)庫中未儲存該詞語,將其直譯為“the white mountains and black waters”,即“白色的山與黑色的水”,未將其指代意義譯出,也會讓外國讀者產(chǎn)生理解障礙。因此在進行機器翻譯前,應(yīng)對這類詞匯進行預翻譯。
“花兒”特指土族的一種民歌形式,因歌詞中將青年女子比喻為花兒而得名。它是產(chǎn)生于甘肅臨夏,并流行于甘、青、寧、新等西北地區(qū)的一種山歌,唱詞浩繁,文學藝術(shù)價值極高,被稱為“西北之魂”。關(guān)于“花兒”的翻譯,姜學龍?zhí)岬搅巳N:第一種是漢語拼音 Hua'er,第二種是 Huar,第三種是 Flower Song[9]。但DeepL將其直譯為“flower children”,即“花的孩子”,顯然該翻譯器中并未儲存中國少數(shù)民族民歌“花兒”的相關(guān)術(shù)語翻譯。因此譯者在翻譯時,需要提前選擇該術(shù)語的翻譯版本,將其轉(zhuǎn)化為目標語,才能達到術(shù)語翻譯的統(tǒng)一。
2.2 原文本的刪減與增補
中英文兩種語言屬于不同的語系,在書寫規(guī)范、銜接手段、行文簡潔性、句法結(jié)構(gòu)等方面存在很大差距[10]。在機器翻譯前,根據(jù)原文本特征進行恰當刪減與增補,可以使機器翻譯更好地識別原文內(nèi)容,減少譯后編輯的工作量,提高翻譯效率。
2.2.1 刪減冗余信息
中文是意合語言,行文慣用四字格進行堆疊,使文章讀來具有節(jié)奏感。英文是形合語言,行文強調(diào)邏輯性與簡潔性[11]。因此,當原文中有意義相近的四字格詞語時,直接進行機器翻譯會降低譯文質(zhì)量,造成譯文冗余。所以,在機器翻譯前,對意義重復的四字格進行整合與刪減,可以使產(chǎn)出譯文更加符合英文行文規(guī)范,提高譯文質(zhì)量。
例3:正是這色彩斑斕、風格各異的多民族文化,共同構(gòu)成了中國文化萬千氣象、萬紫千紅、萬古長春的壯麗畫卷。
DeepL譯文:It is this colorful and diverse multi-ethnic culture that together form a magnificent picture of Chinese culture with ten thousand phenomena, ten thousand purples, ten thousand reds, and ten thousand ancient springs.
萬千氣象形容景象或事物壯麗而多變化,萬紫千紅多指繁盛的春色,也比喻事物豐富多彩。但DeepL譯文卻直接將“氣象”理解為“現(xiàn)象”,譯為“phenomena”,將“紫”和“紅”理解為兩個具體的顏色,譯為“purples”與“reds”。事實上,這兩個四字詞語意義重復,可結(jié)合原文語境將二者整合為一個四字詞語:豐富多彩。從而避免機器翻譯強行直譯,造成譯文冗余,給譯文讀者造成理解障礙。
譯前編輯后的原文:正是這色彩斑斕、風格各異的多民族文化,共同構(gòu)成了中國文化豐富多彩、萬古長春的壯麗畫卷。
譯前編輯后的DeepL譯文:It is this colorful and diverse multi-ethnic culture that together form a magnificent picture of Chinese culture that is colorful and everlasting.
經(jīng)譯前編輯后,DeepL也理解了后文“萬古長春”的詞義,將其譯為“everlasting”而非之前的“ten thousand ancient springs”,大大提高了譯文的簡潔性與準確性。
2.2.2 增補必要字詞
翻譯時,譯者可以根據(jù)英漢兩種語言的邏輯結(jié)構(gòu)和表達方式的不同,添加部分字詞,使譯文的意思表述更準確[12]。因此,在對原文本進行譯前編輯時,在原文中增添邏輯關(guān)系詞也是提高譯文質(zhì)量的方法之一。
例4:吊腳樓一半立在平壩上,和側(cè)面的廂房連接,一半吊在坎下,自成兩層樓房。上層住人,下層養(yǎng)牲畜。
DeepL譯文:Half of the footstools stand on the flat dam and are connected to the side rooms, while half of them hang under the can, forming a two-storey building of their own. The upper floor houses people and the lower floor raises livestock.
這里的第二個“一半”其實就是“另一半”,中文表達有時會省略“另”字,但DeepL無法識別這種省略,就會造成譯文表達錯誤。所以在譯前加上“另”字,補全邏輯關(guān)系詞,可使原文表達更清晰,提高機器翻譯的譯文質(zhì)量。
譯前編輯后的原文:Diao jiao building一半立在平壩上,和側(cè)面的廂房連接,另一半吊在坎下,自成兩層樓房。上層住人,下層養(yǎng)牲畜。
譯前編輯后的DeepL譯文:One half of the Diao jiao building stands on the flat dam and is connected to the side chambers, while the other half hangs under the kan, forming a two-story building of its own. People live on the upper floor and livestock are raised on the lower floor.
經(jīng)譯前編輯后,DeepL產(chǎn)出的譯文“One half of ..., the other half ...”還原了“一半……另一半”的形式與意義,譯文表達更為嚴謹。
3 結(jié)束語
在少數(shù)民族文化文本《民族文化經(jīng)典故事叢書:土家族》翻譯實踐中,借助翻譯器DeepL輔助翻譯,翻譯效率極大提高了。針對機器翻譯的譯文質(zhì)量不高等問題,運用了譯前編輯的手段進行人工干預,通過采用統(tǒng)一術(shù)語翻譯、預翻譯術(shù)語及刪減與增補原文本等策略,使得原文本更易被機器識別,大大提高了機翻譯文質(zhì)量,減少了譯后編輯的工作量,提高了翻譯效率。
隨著機器翻譯在各個領(lǐng)域的普及,民族典籍、民族風俗文本等民族文化外譯項目中也不免會運用到機器翻譯技術(shù)。因此,譯者在使用機器翻譯處理這類文本時,也應(yīng)考慮運用譯前編輯等人機交互策略,提高機器翻譯譯文質(zhì)量,增強譯文的準確性與可讀性。同時,也可嘗試將譯前編輯運用至其他類型文本的翻譯中,探索并總結(jié)不同文本翻譯應(yīng)用譯前編輯的具體策略與方法。
參考文獻
[1] 王清然,徐珺.技術(shù)進步視域下機器翻譯技術(shù)對語言服務(wù)行業(yè)的影響分析[J].中國外語,2022,19(1):21-29.
[2] 李洋,孫寧,梁玉靜.基于機器翻譯的人機交互譯前編輯模式研究[J].語言教育,2021(2):55-62.
[3] 韓欣雨,王非.漢英機器翻譯中的譯前編輯研究[J].中國新通信,2023,25(2):32-35,131.
[4] 彭石玉,周丹.新聞導語翻譯的譯前編輯模式研究[J].湖北師范大學學報(哲學社會科學版),2022,42(1):92-97.
[5] 馮全功,高琳.基于受控語言的譯前編輯對機器翻譯的影響[J].當代語文研究,2017(2):63-68,87.
[6] 徐紅,黃協(xié)安.譯前編輯和機器翻譯研究綜述(1990—2023)[J].外語電化教學,2023(6):43-49,11.
[7] 張錦秀.民族文化經(jīng)典故事叢書:土家族[M].北京:外語教學與研究出版社,2011.
[8] 脫脫.金史[M].北京:中華書局,2020.
[9] 姜學龍.西北民歌“花兒”英譯探析[J].連云港職業(yè)技術(shù)學院學報,2016,29(4):13-16.
[10]程洪珍.英漢語差異與英語長句的漢譯[J].中國科技翻譯,2003(4):21-22.
[11]李靜.語言冗余與英漢翻譯[J].西安電子科技大學學報(社會科學版),2014,24(1):129-135.
[12]高迎慧.思維轉(zhuǎn)向:“意合”到“形合”:從漢英結(jié)構(gòu)差異談漢語長句、復雜句的翻譯方法[J].教育理論與實踐,2012,32(12):52-53.