姚慶宏 劉效瑄 劉沖 賴立偉 夏凱祥 潘正芹
(桂林電子科技大學,廣西 桂林 541004)
使用軟件翻譯俗稱機器翻譯,機器翻譯隨著各種翻譯軟件的研發如今普及程度高,成為翻譯從業者必備的技能,高校的MTI(翻譯碩士)專業也把其列為必修課程,相關開發商也在想方設法說服高校將其推廣到本科英語教學當中。當機器翻譯成為時代潮流,無論從業者還是翻譯研究者開始思考機器翻譯的效能和可靠性,其中包括探討和研究機器翻譯中還存在的更具體的問題。例如,張威、明昊(2021)[1]通過研究人工翻譯、譯后編輯、機器翻譯的結果對比,發現人工翻譯與譯后編輯的質量對比取決于機器翻譯譯文,在原文有一定難度且機器翻譯譯文質量不高的情況下,人工翻譯譯文質量高于譯后編輯;在機器翻譯譯文錯誤容易識別且整體質量較高時,譯后編輯譯文質量高于人工翻譯。在具體機器翻譯問題上,潘正芹[2]等(2017)發現,機器翻譯難以跨越文化范疇和視角來進行翻譯。[3]人工翻譯能統籌雙關語、習慣用法等因素,以及讀者對象、翻譯目的和各種翻譯技巧和策略的綜合應用,機器目前做不到。而研究人員發現,學者在研究機器翻譯這一課題時,所選用的主題均為單一類型文本或者隨機文本,結果發現有的文本翻譯效果比較好,有些文本翻譯效果卻不盡如人意,出現大量錯誤,出現這些錯誤是否與文本有關?如果以往的研究是基于某個點、幾個點或某個面,那么本次研究從更大的多面視角,即基于不同文本的差異,來探討機器翻譯的結果。
文本的選擇標準是有明顯差異,自成風格的文體,以這個為標準,文章挑選五種類型文本英語原文進行翻譯研究,分別是:(1)法律類;(2)政府工作報告類;(3)文宣(多指旅游類文本)類;(4)財經類;(5)技術(說明書)類。五類文本字數1.5萬字。因為考慮到這五類文本各有特色,風格差異較大,其譯文應該具有一定代表性,能反映所有類似文體的特征。
法律類文本屬于規章制度,語言風格應為莊重嚴肅、邏輯嚴謹,以陳述客觀內容為主,很少出現個人感情因素,書面語體呈現,句子長而且結構較復雜,很多詞匯屬于法律性術語。政府工作報告,事關國家政策,大政方針,工作總結,歷史回顧,用詞要求通俗易懂,但又不能隨隨便便,模棱兩可,而是字斟句酌,準確表達。文宣類的文本應用面比較廣,在宣傳視頻、旅游手冊、景區介紹以及地方宣傳等都有一席之地。其特點是句子簡單,詞匯通俗、更大眾化,情感濃厚,能激發讀者的熱情,帶有廣告和營銷的性質。財經類文本內容包含較多專業術語,文本信息豐富,涉及領域寬廣,因為專業性強,相關領域讀者才會讀懂或感興趣。技術類文本(文章中偏向于說明書文本),內容客觀樸實,簡潔扼要,少有修辭,但專業術語較多。
研究人員選用小牛翻譯軟件,分別對以上幾種文本資料進行翻譯實驗,分別從一詞多義頻率、語句連貫性、基礎語句準確率、成分缺失、成分贅余和長句譯文表現等幾方面去觀測,得出結果如表1所示:

表1 實驗結果
機器翻譯的結果,在法律類文本中,正因為法律英語句子比較長,也比較復雜,所以譯文的長句表現比較差,但它的嚴謹性使得譯文的贅余和缺失成分較少,政工類文本因為同義重復較多,抽象口號多,機器翻譯時可能會一筆帶過,對照原文給人成分贅余的感覺,而專業性較強的技術和財經類,一詞多義現象就非常少,下面進一步就具體案例進行分析。
在法律文本翻譯中,一詞多義頻率較高,例如,在官方譯文中,“transfusion”的翻譯非常嚴謹,包含多個意思,而機器譯文僅有一個譯文“輸血”,原文中的“a donor”也只是粗略譯成“獻血者”,其中的“單一”釋義缺乏,是意義上的極大失誤;在語句連貫性方面,有些句式基本語序存在錯誤。此外,機器翻譯缺少語言風格的轉變,語言不嚴謹,僅表現為簡單邏輯關系對應,例如:
良好做法準則:良好做法準則解釋共同體的標準和規格,第2005/62/EC號指令附件中建立的血液機構質量體系被罰款。
而官方譯文為:質量管理規范指南:管理規范指南為血液機構的歐共體質量系統標準與規范給出了解釋,這些血液機構按照第2005/62/EC號法令附件所建立。
原文:Good Practice guidelines:Good practice guidelines give interpretation on the Community standards and specifications de-fined for quality systems in blood establishments established in the Annex of Directive2005/62/EC.
出現少量成分缺失情況,例如:
從獻血者處采集并經處理后用于輸血或進一步制造的全血。
這個譯文意義不嚴謹,官方譯文為“經過加工成輸液或用于進一步制工成輸液或用于進一步制造的全血”。不過我們發現,法律文本翻譯出現的贅余成分很少,比較突出的地方是法律文本中的長句翻譯成中文后,譯文整體效果很差,機器錯誤理解詞匯影響整體譯文,例如:“……提到的血液設施是指負責采集和檢測人體血液和血液成分的任何方面的任何結構或機構,無論其目的如何,以及用于輸血時的處理、儲存和分配。”
在政工類文本翻譯中,一詞多義頻率極低,因政工類文本特點用詞十分嚴謹,防止誤解。
語句連貫性:較好,具備一定閱讀價值;基礎語句準確率較高,邏輯基本正確;成分缺失較少,有少量成分贅余,例如:18個小時的風雨中,阿什莉冒著帶電的電線和深水,幫助拯救了40多條生命。原文為“Through 18 hours of wind and rain,Ashlee braved live power lines and deep water,to help save more than 40 lives.”官方譯文為:“冒著長達十八個小時的風雨,阿什莉不顧電線和深水之危,救出四十多條生命。”而在長句譯文表現上,機器翻譯尚可。
在文宣類文本翻譯中,一詞多義頻率較高(例如,You can spend months exploring big and small.機器譯文將其“big and small”翻譯為大大小小,而官方譯文為“各種各樣的博物館和藝術畫廊”,因前面一句提到倫敦有很多此類建筑);語句連貫性較差,基礎語句準確率:較低(例如,機器譯文:它只會變成一種模糊的印象,覆蓋著疲勞、疼痛和腳;官方譯文:否則這樣做只能給你帶來數不盡的疲憊以及叫苦不迭的雙腳;原文:It will just become a general blur of impressions overlaid with fatigue and aching and feet.);少量成分缺失,無成分贅余。長句譯文表現也不佳,翻譯極為混亂。
在技術類文本中,一詞多義頻率極低,機器理解效率較高;語句連貫性一般,基礎語句準確率達到較高水準;但有少量成分缺失,如標題處缺乏主語(例如,Civil Defence pilot drones for search譯為民防部門駕駛無人機進行搜索,官方譯文為:民防部門搜索式無人機);出現少量成分贅余(例如,當然,這將取決于全國各地對這項服務的需求,以及它在支持搜索操作方面的成功程度。原文為This,of course,would be dependent on the demand for the service across the country and also how successful it is in supporting search operations.官方譯文為:當然,這將取決于各地對該項業務的需求程度以及它的搜索效率);長句譯文表現較差,需要譯后編輯才能使讀者理解。
最后為財經類文本,文中一詞多義頻率較低,語句連貫性較差,但基礎語句準確率中等。
極少成分缺失,少量不影響理解的成分贅余。長句譯文表現較差,例如,不可避免的是,人們擔心ais的創造力足以讓他們的創造者大吃一驚,這可能會變得邪惡。原文:Inevitably,people fear that ais creative enough to surprise their creators could become malign.官方譯文:人們不可避免地擔心,人工智能系統的創造力足以讓其創造者感到驚訝,這可能會變得有害。
經分析總結,得出如下各類型文本機器譯文提升方案:
對法律文本,參照平行文本確認基本風格,選用詞匯時結合背景知識,模糊之處需咨詢相關資料或專業人士,避免模糊翻譯。機器翻譯難以識別部分文字背后蘊含的深刻含義,研究人員認為在法律類文本使用機器翻譯只能提升部分效率,要達到一篇合格的譯文仍需譯者多番矯正。
政工類文本用詞較為嚴謹:翻譯時使用已有默認官方翻譯的詞匯,在翻譯時考慮英中的句式邏輯差異,添加銜接詞使句子連接更加連貫,避免使用同一詞匯。使用機器翻譯政工類文本能夠提升翻譯效率,但細節處必須留意,否則造成語義偏頗的負面影響非常嚴重,如新詞以及文化特色詞需校對修改。
文宣類文本由于閱讀人群廣,此文本出現較多口語化詞匯,部分原文由于原目標讀者為源語讀者,部分內容未作注釋,但翻譯后讀者變為其他語言讀者,會出現其他語言讀者理解不到位的情況。因此,在對歷史文化底蘊豐厚的內容進行機器翻譯時,了解背景知識,防止錯譯引發目標語讀者反感。注意源語文本整體語言風格,將目標語風格同步,盡量追求目標語讀者在閱讀譯文時產生和源語讀者一樣的效果,這也是文宣類文本的初衷。
技術類文本的整體譯文流暢度具備一定可讀性,較之前面幾篇機器譯文來看,部分內容已經符合最基本閱讀需求。對該類產品進行大致了解,防止出現基礎常識錯誤。將語言進行本地化處理,消除機器翻譯痕跡,以符合目標語讀者閱讀習慣。
財經類文本長句難度較高,機器翻譯難以理解句子整體含義。使用機器翻譯遇到句式雜糅或結構復雜的長句時,建議翻譯人員親自翻譯,并加強自身長句處理能力。而在其他短句上,除了有較為明顯的機器翻譯痕跡,機器譯文準確率處于較高水平,因此,財經類文本使用機器翻譯可以節省翻譯人員的不少精力,但不能過多依賴。
機器翻譯,差之毫厘,謬以千里,所以機器翻譯的研究隨著機器翻譯的應用不斷發展,其目的是,一是告誡機器翻譯從業者,機器翻譯除了速度遠超人類,其他方面遠未達到人工翻譯的水準,機譯后編輯任重道遠;二是告訴翻譯教學工作者,不要對翻譯軟件盲從和迷信,只有打好堅實的翻譯基礎和能力,才能應用好手中的翻譯軟件,勝任機譯后編輯工作;三是告訴翻譯軟件開發者,翻譯軟件的研發要達到很高水平,還有很長的路要走。
機器翻譯與人工翻譯雖然目前仍存在差距,但仍具備優點。首先,機器翻譯速度極快,在翻譯句子結構相對簡單和詞義相對單一的文本,機器翻譯占據優勢。因此,人工若能夠熟練掌握機譯后編輯技能,勢必能夠極大提升翻譯效率。而從本次項目的研究來看,機器翻譯存在的最大問題就是缺少對原文以及目標語的背景認知,因此為了提升譯后編輯的效率,了解翻譯材料背景知識應為重中之重,再結合研究人員針對各類型譯文的分析及提升方案,相信譯者在處理各類型文本時的能力會更上一層樓。
根據研究結果,機器翻譯目前仍任重道遠,雖在不同類型文本中的翻譯準確率有高有低,但即使是根據材料表現來看準確率最高的技術型(說明書)文本,仍存在諸多模糊的譯文,無法完全替代人工譯文。經過項目研究對比,研究人員最后得出結論,以供相關人員參考:
機器翻譯在進行各種文本的翻譯時,綜合表現結果不佳,難以把握準確表達,導致語義錯誤,語句連貫性差;機器翻譯輸出譯文難以體現原文的風格,只是機械地逐字逐句翻譯。在長句或句式成分復雜的句子中,機器翻譯效果不佳,這體現在譯文邏輯混亂、語法錯誤、句式雜糅凌亂、缺乏本地化風格調整上。但機器翻譯在處理基礎語句上準確率尚可,成分缺失、成分贅余也較少出現,整體上體現出難度較低部分文本翻譯準確率高,長句、復合句以及容易出現多義詞的句式上翻譯準確率不佳的特點。