999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語料庫的谷歌與有道翻譯對比分析
——以Gone with the wind為例

2020-11-13 02:37:32
文化創新比較研究 2020年24期
關鍵詞:句法詞匯

徐 行

(南京郵電大學,江蘇南京 210023)

1 概述

機器翻譯就是利用計算機把一種語言(源語言,source language)翻譯成另外一種語言 (目標語言,target language),實現各種自然語言之間的自動轉換,是人工智能和自然語言處理領域的重要研究方向之一。雖然機器翻譯已經發展多年,但現實中仍存在許多問題。我國學者馮志偉先生提出:“從已經推出的實用化MT系統的譯文質量來看,還不十分令人滿意,對于一些稍長的句子,或結構稍復雜的句子,譯文質量就不能令人滿意,有時簡直不可卒讀。”而且,“計算機翻譯不適用于文學性很強或文化味很濃的文本,而適用于科普文獻,金融商業交易,行政管理備忘錄,法律文件,說明書,農業及醫學材料,工業專利,宣傳冊,報紙報道等[1]。”

因此,本文以谷歌與有道翻譯關于Gone with the wind的譯文為例,分析MT的錯譯類型,并進行兩種翻譯引擎之間的對比。

2 機器譯文錯誤類型對比分析

2.1 語料來源和研究方法[2]

本次研究中使用的語料為Gone with the wind第一章的部分節選以及谷歌翻譯和有道翻譯對應的中文譯文,對比的人工譯文為上海文藝出版社的陳良廷譯本——《亂世佳人》。在對機器譯文和人工譯文展開全面的平行對比中,對機器譯文出現的各種錯誤根據前人總結的機器譯文錯誤類型(表1)加以標注,并對錯誤的發生頻率進行統計,得到圖1所示的谷歌與有道譯文錯誤率和圖2所示的谷歌與有道譯文三大類型錯誤率。其中錯誤譯文指機器譯文中至少包含表1所列錯誤類型中的一種錯誤,錯誤率為出現錯誤的機器譯文總句數/機器譯文總句數*100%。對同一句子中多次出現的同一類型機器譯文錯誤(如詞匯詞性錯誤),只進行一次標注和統計。下文將對譯文對比中觀察到的部分機器譯文錯誤現象加以對比描述。

表1

圖1

圖2

2.2 機器翻譯詞匯錯譯分析[3]

詞匯是組成句子的最基本要素,所以也是衡量機器翻譯質量的關鍵。由圖2可以看出,谷歌與有道翻譯在詞匯錯譯所占比例較大,且谷歌遠遠高于有道翻譯。在對譯文進行對比分析的過程中,發現在二級錯誤中,詞匯詞性錯譯、詞匯漏譯和詞匯形容詞錯譯所占比重較大。下面將進行舉例說明。

(1)But it was an arresting face, pointed of chin, square of jaw.

有道:但這是一張引人注目的臉,尖下巴,方下巴。

谷歌: 但這是一張令人震驚的臉,指向下巴,下巴直角。

人工:不過這張臉還是挺引人注目,尖尖的下巴頦兒,方方的牙床骨兒。

首先,關于“arresting”,牛津詞典的解釋是“very attractive”,而谷歌卻翻譯成“令人震驚的”,不禁讓讀者對女主人公的外貌產生極大的誤解。而“pointed”和“square”在原文中是作為形容詞來修飾后面的名詞的,谷歌卻分別作為動詞和名詞來翻譯。關于“chin”和“jaw”的區別,“chin”的柯林斯詞典中的解釋為“the part of your face that is below your mouth and above your neck”,而對“jaw”的一種解釋為“A person’s or animal’s jaws are the two bones in their head which their teeth are attached to”。 但是兩種翻譯引擎都簡單地翻譯成了“下巴”。

(2)...their bodies clothed in identical blue coats and mustard-colored breeches, they were as much alike as two bolls of cotton.

有道:身上穿著一模一樣的藍色外套和墨綠色的馬褲,像兩團棉花。

谷歌:他們的身體穿著相同的藍色外套和芥末色的馬褲,十分相似作為兩個棉鈴。

人工:身穿一模一樣的藍上衣,一模一樣的芥末色馬褲,哥兒倆活像兩個一模一樣的棉桃。

這里原文之所以將兩個人比作棉桃,是為了強調他們作為穿著一樣的衣服的孿生兄弟是多么的相似,而有道的譯文只翻譯出了棉花,卻漏譯了他們的相似,谷歌就直接字字對應地翻譯,將應理解成“像”、“如同”的“as”,翻譯成了“作為”,產生了歧義。另外,谷歌將“bodies”直接譯成“身體”,讀來十分生硬。

(3)The boys looked uncomfortable,recalling their mother's conduct three months ago when they had come home, by request, from the University of Virginia.

有道:兩個孩子看上去很不自在,回想起三個月前他們應弗吉尼亞大學的要求回家時母親的舉動。

谷歌:這些男孩看上去不舒服,回想起三個月前他們應弗吉尼亞大學的要求回家時母親的行為。

人工:哥兒倆想起三個月前他們從弗吉尼亞大學被請回家時他們母親的管教方式,臉色頓時不大自在。

這里的“uncomfortable”應該理解為“anxious,embarrassed or afraid and unable to relax”,有道翻譯比較符合,而谷歌卻按“not feeling physically relaxed”理解,翻譯成了“不舒服”,與原文不符。而且谷歌對“the boys”的處理也沒有聯系上文的語境,有道處理地較為恰當。

另外,關于對人名、地名等專有名詞的處理,有道大多數翻譯恰當,而谷歌常常不譯或者錯譯。對一些指代詞的處理,谷歌往往無法結合語境,例如“poor Cracker neighbors”中的“Cracker”應理解為“an offensive word for a poor white person with little education from the southern US”,有道翻譯成“窮鄰居”較為符合,而谷歌翻譯成“貧窮的餅干小鄰居”,令人啼笑皆非。

2.3 機器翻譯句法錯譯分析

英語具有“形合”的特征,句法是其“形合”實現的重要方式,是組織零散詞匯構成句子的手段,嚴重的句法錯誤可能使整個句子變得凌亂不堪,不知所云。由圖2可以看出,無論是谷歌還是有道翻譯,在句法錯譯都占了較大的比例[4]。在分析對比的過程中,發現二級錯誤中的句法動詞短語和介詞短語錯譯出現較為頻繁,下面將舉例分析。

(4)He'll never get finished at this rate.

有道:照這樣下去,他永遠也完不成。

谷歌:他永遠不會以這樣的速度完成任務。

人工:這樣的話他可休想畢業了。

這句話在原文中是說因為兩兄弟總是被學校開除,連累他們的哥哥也不能呆在學校,因此完不成學業。介詞短語“at this rate”是“照此情形”、“如此下去”的意思,谷歌卻將“rate”直接翻譯成了“速度”。有道翻譯雖然較為符合,但“完不成”后面的賓語卻沒有表達完整。

(5)“Not going to be any war! ” cried the twins indignantly, as though they had been defrauded.

有道:“不會有戰爭!”孿生兄弟憤怒地喊道,仿佛他們被騙了似的。

谷歌:“不會發生任何戰爭!”這對雙胞胎怒不可遏地哭了起來,好像他們已經被騙了一樣。

人工:“什么仗也不會打!”哥兒倆憤憤地喊道,仿佛他們上了當似的。

在原文中只是三個朋友因為對戰爭的看法不同發生了一點爭吵,沒有到“憤怒”或“怒不可遏”的程度,用“憤憤地”更能表達出兩兄弟雖然不滿但是為了不讓女主人公生氣只得停止討論戰爭的心情。“cry”在這里是“to shout loudly”,谷歌譯成“哭”,脫離了原文的意思。

(6)She was hot-tempered and easily plagued by the frequent scrapes of her four sons, and while no one was permitted to whip a horse or a slave, she felt that a lick now and then didn't do the boys any harm.

有道:她脾氣暴躁,四個兒子經常用鞭子抽打她,這使她很難受。雖然家里不許任何人抽打馬或奴隸,但她覺得偶爾打一下對孩子們并沒有什么害處。

谷歌:她脾氣暴躁,容易被四個兒子的經常擦傷所困擾,雖然沒有人被允許鞭打馬匹或奴隸,但她感到時不時舔舔對男孩沒有任何傷害。

人工:她是個火爆性子,動不動就給這四個經常惹是生非的兒子煩死,盡管她不準誰鞭打奴隸和馬,可她覺得時常抽孩子幾下對他們倒沒害處。

“scrape”在這里是名詞,表示“(old-fashioned)a difficult situation that you have caused yourself”,同義詞有“predicament”,“trouble”,“difficulty”等,而兩種翻譯引擎分別理解成了“用鞭子抽打”和“擦傷”,嚴重曲解了原意。而“lick”一詞除了“舔”的意思之外,在柯林斯詞典中還解釋為“If you lick someone or something, you easily defeat them in a fight or competition.” 同義詞有“beat”,“defeat”,“overcome”等,而谷歌的翻譯與原文的語境嚴重不符。

3 結語

本次語料庫數據統計得出的圖1顯示,與谷歌翻譯相比,有道翻譯的準確譯文比例較高,錯誤譯文比例較低;圖2顯示,在詞匯錯譯、句法錯譯和其他類型中,谷歌錯誤率高于有道翻譯[5]。另外,在對譯文二級錯誤進行對比分析時,發現有道翻譯整體譯文質量高于谷歌翻譯。谷歌偏向于字對字的直譯,而有道翻譯有時可以轉換句式,不囿于原有的英文句式。并且對于人名、地名等專有名詞的翻譯,有道翻譯更加靈活準確,而谷歌翻譯對一些習語的處理也比較生硬,建議谷歌翻譯借助自身的搜索引擎在互聯網中搜索相關的信息作為翻譯的參考。當然,有道翻譯也存在著許多的問題,在結合語境、加大自身語料庫建設方面還有進一步完善的空間。針對谷歌和有道翻譯存在的問題,筆者認為可以從以下方面改進翻譯引擎質量:進一步加大自身語料庫建設,可以通過開放性輸入平臺的方式最大程度收集雙語固定表達形式及對應意思,以盡可能多的識別習語、慣用語等;借助互聯網對需要進行翻譯的語句進行模糊匹配搜索,找出其他網頁或者數據庫中的關聯信息,作為翻譯的參考;通過海量分析識別具有類型化和高重復性特征的錯誤,在下一次錯誤觸發時進行準確糾錯[6]。

最后,作為語言學習者,我們不能過度依賴翻譯工具,而應將自己扎實的語言能力作為基礎,正確使用翻譯軟件,找準翻譯技巧,提高翻譯效率,讓工具真正為我們的語言學習服務。

猜你喜歡
句法詞匯
句法與句意(外一篇)
中華詩詞(2021年3期)2021-12-31 08:07:22
述謂結構與英語句法配置
本刊可直接用縮寫的常用詞匯
一些常用詞匯可直接用縮寫
山東醫藥(2020年34期)2020-12-09 01:22:24
本刊可直接用縮寫的常用詞匯
句法二題
中華詩詞(2018年3期)2018-08-01 06:40:40
詩詞聯句句法梳理
中華詩詞(2018年11期)2018-03-26 06:41:32
一些常用詞匯可直接用縮寫
山東醫藥(2017年35期)2017-10-10 02:45:28
疑問詞“怎么”句法功能的演變及其動因
信息結構與句法異位
當代修辭學(2014年3期)2014-01-21 02:30:46
主站蜘蛛池模板: 欧美日韩免费| 丰满人妻一区二区三区视频| 久无码久无码av无码| 国产伦片中文免费观看| 日韩欧美中文字幕在线精品| 亚洲an第二区国产精品| 国产va在线观看免费| 精品五夜婷香蕉国产线看观看| 亚洲精品无码日韩国产不卡| 91久久国产热精品免费| 性欧美在线| 国产精品尤物铁牛tv| 国产在线一二三区| аⅴ资源中文在线天堂| 欧美亚洲国产精品久久蜜芽| 高清不卡一区二区三区香蕉| 日本国产精品| 亚洲精品福利视频| 午夜毛片免费看| 精品成人一区二区三区电影| 狠狠v日韩v欧美v| 欧美综合激情| 日韩AV无码一区| 91成人在线免费视频| 亚洲黄色视频在线观看一区| 青青青国产在线播放| 亚洲AⅤ无码国产精品| 亚洲精品午夜无码电影网| 嫩草在线视频| 制服丝袜在线视频香蕉| 香蕉网久久| 欧美不卡视频在线观看| a天堂视频在线| 动漫精品啪啪一区二区三区| 国产视频大全| 永久免费无码日韩视频| 97在线视频免费观看| 第九色区aⅴ天堂久久香| 亚洲综合网在线观看| 亚洲a级在线观看| 亚洲欧洲日产国码无码av喷潮| 成人亚洲国产| 在线免费观看AV| 国产小视频a在线观看| 天天做天天爱夜夜爽毛片毛片| 67194亚洲无码| 无码在线激情片| 国产精品女人呻吟在线观看| 国产黄网永久免费| 亚洲美女一级毛片| 国产一级视频久久| 亚洲美女一级毛片| 久久毛片基地| 久久中文字幕2021精品| 亚洲伊人电影| 免费 国产 无码久久久| 亚洲免费黄色网| 怡红院美国分院一区二区| 免费人成黄页在线观看国产| 久久久久久久久18禁秘| 不卡无码网| 凹凸精品免费精品视频| 一级毛片免费的| 尤物成AV人片在线观看| 欧美精品aⅴ在线视频| 国产午夜在线观看视频| 99精品一区二区免费视频| 国产欧美专区在线观看| 国产美女91视频| 日本五区在线不卡精品| 久久91精品牛牛| 欧美中出一区二区| 国内精品小视频在线| 国产1区2区在线观看| 久久男人视频| 亚洲AⅤ无码国产精品| 92午夜福利影院一区二区三区| 国产99视频免费精品是看6| 99视频精品在线观看| 国产欧美视频综合二区| 欧美午夜视频| 自拍偷拍欧美|