999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

從主流機器翻譯軟件工作原理角度探究機器翻譯的優缺點
——以對比百度翻譯與人工翻譯譯文為例

2021-12-29 14:12:17白一博
呂梁學院學報 2021年3期
關鍵詞:百度

白一博

(北京外國語大學 英語學院,北京 100089)

在人類發展史中,科學技術的作用是無與倫比的。馬克思主義生產力學說明確指出,科學技術是第一生產力[1]。在當前的翻譯行業中,機器翻譯的蓬勃發展深刻改變了我們目前的翻譯方式。作為人工翻譯的替代品,機器翻譯軟件在許多翻譯實踐中都發揮著重要作用,大大提升了翻譯工作的效率。

機器翻譯,又稱計算機翻譯,是指利用計算機將一種語言符號轉換成另一種語言符號。機器翻譯這一概念起源于20世紀30年代,在近一個世紀的發展過程中主要經歷了四個發展階段:基于規則的機器翻譯、基于統計的機器翻譯、基于實例的機器翻譯和基于不同方法應用的機器翻譯[2]。而在目前的基于不同方法應用的機器翻譯階段,機器翻譯軟件和工具可以分析前三種翻譯方式的優缺點,之后綜合運用多種方式對文本進行翻譯。

機器翻譯領域的一大特征是與新興科技的緊密結合。例如,許多機器翻譯軟件可以利用互聯網,獲取相關的語言資源實現在線同步翻譯[3];云計算、機器學習、大數據等技術在提升機器翻譯質量的同時,也整合了翻譯市場、人才、數據等資源,逐漸實現了“語言服務的規模化和全球化”[3]。

一、語料的選取和翻譯軟件的選擇

為了探討機器翻譯與人工翻譯的優劣,本人作了以下語料的對比研究。

(一)語料選取

選用作者于2019年翻譯的文章《When the American “Bull” Breaks into the china shop of “16+1 Cooperation”》(1)https://china-cee.eu/wp-content/uploads/2019/04/Working_paper-201902-Feng-Zhongping-Chen-Xin-Xu-Gang.pdf.作為例文(當時作者為北外英語學院翻譯系大四學生)。選用這篇文章的原因有三點:第一,本文原文《當美國“大象”闖入“16+1合作”的“瓷器店”》刊載于2019年第六期的《世界知識》中,因此原文質量是有保證的。第二,這篇譯文發表于中國-中東歐研究院官網,因此譯文質量也是有保證的。第三,作者在翻譯原文時在讀大四,北京外國語大學(北外)是教育部直屬、首批“211工程”高校、“985”優勢學科創新平臺高校、首批“雙一流”建設高校(2)https://www.bfsu.edu.cn/overview.。自20世紀50年代開始就開始開設翻譯課程,并分別于1993年和2001年開始設置本科階段的筆譯和口譯方向。2007年在英語學院下設翻譯系,開始在全國范圍內招收翻譯專業本科生[4]。英語學院翻譯系的課程設置包括四個方面,即“外語技能、母語修養、翻譯實踐和學科素養”[4]。翻譯專業課程基本都設置在本科前三年,因此,這段時間的譯文較能體現翻譯系本科學生的翻譯水平。

(二)百度翻譯

百度翻譯是百度公司于2011年6月推出的基于互聯網大數據的機器翻譯系統。它支持包括漢語、英語、日語、德語等200多個語言互譯,是國內市場份額第一的翻譯類產品。除了使用量最大的百度翻譯網頁版,它還擁有APP,小程序等多種產品形態,可以為用戶提供文檔、網頁、圖片、拍照、語音等多模態的翻譯功能。除了機器翻譯功能,百度翻譯還可以提供離線的牛津和科林斯詞典,方便客戶查閱單詞(3)https://baike.baidu.com/item/%E7%99%BE%E5%BA%A6%E7%BF%BB%E8%AF%91.。

百度翻譯屬于人工神經網絡系統,通過擁有海量結點的深度神經網絡,使計算機先自動學習語料庫中的翻譯知識,再自動理解語言和生成譯文[3]。

本文選擇網頁版的百度翻譯來測評機器翻譯軟件的漢譯英譯文質量。原因有三點:第一,百度翻譯在國內所占的市場份額最大,擁有較大的客戶群體,說明其經過了多次實踐檢驗。第二,網頁版無需下載,且翻譯文本的功能和其他版本相同,使用較為便捷。第三,作者在翻譯實踐中曾使用過不同的機器翻譯軟件,百度翻譯給作者的體驗最好。

二、譯文質量對比

(一)質量評判標準

從上文的選擇材料理由可知,本文的人工翻譯譯文質量是具有一定保證的,因此,在此次對比分析中,筆者以人工翻譯譯文為基準,從內容是否完整正確、邏輯是否流暢和語言是否規范三個角度來進行質量對比。

(二)實例對比分析

此部分的ST為原文,TT為人工翻譯譯文,MTTT為百度翻譯譯文。

【ST1】當美國“大象”闖入“16+1合作”的“瓷器店”

【TT1】When the American “Bull” Breaks into the china shop of “16+1 Cooperation”

【MTTT1】When American “elephant” breaks into “16 + 1 cooperation” porcelain shop

我們可以看出,百度翻譯對原文的處理過于直譯,而且沒有識別出“大象闖入瓷器店”這里的文化內涵。這一短語起源是1816年阿美士德(Amherst)奉命出使中國,代表英國政府與清政府進行貿易洽談,但最終因叩頭行禮問題未能達成貿易約定。英國媒體于是創作了一篇名為A Bull in a China Shop的漫畫,諷刺阿美士德把出訪搞得一團糟。此處的“Bull”既指粗魯的公牛,又指英國(約翰牛是英國的形象化、人格化代表),而“China”既指易碎的瓷器,又指中國。后來,這句短語被用來形容舉止粗魯,搞砸一切的人。

顯然,百度翻譯在此處未能識別原文的文化意向,譯文出現了偏差。其原因是,人工神經網絡并未能識別出此處“大象”與英文“bull”意象的對等關系。在人工神經網絡在語料庫學習過程中,也鮮見“美國‘大象’”或“American bull”的搭配,因為正如上文所言,俚語“bull”所指的是英國。可見,人工神經網絡在此處的學習和處理存在不足。

【ST2】我刊邀請了三位專家就此進行了交流與討論。(4)這一句在《世界知識》上刊載的原文是沒有的,但客戶給譯者的原文中確實包含這一句。

【TT2】We invited three experts to discuss and exchange ideas on this issue.

【MTTT2】We invited three experts to exchange views on this issue.

原文中的“交流與討論”其實是中文中的習慣搭配,表達的意思就是交換意見。我們可以看到此處人工翻譯和百度翻譯都把握了原句含義,但不同的是,百度翻譯更加簡潔,因為“exchange views”就包含了”discuss”的過程,所以此處筆者認為百度翻譯更勝一籌。筆者猜測,百度翻譯在這一部分更加出色的原因是:這句話在很多采訪或新聞稿中頻繁出現,因此具有大量的雙語語料對照,而百度翻譯的產品介紹也指出,軟件會先學習語料庫,之后再匹配對照給出譯文。而人工翻譯查閱對照語料庫的能力則是相對較弱的。

【ST3】從蓬佩奧的行程安排和種種表態來看,美國“重返”中東歐的意圖是很明顯的

【TT3】We could tell from Pompeo’s visiting schedule and opinions that the US has an obvious

intention to“back” to Central and Eastern Europe

【MTTT3】 Judging from pompeo’s itinerary and various statements,the intention of the United States to “return” to central and Eastern Europe is obvious

通過語法分析我們可以看到,百度翻譯的譯文出現了主語和伴隨狀語主語不一致的情況,“the intention”并不是“judging from”的主語,因此在語言和邏輯方面是較為混亂的,但意思的傳達方面整體還是清楚的。作者推測,百度翻譯在這一例中出現語法錯誤的原因和上一例中翻譯出色的原因其實是一致的,都是基于對語料庫的分析給出的譯文,但這一句的問題就出在了關系從句和主句之間的逗號上。筆者認為,百度翻譯的句段劃分是以標點符號為界,逗號分隔開的兩個小句也會被處理成兩個句段,之后分別在語料庫中進行分析處理,這就引發了語法錯誤。為了驗證這一猜想,譯者將原文逗號刪去,重新使用百度翻譯,此次的結果為“Judging from pompeo's itinerary and various statements,it is obvious that the United States intends to ‘return’ to central and Eastern Europe”。雖然這一結果的邏輯主語仍是錯誤的,但我們可以看到后半句采用了形式主語,這和保留逗號時給出的譯文結構是有明顯差異的,所以作者認為上文的猜想是部分正確的。現在幾乎可以確定百度翻譯以逗號為句段的最小拆分符號,但此句機器翻譯錯誤的根本原因還是在于不能像人工一樣確定“judging from”的主語,因為原文中這個邏輯主語是省略掉的。

【ST4】2月17日為科索沃單方面宣布獨立紀念日

【TT4】Kosovo unilaterally announced February 17th as its Independence Day

【MTTT4】February 17 is the anniversary of Kosovo’s unilateral declaration of independence

這一句話的人工翻譯和百度翻譯譯文在邏輯和表達方面都是通順的,唯一的區別為傳遞的內容有細微的差別。作者初譯這段文章時,給出的譯文和百度翻譯譯文是幾乎一致的,但后來經過查證相關資料和獨立思考后將譯文改成了TT4的形式。改動的原因是,作者敏銳地意識到科索沃是一個主權存在爭議的地區。塞爾維亞認為科索沃是其境內一個高度自治的自治區,但科索沃卻宣稱自己是一個獨立的國家。兩方在國際上都有許多的支持者,而中國政府的立場是支持塞爾維亞對科索沃地區享有主權,因此在翻譯這句的時候需要格外注意政治立場的問題。雖然原文提到了“單方面宣布”,但百度翻譯譯文中的“unilateral declaration of independence”會給讀者帶來一種既成事實的感覺,這其實是不符合中方立場的。因此,作者經過分析資料以及詢問相關領域研究人員后,決定將譯文改成TT4的形式,只表明2月17日是其所謂的“Independence Day”,但絲毫不涉及科索沃是否是獨立的國家。綜上,百度翻譯此處對原文的把握是沒有問題的,但是卻反應了機器翻譯無法考慮政治立場、意識形態對語言表達的影響,在這一點上人工翻譯是要遠遠優于機器翻譯的。

【ST5】美國承諾,若馬其頓方面做出讓步,將盡快幫助其實現入約

【TT5】 The US promised to help Macedonia join the NATO as soon as possible if it made concessions

【MTTT5】The United States promised that if the Macedonian side made concessions,it would help it implement the treaty as soon as possible

這一句話里存在著一個縮寫,“入約”是加入北約的簡稱。因此,在翻譯這段話的時候,只有意識到這個問題才能做到準確地傳達內容。從兩篇譯文中我們可以看到,人工翻譯可以聯系上下文從而判斷出這里“入約”的真實含義,并闡明“join the NATO”的實際內容。而機器翻譯也準確把握了“入約”中暗含的條約信息,并準確表達出了這一點,從這個角度來看,機器翻譯是比較成功的。但可惜的是,機器翻譯未能進一步聯系上下文分析出這里的條約指的就是北約。結合MTTT2來看,機器翻譯在將譯文聯系語料庫方面是非常出色的,但機器翻譯卻不能很好地聯系上下文,作者認為,這是機器翻譯缺乏邏輯分析能力的體現。

【ST6】我們知道,冷戰時期歐洲分為西歐和東歐,這些概念有很強的政治色彩。

【TT6】It is widely acknowledged that,the division of Europe into Eastern and Western Europe in the Cold War was very political.

【MTTT6】We know that during the cold war,Europe was divided into Western Europe and Eastern Europe,and these concepts had a strong political color.

作者認為,這句話暴露了機器翻譯的兩個不足之處。首先,百度翻譯給出的譯文過于直譯,“政治色彩”其實是在突出上文“西歐”和“東歐”并非是按照地理因素來劃分的,而是純粹出于政治考慮,基于不同的意識形態做出的劃分,因此,“色彩”這一詞語其實是沒有實際意義的,翻譯出來“political”即可。第二,這一段翻譯還暴露出了機器翻譯在句段整合方面還有待提高。原文中的“這些概念”實際就是指代的上文中“西歐”和“東歐”,因此完全可以處理成先行詞的形式,將兩句話合并為一個主句加從句的英文表達形式。

縱觀百度翻譯的譯文可以發現,機器翻譯給出的定語從句是較少的,而且在表達方面也并不理想。但其他從句的效果,比如條件狀語從句,還是可圈可點的。單從邏輯上來看,MTTT5對狀語從句的把握是非常成功的。我們不禁會問,為什么機器翻譯處理不同從句的效果差別如此顯著呢?作者猜測,這與英漢表達習慣有關。前文提到了機器翻譯會根據標點符號來劃分句段,這其實就會打亂各個小句之間的邏輯聯系。而中文的條件狀語從句是有邏輯結構連接的,比如ST5中的“若……將……”結構,機器翻譯在識別到這個信息后,就會自然采用從句形式;但中文中缺乏定語從句,盡管某些短句可以發揮定語從句的作用,但沒有明確的先行詞和關系代詞,所以,機器翻譯系統無法意識到某處可以使用定語從句來連接兩個短句。

【ST7】由于地理上不接壤,也不存在歷史遺留問題,且與中國有著傳統交往和友誼,中東歐國家總體對華友好,積極參與“16+1合作”和“一帶一路”建設。

【TT7】Central and Eastern European countries are generally friendly to China and actively participate in the "16+1 Cooperation " and "the Belt and Road Initiative ",for we are geographically far and have no problems left by history and they have traditional friendship with China.

【MTTT7】China is one belt,one road and the other is the “16+1 cooperation” and “one belt and one road” construction.

我們可以看到,MTTT7在內容,邏輯和表達方面都與原文大相徑庭,錯得十分離譜。但仔細閱讀ST7就會發現,這句話其實包含了前文提到過的許多翻譯難點(針對機器翻譯而言):逗號將句子拆分為許多句段、主語缺失、雖然有邏輯結構,但較為松散……作者認為,百度翻譯對這句話的翻譯情況一定程度上印證了上文作者詳述的猜想。

(三)分析總結

內容方面,除了個別極端情況,百度翻譯譯文可以和北外翻譯系大四學生一樣,完整傳達原文內容,不會漏掉重要信息,但不能分析出原文所蘊含的文化和意識形態色彩,不能體現翻譯客戶想要凸顯的特定立場。邏輯方面,百度翻譯可以較為準確地翻譯出有明顯邏輯結構的句子,但如果句子之間邏輯關系是隱藏的或邏輯結構較長,則翻譯結果就明顯不如北外翻譯系大四學生。表達方面,在邏輯通順的情況下,百度翻譯的英文表達還是十分流暢的,和學生不分高下,在某些常用的固定表達方面,百度翻譯的表達比學生的表達更加簡潔明了,可見其在利用語料庫方面具有重大優勢。

三、結語

機器翻譯可以極大提升譯者的翻譯速度,但其缺點也是相當明顯的。想要充分發揮機器翻譯的優點,同時盡力避免機器翻譯的不足之處,就必須通過比較機器翻譯和人工翻譯,從機器翻譯工作原理的角度剖析譯文的不同,使不同翻譯方式各展所長,絕不能脫離翻譯實踐空談機器翻譯的特性,因為一切翻譯工具最終都是要經過實踐的檢驗。

由于篇幅和精力所限,作者只分析了七個具有代表性的譯例,沒有做到全文對照分析,但作者認為分析部分的邏輯對該領域的研究還是具有價值的。作者將機器翻譯的錯誤譯文和其工作原理相結合,做出合理推斷,總結機器翻譯出現錯誤的原因,整個分析過程具有可借鑒性。但翻譯作為一個交叉學科,其機器(機輔)翻譯領域與計算機專業具有高度重合性,因此未來研究者可以從計算機專業角度來分析本文中提出的猜想是否合理,并且通過修改代碼讓機器翻譯更加智能。我們要充分發揮主觀能動性,做科技的主人,不斷改進機器翻譯工作方式,提升其譯文質量,并積極開辟新的翻譯實踐模式。

猜你喜歡
百度
四季
Robust adaptive UKF based on SVR for inertial based integrated navigation
百度年度熱搜榜
青年與社會(2018年2期)2018-01-25 15:37:06
不懂就百度
做一個“百度”不知道的老師
學周刊(2016年26期)2016-09-08 09:02:52
百度商業模式“罪與罰”
公民與法治(2016年6期)2016-05-17 04:10:23
百度年度人氣萌娃
鳳凰生活(2016年1期)2016-01-07 17:45:39
百度遭投行下調評級
IT時代周刊(2015年8期)2015-11-11 05:50:22
百度醫生
百度“放衛星”,有沒有可能?
太空探索(2014年4期)2014-07-19 10:08:58
主站蜘蛛池模板: 国产精品综合久久久| 日韩毛片在线播放| 亚洲欧美日韩动漫| 免费看美女毛片| 一级毛片在线播放| 丰满的熟女一区二区三区l| 亚洲床戏一区| 波多野结衣久久高清免费| 国产伦精品一区二区三区视频优播| 国产人成在线视频| 黄片在线永久| 色综合久久无码网| 日韩一二三区视频精品| 美女被操91视频| 国产黑人在线| 国产精品55夜色66夜色| 无码啪啪精品天堂浪潮av| 久久国产精品电影| 欧美亚洲国产一区| 视频二区亚洲精品| 亚洲色图综合在线| 亚洲动漫h| 精品人妻无码区在线视频| 毛片网站在线播放| 丝袜美女被出水视频一区| 成人毛片在线播放| 日韩欧美中文在线| 人妻丰满熟妇啪啪| 国产xxxxx免费视频| 久久男人视频| 亚洲综合在线网| 91色在线观看| 婷婷色中文网| www.精品视频| 精品三级网站| 91精品在线视频观看| 欧美精品啪啪一区二区三区| 极品国产在线| 国产精品亚洲日韩AⅤ在线观看| 国产va在线| 亚洲精品综合一二三区在线| 99久久亚洲综合精品TS| 538精品在线观看| 欧美成人精品在线| 亚洲经典在线中文字幕| 久久综合九色综合97网| 美女潮喷出白浆在线观看视频| 国内99精品激情视频精品| 成人中文字幕在线| 五月激激激综合网色播免费| 中文字幕无码制服中字| 日韩av在线直播| 日韩性网站| 成年av福利永久免费观看| 亚洲国产在一区二区三区| 激情网址在线观看| 亚洲性日韩精品一区二区| www.亚洲色图.com| 91视频日本| 在线看国产精品| 国内视频精品| 久久亚洲AⅤ无码精品午夜麻豆| 毛片免费视频| 亚洲AⅤ无码国产精品| 99这里精品| 国产69精品久久| 国产微拍一区| 国产97视频在线观看| 99在线观看国产| 国产经典三级在线| 国产一级无码不卡视频| 国产真实乱子伦精品视手机观看 | 日韩精品一区二区三区中文无码 | 天天色综网| 国产成a人片在线播放| 巨熟乳波霸若妻中文观看免费| 婷婷色一二三区波多野衣| 精品国产香蕉伊思人在线| 日韩区欧美国产区在线观看| 国产日韩欧美一区二区三区在线| 国产亚洲精品无码专| 国产亚洲精品91|