□杜民榮,高曌宇
(1.山西廣播電視大學,山西 太原 030027;2.中北大學信息商務(wù)學院,山西 晉中 030600)
論文摘要是對整篇論文的高度總結(jié)和概括,讀者通過閱讀論文摘要就可以清楚作者所要表達的含義,并且優(yōu)質(zhì)的論文摘要可以提高論文的檢索率。隨著全球化的發(fā)展,各國之間學術(shù)交流的頻率越來越高,論文作為學術(shù)交流的重要手段之一所占據(jù)的地位越來越重要,摘要的地位也不容忽視,現(xiàn)在的很多論文在進行摘要翻譯時僅僅是利用機器軟件進行翻譯,翻譯的結(jié)果很容易出現(xiàn)語法不通、句子不順暢等問題,致使翻譯質(zhì)量不高。如何翻譯出質(zhì)量過硬的英文摘要,已經(jīng)成為很多學者專家的重要研究課題。本文通過研究機器翻譯的發(fā)展,總結(jié)機器翻譯的優(yōu)勢,以此探索利用機器翻譯在論文摘要翻譯中的應(yīng)用,進而提高翻譯質(zhì)量。
機器翻譯就是利用翻譯軟件將一種自然語言翻譯成另外一種自然語言,漢譯英即為將中文翻譯成英文。機器翻譯是1949年美國人WarrenWeaver提出的,5年后在美國喬治敦大學進行了機器翻譯的成果展示。最初機器翻譯是基于規(guī)則進行翻譯的,但是語言是沒有規(guī)則可以套用的,所以翻譯的結(jié)果不能令人滿意。再就發(fā)展到基于實例的發(fā)展,即為準備一個例句庫,將要翻譯的句子與例句進行對比,將不一樣的內(nèi)容進行替換,但是其結(jié)果并沒有比基于規(guī)則的翻譯強很多,再后來隨著統(tǒng)計模型的應(yīng)用,基于統(tǒng)計的機器翻譯得到了飛速的發(fā)展,Google翻譯就是基于統(tǒng)計模型進行翻譯的。到了2014年,隨著深度學習熱潮的來臨,機器翻譯已經(jīng)進入了神經(jīng)網(wǎng)絡(luò)機器翻譯時代,這種翻譯根據(jù)現(xiàn)有的平行語料學習,理解句中細微的語言特征。
就目前的機器翻譯結(jié)果來看,機器翻譯存在的最大問題就是語義的歧義性,自然語言在詞匯、語法上往往會存在歧義,此外,文化的差異等也會帶來歧義性,例如在《科技進步與對策》中一篇題為《中美國家科技決策體系:國家、部委和項目層面的比較研究》的論文摘要中提到:美國科技決策體系為典型的“自下而上”式?jīng)Q策結(jié)構(gòu),上層決策主體多元而分散,存在政治分肥;下層執(zhí)行主體清晰,決策獨立集中。[1]將這句話中的“政治分肥”進行翻譯時即為“pork barrel”!這就是僅僅進行了字面翻譯,沒有理解摘要內(nèi)在的含義,由此可以看出,機器翻譯還是不夠準確,需要人工參與。
但是相較于人工翻譯,機器翻譯的速率更快,效率也有顯著的提高,在進行翻譯時,用戶僅需要將要翻譯的內(nèi)容粘貼到翻譯軟件上即可。機器翻譯的語料庫是非常豐富的,并且能夠緊跟時代的發(fā)展,當前的所流行的新詞、熱詞都能夠包括進來。隨著數(shù)據(jù)挖掘技術(shù)發(fā)展,機器翻譯將能夠從海量信息中分析提煉出最佳的翻譯結(jié)果,這是機器翻譯所追求的最終目標。因此可以將機器翻譯的優(yōu)點歸納為:
目前很多專用名詞的翻譯存在多個版本,不同翻譯者產(chǎn)生的翻譯版本也是不同的,所以對于專用的名詞應(yīng)該統(tǒng)一翻譯標準。通過機器翻譯就可以實現(xiàn)專用名詞翻譯的標準化。例如在《影像研究與醫(yī)學應(yīng)用》中一篇題為《法醫(yī)臨床鑒定中的磁共振成像技術(shù)應(yīng)用》的論文摘要中提到:通過在法醫(yī)臨床傷者鑒定中,利用磁共振成像技術(shù),從而有效地對傷者的具體患傷時間段、患傷的隱匿性損傷以及積液的具體性質(zhì)進行分析,存在較高的可靠性,從而有效的在當前的臨床法醫(yī)鑒定中,提供了更加可靠的客觀性成像依據(jù)[2]。這句話中的“核磁共振”在醫(yī)學類的論文摘要中經(jīng)常遇到,有時將其翻譯為MRI,有時將其翻譯為NMR,通過機器翻譯軟件,如谷歌翻譯、百度翻譯等可以看出都將“核磁共振”翻譯成了NMR,這樣人們在利用機器翻譯時能夠統(tǒng)一的將“核磁共振”翻譯成了NMR,實現(xiàn)了專用名稱的統(tǒng)一化處理。
論文摘要尤其是科技論文摘要,往往包含了學者對最新科技的研究,同時,社科類的論文中往往是目前的社會現(xiàn)象進行研究,這樣利用人工在進行翻譯時會受到文化和譯者學術(shù)水平的影響,而通過機器翻譯可以利用其存儲容量大、數(shù)據(jù)庫更新速度快等優(yōu)點實現(xiàn)對最新詞語的翻譯。
例如在《機械設(shè)計與制造》中一篇題為《核極化的特征選擇算法在LSSVM中的應(yīng)用》的論文摘要中提到:在研究多參數(shù)高斯核和核極化的基礎(chǔ)上,提出了核極化優(yōu)化多參數(shù)高斯核的特征選擇LSSVM算法[3]。這句話中的LSSVM是最小二乘支持向量機的縮寫,這在計算機類論文中是約定俗成的縮寫形式,但是對“高斯核”、“核極化”的翻譯就需要借助與機器翻譯,通過谷歌翻譯可以將其翻譯為“gaussian kernel”、“Nuclear polarization”。
此外,在人人自媒體的時代,網(wǎng)絡(luò)詞匯也是層出不窮,例如在《計算機研究與發(fā)展》中一篇題為《莫做微信時代的“低頭族”、“容器人”》的論文摘要中提到的:“低頭族”、“容器人”都需要借助與機器進行翻譯[4]。
機器翻譯的語料庫的記憶功能是非常強大的,這樣在進行翻譯時不同的翻譯軟件可以翻譯得到不同的結(jié)果,這些結(jié)果可以供用戶進行選擇。例如在《染整技術(shù)》中一篇題為《“虛實相生”水墨意境在平面設(shè)計中的構(gòu)建》的論文摘要中提到:我國水墨畫歷來備受人們的喜愛,越來越多的平面設(shè)計師將水墨元素運用到作品中,追求一種虛實相生的意境[5]。翻譯“虛實相生”時可以通過機器翻譯得到翻譯結(jié)果,經(jīng)常會用到的翻譯軟件為“Virtual reality”,有道翻譯為“false or true complement”,谷歌、百度翻譯為“Virtual and reality”。在進行機器翻譯時并不能把作者想表達的情感發(fā)揮出來,此外雙語的雙語翻譯可以供翻譯人進行比較、選擇。
翻譯的最初目的是將源語言翻譯成目標語言,隨著人們需求的提高,翻譯的最終目的是要與特定的環(huán)境相匹配。目前的機器翻譯僅僅能夠完成源詞匯和目標詞匯之間的映射轉(zhuǎn)換,還不能做到信、達、雅。學術(shù)論文與一般的文學翻譯還是存在一定區(qū)別的,前者是以議論文居多,文章更多的是進行事實的客觀陳述,摘要更是對論文高度的概括,講求的是嚴謹,所以在用機器進行翻譯時并不能真正地做到語法、語義等通暢,因此在機器翻譯時需要人工進行干預(yù)。
此外,通過網(wǎng)絡(luò)調(diào)查也發(fā)現(xiàn),很多用戶認為機器翻譯不能真正地理解自然語言,以及所處的語言環(huán)境,翻譯時不能達到理想效果,因此在翻譯時需要人工的參與,人工參與翻譯主要可以分為三個階段:一是翻譯前消除歧義;二是在翻譯過程中要進行多款翻譯軟件的比較,不能單純地依賴于一款軟件;三是翻譯完要進行編輯。
不管是通過機器還是人工進行翻譯都需要在翻譯前對原文進行分析,分析的主要目的是消除語法、語義上的歧義,使得譯文更加符合特定的語境。
漢語和英語是在詞的形態(tài)上存在不同,在漢語理解方面人們一般不會特意地進行語句的分割,會根據(jù)自身的語言習慣和文化進行語句的分割和理解,可是在利用機器進行翻譯時并不能做到自行分詞,機器翻譯會對一句話存在多種分詞,例如在《黨政研究》中一篇題為《網(wǎng)絡(luò)政治參與對中國社會政治穩(wěn)定的影響》的論文摘要中提到:網(wǎng)絡(luò)政治參與也對我國的民主機制和社會政治穩(wěn)定等方面提出了嚴峻挑戰(zhàn)[6]。在利用機器翻譯時就有了以上多種切分方式:
網(wǎng)絡(luò)/政治參與/也對我國的民主機制和社會政治/穩(wěn)定等方面提出了嚴峻挑戰(zhàn)
網(wǎng)絡(luò)政治/參與也對我國的民主機制/和社會政治穩(wěn)定等方面/提出了嚴峻挑戰(zhàn)
網(wǎng)絡(luò)政治參與/也對我國的民主機制和社會政治穩(wěn)定等方面/提出了嚴峻挑戰(zhàn)
在進行人工翻譯時能夠根據(jù)第三種理解情況進行翻譯,而機器翻譯還能智能的理解語義,因此需要人工進行斷句。
隨著計算機技術(shù)的發(fā)展,機器翻譯的軟件也是層出不窮,比如谷歌翻譯、百度翻譯、有道翻譯等等。在翻譯的過程中不能將原文直接輸入到翻譯軟件中直接進行翻譯,這樣會在語法、語序等方面存在一定的問題,因此需要在機器翻譯完后,通過人工修改使得譯文順暢,具有可讀性。
例如在《數(shù)字技術(shù)與應(yīng)用》中一篇題為《基于蟻群算法的多農(nóng)業(yè)機器人路徑規(guī)劃研究》的論文摘要中提到:針對多機器人群體作業(yè)容易出現(xiàn)路徑?jīng)_突和碰撞的問題,本文基于蟻群算法,設(shè)計和研究了多農(nóng)業(yè)機器人路徑規(guī)劃和導航系統(tǒng),實現(xiàn)了多農(nóng)業(yè)機器人移動路徑的實時動態(tài)規(guī)劃和自主導航功能,為機器人進一步發(fā)展提供了一定的理論基礎(chǔ)[7]。有道翻譯和谷歌翻譯對其翻譯分別為:
有道翻譯:For multi-robot group homework easy path conflict and collision problems, this article is based on ant colony algorithm, the design and research the agricultural robot path planning and navigation system, implements the more agricultural real-time dynamic mobile robot path planning and function of autonomous navigation, for robot provides a certain theoretical basis for further development
谷歌翻譯:Aiming at the problem of path conflict and collision in multi-robot group operation, this paper designs and studies the multi-agricultural robot path planning and navigation system based on ant colony algorithm, and realizes the real-time dynamic planning and autonomous navigation function of multi-agricultural robot moving path. The further development of the robot provides a certain theoretical basis.
英語和漢語的斷句是不一樣的,漢語在表達時可以通過多個逗號形成一段話,但是英文是不可以的,主謂賓形成一句話后應(yīng)該以句號結(jié)束,而通過上述兩種機器翻譯結(jié)果可以看出,不管是谷歌翻譯還是有道翻譯都是一逗到底,不符合英語的寫作規(guī)范。此外,在翻譯的過程中存在多處的語法、語序的錯誤,有道翻譯的第一句就不準確,直接就是漢語和英語直接的詞與詞的翻譯,整個翻譯缺乏邏輯性,對“實時動態(tài)規(guī)劃和自主導航功能,為機器人進一步發(fā)展提供了一定的理論基礎(chǔ)”翻譯不準確,通過翻譯分不出主語在哪兒。雖然谷歌翻譯的連貫性加強了,但是在翻譯時還是略顯呆板,對于最后一句“為機器人進一步發(fā)展提供了一定的理論基礎(chǔ)”,完全可以根據(jù)語境來翻譯,可是機器還是按照字面進行硬性翻譯,完全可以根據(jù)前后文的語境翻譯為“The study of path planning provides a theoretical basis for further development of robots.”。
通過以上的闡述可以看出,在進行論文摘要的中英文翻譯時機器翻譯的譯文中出現(xiàn)錯誤是不可避免的,并且機器翻譯不會像人工翻譯考慮上下文的銜接,以及上下文之間的聯(lián)系,僅僅是進行兩種語言的映射。此外,翻譯不能單純地認為是兩種語言之間的轉(zhuǎn)換,要充分地考慮背后文化對其影響,要將文化內(nèi)涵反映出來,而機器翻譯不能兼顧形和神,所以在翻譯完后需要人工的審校和潤色。例如《網(wǎng)紅經(jīng)濟熱現(xiàn)象分析》的摘要提到:網(wǎng)紅經(jīng)濟作為一種以網(wǎng)絡(luò)為平臺、以社交媒體為傳播載體的粉絲經(jīng)濟,是新經(jīng)濟的組成部分。網(wǎng)紅作為一種能夠被無限拓展的商業(yè)媒介,網(wǎng)紅經(jīng)濟更成為互聯(lián)網(wǎng)新經(jīng)濟業(yè)態(tài)多元化的一個縮影。[8]其中提到的“網(wǎng)紅經(jīng)濟”直接輸入到百度翻譯中翻譯為“Net red economy”,這個翻譯太直白了,無法滿足翻譯所要求的不僅語句通順,還得具有可讀性,因此通過對原文的理解以及對網(wǎng)上相關(guān)的信息的調(diào)研,可以將其翻譯為Wanghong economy/Internet celebrity economy。
例如在《潘天壽藝術(shù)的孤獨與靜美》的摘要提到:它也許是“大江闊千里,孤舟無四鄰”的廣袤和寂寥,也可能是“尋尋覓覓,冷冷清清,凄凄慘慘戚戚”的悲戚和哀婉。[9]其中“尋尋覓覓,冷冷清清,凄凄慘慘戚戚”就不能直接翻譯,雖然這種疊字不容易翻譯,但是在翻譯時要盡量根據(jù)語境進行翻譯,做到生動、形象。
由此可以看出,現(xiàn)在的機器翻譯能夠做到對一般詞匯或者語句的翻譯,但是翻譯完,還需要人工參與進行修改和潤色,所以人工在機器翻譯中還是起著非常重要的作用的,只不過是通過機器翻譯的參與使得整個翻譯工作的效率得以大幅度的提高。
通過機器翻譯在論文摘要翻譯中的應(yīng)用可以看出,隨著大數(shù)據(jù)挖掘以及人工智能技術(shù)的發(fā)展,機器翻譯的效果會越來越好,但是人工干預(yù)還是非常有必要的,不然翻譯出的譯文會有語法、語義不通等問題,因此在利用機器翻譯時要通過人工對翻譯前的摘要進行消除歧義,在翻譯過程中要利用不同的翻譯軟件進行對比,最后要進行潤色,使得譯文能夠符合語境。希望今后越來越多的學科的學者和專家深入到機器翻譯的研究中來,使得機器翻譯的優(yōu)勢得到發(fā)揮,有效地提高論文摘要翻譯的質(zhì)量和水平。