吳瓊
摘 要: 在全球化時代,世界各國人民的溝通與交流日益頻繁,翻譯已經成為政治、經濟、社會、文化等領域必不可少的一個重要環節。計算機在翻譯過程中發揮著日益顯著而且不容忽視的重要作用。本文探討了譯者應如何充分利用計算機和計算機輔助軟件提高翻譯效率,以便事半功倍的問題。
關鍵詞: 計算機翻譯 計算機輔助軟件 翻譯過程
1.引言
進入二十一世紀以來,國內外學者對翻譯研究的熱情與興趣持續高漲。但是在翻譯研究領域,計算機翻譯已經有五十多年的歷史,但令人遺憾的是國內學者對計算機翻譯的興趣并不高。在中國知網上輸入以“計算機翻譯”為關鍵詞檢索文章,系統返回的檢索結果屈指可數。關于計算機翻譯研究的文章,最早柯平(1995)介紹了歐美的翻譯發展現狀。隨后張政(2003)主要探討了計算機翻譯到底應該稱為機器翻譯還是電子翻譯等事宜。呂立松、穆雷(2007)以國內翻譯市場為背景,分析了計算機輔助翻譯技術與翻譯教學的結合的發展前景。陳海東(2009)進行了計算機翻譯存在的困難及解決方法新探。在此背景下,2012年上海外語教育出版社響應時代的需求,引進了《計算機與翻譯:譯者指南》一書。
哈羅德·索莫斯是英國曼徹斯特大學語言工程學教授,有超過25年的教學和研究經驗。曾擔任Machine Translation雜志的編輯,現仍然為該雜志的編委員會成員。他是計算機翻譯領域的前沿領軍人物,對計算機翻譯有濃厚的興趣、獨到視野與見解。他編著了《計算機與翻譯:譯者指南》。“他山之石,可以攻玉”,在吸取國內學者的經驗智慧時,不妨了解國外同行的相關研究動態,拓寬自己的研究視野。
從書名可見,本書內容是關于計算機與譯者。但是這并非一部計算機科學的教科書,與翻譯理論沒有很大關系。實際上,本書的預定讀者是譯者和其他專業語言學家(包括作家、雙語秘書、甚至外語教師),目的是舉例說明計算機對他們的職業已經產生的和即將產生的影響。本書與計算機翻譯與計算機輔助翻譯相關,為譯者提供好輔助的計算機資源,并講述了翻譯與計算機的過去、現在和未來。
關于計算機與翻譯,本領域已經有不少闡述。很多人認為最為大家所熟悉的“機器翻譯”有點誤導性,但是好像沒有更好的替代詞。也許“翻譯技術”或者“翻譯軟件”之類術語更容易幫助大家理解本話題,后者強調作者更重視計算機程序而不是計算機硬件等。如果用“譯者”取代“翻譯”,有助于讓大家不僅關注翻譯作為終端產品,更關注“翻譯”是譯者使用不同工具進行的一個過程,當然本書作者關注的是與計算機相關的翻譯過程,旨在表明在全球化時代,計算機對譯者有什么作用、能在何種程度上幫助譯者、哪些是計算機無法勝任的任務,從而證明計算機不但不會對譯者生活構成威脅,反而是能讓譯者工作更輕松更令人滿意的一個重要工具。
1.1作者是誰
本書由學者(教師、語言學研究人員、特別是計算機語言學家、翻譯理論家、軟件公司的員工、譯者)寫成,他們對翻譯與計算機的各個方面有濃厚的興趣,而且在該領域有豐富的經驗。他們致力于告訴讀者有關計算機與翻譯的真實故事,比如計算機比較擅長哪些任務、無法完成哪些任務。作者并非意在推銷某種產品,而是想澄清在互聯網譯者論壇、暢銷媒體、甚至關于翻譯的書籍上看到的不實傳聞和偏見。
1.2讀者是誰
本書的讀者是了解語言與翻譯并對此有興趣的人。也許是語言學家,也許只是一個熱心人士,也許是關注計算機與翻譯并對此有些懷疑的人。看到本書表明讀者并不排除計算機在翻譯過程能發揮重要作用的可能性,而且愿意接受新的觀點。
可能讀者并不是計算機愛好者,如果讀者想了解字節與字符、集成內存、周邊設備等,那么本書就不適合。也可能讀者是普通的計算機用戶,會用Word,會上網,大致了解軟硬件之間的區別,了解Windows、桌面、文件與文件夾,偶爾使用電腦玩游戲,也會用一些程序。總之,這些都不是讀者的專長。
但是,讀者確實了解語言。作者不想告訴讀者不同語言對不同事物有不同的表達方式,言語的意義與使用有不同之處等。但是,作者推測讀者已經熟悉傳統語法的術語(名詞、動詞、性別、時態等)。最重要的是。不需要提醒,翻譯是一門藝術,不是科學,并不存在絕對正確的翻譯,譯者的譯作經常被低估了。翻譯是一種人工技能,不是機械的過程。讀者也知道一些事實:幾乎無人單純以翻譯文學作品和詩歌為謀生手段。翻譯幾乎是技術性的,而且這一行要求很高,有些常規性、基礎性,甚至有些煩瑣。無論如何,計算機對讀者的工作有所幫助。
1.3本書的體例
作者期望本書能為讀者開啟興趣之門。因此,本書以學術方法標注相關文獻以支持本書的觀點。在說明特定觀點時,作者提供腳注以便有別于其他,以免引起混淆。在每一章后面,也會指引讀者去查詢進一步的資料來源。術語將以加粗字體顯示,軟件產品名稱以斜體顯示,以便從排版上與創造這些術語的公司名稱有所區別。此外,作者經常會舉例說明觀點,遵循以下語言學規范:無論何種語言的例句均以斜體顯示。意思的批注以單引號標注。較長的例句一般與正文分開,由括號加數字表示,比如(1)。外語例句同時有直譯和意譯。另外,用星號(*)表示句子或者短語不符合語法,問號(?)表示句子可疑,值得商榷。
2.歷史回顧
多少年來機器翻譯一直是人們夢寐以求的事情。機器翻譯常常出現在科幻作品中(比如《星際迷航》中的萬能解碼器),而且機器翻譯這個概念比計算機的發明還要早幾百年。自從計算機發明以來,就有人暗示翻譯可以用計算機完成。十七世紀的哲學家(比如Leibniz、Descartes和John Wilkins)建議可以以數字代碼的形式創造世界性語言。
1933年,有關政府頒發了兩個獨立的“翻譯機器”專利,一個發給法國人(Georges Arstrouni),另一個發給前蘇聯人(Petrovich Smirnov-Troyskii)。但是一般說來,機器翻譯的歷史可以追溯到二戰后的某個時期。那時計算機開始用于破解密碼。翻譯的理念類似于當時的洛克菲勒基金會副總裁Warren Weaver提出的“計算”。1947至1949年之間,Weaver與美國國內外的同事研討用新計算機翻譯的可能性(當時稱為電子大腦)。Weaver特意提到了翻譯與解碼術的關系,盡管早期大部分研究人員認為要把兩者結合起來相當困難。
2.1早期研究
Weaver的觀點引起了人們不同的反應。1951年,麻省理工大學決定授予Yehoshua Bar-Hillel全職研究員職務。一年后,麻省理工大學舉辦了計算機翻譯會議,與會者有18位對計算機翻譯感興趣的人士。接下來10至15年里,計算機翻譯研究團隊在許多國家開展工作:美國、前蘇聯、英國和加拿大等。特別是在美國,計算機翻譯研究團隊不但得到政府大量經費資助,還可以利用軍方和私人的資源。僅美國一個國家,至少投入了一千兩百萬美元甚至高達兩千萬美元用于計算機翻譯研究。
1964年,美國政府決定核實經費使用情況,并成立自動語言處理咨詢委員會(ALPAC)。1966年公布的報告對計算機翻譯非常不利。以美國的俄英計算機翻譯為焦點,該報告認為計算機翻譯效率低下,準確率不高,比人工翻譯貴一倍,因此需求量不大。該報告還指出:“計算機翻譯沒什么立即見效而且有用的可預測前景。”事實上,ALPAC報告提議開展計算語言學的基礎性研究,暗示也許計算機輔助翻譯更可行。該報告產生的負面影響由此可見,計算機翻譯研究從此進入低谷期,不僅在美國,在其他國家也一樣。
實際上,ALPAC報告不應是個意外。早期用計算機翻譯的努力因技術問題而受阻,而且研究人員(主要是數學家和電子工程師而不是語言學家)低估了問題的難度。當時理論語言學(形式語言學)剛剛萌芽,喬姆斯基的顛覆性觀點剛剛得到同行的認可。Bar-Hillel之類人士已經認識到計算機翻譯的難度。Bar-Hillel曾寫過一篇文章,談到翻譯的“語義障礙”,此觀點比ALPAC的反思要早幾年,有關全面研究計算機翻譯的呼吁可以在二十世紀五十年代中晚期的各大出版物中找到。
2.2“白癡”以及其他傳聞
在此期間,到處都是蹩腳的計算機翻譯的傳聞(有些傳聞甚至是杜撰),各種版本甚囂塵上。二十世紀五十年代晚期,在有關計算機翻譯的文章中,有人說計算機翻譯“Out of sight, out of mind”(眼不見心不煩)為俄語時,譯為“blind idiot”(白癡)的意思。而且“The spirit is willing but the flesh is weak”(心有余而力不足)被誤譯為“The vodka is good but the meat is rotten”(酒不錯但肉已經爛)。回顧這個時期的計算機翻譯系統,作者很難想象怎么會產生這種誤譯。有評論家(包括本書作者)暗示,這類傳聞講的可能是那些不稱職的人工翻譯。
2.3第二代計算機翻譯系統
二十世紀七十年代和二十世紀八十年代初期,計算機翻譯研究在美俄以外的國家遍地開花:加拿大、西歐和日本,因為其政治文化需求也有很大不同。加拿大的雙語政策促使蒙特利爾大學成立一個著名的研究團隊。在歐洲,法、德、意都有計算機翻譯研究團隊,歐盟委員會決定在盧森堡試驗Systran系統,具有重大意義(由于有私人經費贊助,Systran系統是經過ALPAC整頓后的一個美國計算機系統)。在日本,用計算機處理復雜的日語寫作系統取得初步成功,這極大地鼓舞了大學和企業的研究團隊關注日英翻譯。
2.4實用的計算機翻譯系統
到二十世紀八十年代中期,業界公認全自動高質量翻譯各類文本是人類近期不可能實現的目標。計算機翻譯的研究人員開始思考,能否找到研發可用而且有效的計算機翻譯系統的方法。很多評論家開始區分用計算機翻譯輸入與用計算機翻譯輸出的差別。在計算機翻譯輸入中,用戶是不熟悉外語書面文本的讀者。在計算機翻譯輸出中,用戶是準備用一種或者多種語言發表作品的作者。如果輸入的文本有限,計算機翻譯可能會有效,這種觀點開始得到廣泛傳播。隨著語言分支的發展,這種觀點得到進一步發展。語言分支觀認為,計算機翻譯系統可以預設一些特定的應用程序,屆時輸入的語言將成為完整語言的一個部分,即“語言分支”(詳見第15章)。這種研究方法在蒙特利爾大學研發得非常成功的METEO 系統里很常見。該系統能把英文的天氣預報譯為法文,而這種工作如果由人工翻譯則會很枯燥。與語言分支密切相關的是使用控制語言,詳見第14章的技術定制。
與全自動高質量翻譯(FAHQT)難度相關的其他重大進展,是以譯者工作站的形式提出了譯者的計算機輔助工具這個概念(詳見第2章)。隨著小型便宜計算機硬件的出現,該觀點得到進一步發展。由此,譯者憑軟件和其他計算機輔助設備的幫助完成翻譯任務。翻譯任務仍屬于人類可控制范圍。這些工具的完善程度有所不同:從(現在幾乎無處不在的)具備拼寫檢查、同義詞表(主題詞表)功能的多語種文字處理、(單語和多語)在線詞典及其他參考來源,到可為譯者完成部分初稿翻譯及后期校對的計算機輔助翻譯系統。隨著計算機日益完善,人們還研發了其他工具,比如很多讀者將漸漸熟悉的著名翻譯記憶工具。
2.5最新研究進展
進入二十世紀九十年代后直到現在,計算機翻譯和計算機輔助翻譯產品日益被語言學家及外行人所推廣和使用,外行人用之于翻譯郵件和網頁。這正是本書后半部分研究的主題。同時,計算機翻譯研究人員繼續為自己定下遠大目標。口語翻譯(SLT)就是其中一個目標。口語翻譯包括兩個艱巨的計算任務:言語理解及翻譯。第一個任務涉及從音效符號中提取可以理解為言語的相關聲音(即,忽略背景噪音及其他非言語聲音),準確識別個人言語聲音(音符)及其中包含的詞語,過濾其中無用的信息,比如猶豫、重復、錯誤的開始、不完整的句子等,以組成連貫的篇章信息。所有這一切均有待于翻譯。此任務完全不同于翻譯書面文本,因為通常最重要的是內容而不是傳達信息的形式。而且,對實時處理的限制也會造成不容忽視的額外困難。在口語翻譯的最新現狀背景下,如果一個系統能夠處理語言輸入并在五秒內提供合理翻譯(當然是以人工合成言語的形式),這就相當不錯。
再看書面文本的計算機翻譯,另一個關注點是其覆蓋各種各樣的語言。到目前為止,能夠得到研發人員關注的主要是有商業價值的西歐和遠東的主要語言。大家公認世界上至少上萬種語言,至少應該為此研發相關的計算機翻譯或者計算機輔助翻譯軟件。即使每種類似或者相關的語言可用來作參考起點,每種新語言都會帶來很多巨大的問題。如果采用傳統的語言學方法進行計算機翻譯,那么必須先制定新語言的語法規則,新舊語言之間的遷移規則,其中最大的瓶頸是:必須為成千上萬的詞語制定詞典的詞條。即使計算機翻譯系統使用的詞典包含不同于傳統詞典的信息(形式不同),如果以機器可讀的形式來提取相關信息,有時可以使用傳統詞典。另一種開始探索的方法是從大量的平行語料庫中提取語言學信息,即收集文本和翻譯,而且假設兩邊的語料庫完全“匹配”。但是這類研究問題可能與本書的讀者無關。在編輯本書時,作者偏向于關注務實可用的計算機翻譯和計算機輔助翻譯現狀。
3.本書的概覽
本書前七章探討譯者可用計算機做的各種用途,本書的后半部分則關注計算機翻譯。第二章探討了譯者工作站理念的變遷和譯者常用的一些計算機輔助工具。第三章專門關注其中一種工具:翻譯記憶。第四章討論術語在計算機輔助翻譯運作中的特殊地位。譯者經常需要查詢技術詞匯,以確保自己選用的術語準確無誤。Lynne Bowker指出,計算機在這方面可以發揮相當重要的作用,因為術語庫和其他術語來源以各種形式出現,可以使用,不僅有在線術語庫,還有計算機可讀取的詞典和主題詞表。
最近幾年,出現了一種相對較新的翻譯活動,美曰其名軟件本土化。在計算機的早期研發階段,大部分軟件(和硬件)的制作都偏向(美國的)說英語用戶。現在人們已經認識到,面向全球市場的產品,必須為全球市場的特定部分定制生產。軟件本土化不但涉及翻譯文件,包括在線幫助文件,還涉及定制軟件本身,因為這包含語言。在第五章中,Bert Esselink從他的書中提煉出一個觀點,以便為涉及的問題提供解決方案,并指出可以協助譯者完成翻譯任務的一些工具。
在當今以商業為主導的世界中,大部分翻譯工作都與商業動機相關。因此,社會經濟因素影響著計算機翻譯和計算機輔助翻譯系統的發展。由此,能得到開發商關注的主要是幾種歐洲語言(英、法、德、意、萄、俄語)、日、中、韓和阿拉伯語。如果譯者使用的工作語言是其他幾千種小語種之一,那么只能自嘆運氣不佳。第六章探討了計算機輔助翻譯與小語種的關系。具有諷刺意味的是,在資源不足的語言清單中,居然包括幾種占世界前二十名的常用語言(比如印地語、孟加拉語、馬來語/印尼語、烏爾都語、旁遮普語、特拉古語、泰米爾語、馬拉地語、粵語)。作者反思這些語種(其他小語種)的譯者會有怎樣的前景,以及什么樣的計算機輔助工具和資源對他們有用。第七章探討計算機在譯者培訓學術界中的地位。Sara Laviosa反思了計算機在翻譯研究中的用途,具體來說,是應怎么樣利用計算機語料庫(收集翻譯文本)研究翻譯實踐的趨勢。
本書后半部分的章節密切關注計算機翻譯。在第八章中,Doug Arnold剖析為何翻譯對計算機而言很棘手。讀者可以了解到對人類而言翻譯哪些方面比較難。Doug Arnold指出,首先有些是語言理解問題。其次,有些是用外語表達譯者的理解所造成的問題。這一切對計算機都造成了障礙。畢竟,計算機只是比較完善的算法機器。至少有些問題得歸結于語言本身。在第九章里,Paul Bennett描述了語言學怎么樣才能提供問題的解決方案。
第十、十一、十二章從商業角度探討計算機翻譯。在第十章里,John Hutchins(計算機翻譯的歷史學家和首席研究員),詳細介紹了有商業價值的計算機翻譯和計算機輔助翻譯軟件的最新發展狀況。第十一章剖析了開發商的觀點。Laurie Gerber曾是一位Systran的資深語言學家,Scott Bennett 是一位LOGOS研發團隊的資深隊員,他們一起見證了西門子公司Metal 計算機翻譯系統成功下線的過程。在第十二章中,Jin Yang和Elke Lange報告了Systran錯綜復雜的試驗過程。在試驗過程中,他們的計算機翻譯系統可以在萬維網上免費獲取。這次試驗說明為什么研發公司樂讓別人免費使用其產品,而且報告了密切監測網站、用戶反饋及意見一段時間后得出的結果。
在第十三章,John White探討如何評估計算機翻譯,這對于想把計算機翻譯或者計算機輔助翻譯作為翻譯需求解決方案的人來說很重要,無論他們是自由職業者、小型翻譯公司還是大公司的翻譯部門。關于評估內容、評估標準以及可避免的一些漏洞,White都提供了務實的歷史性回顧。
接下來三章介紹了計算機翻譯的一些實用方面。第十四、十五章分析充分利用計算機翻譯的兩大策略:控制語言法與語言分支法。Eric Myberg,Terako Miramura和Wolf Huijsen描述了控制語言,解釋該理念背后的基本概念,以及在翻譯中的運用。控制語言的一個重要特征是:要從待譯文本作者那里得到文本主要讀者的認可,克服因負面的先入之見而造成作者創造性的損失,從而導致控制語言不可避免的文本形式空缺。控制語言以預設和后設方式限制了待譯文本的句法和詞匯。語言分支法充分利用文本的文體和詞匯中自然而然發生的限制及偏好。第十五章講述了一個成功的語言分支計算機翻譯系統的典型例子(以加拿大Meteo系統為例),并反思這到底是曇花一現的成功,還是這次試驗成功為未來的計算機翻譯指明了光明道路。
第十六章,Jeffrey Allen分析了如何修正計算機翻譯輸出的問題。一般稱為后期編輯,以便區別于人工翻譯常做的平行修改任務。Allen指出這兩種任務之間的一些差別,提出相關策略與技巧,以便能更輕松有效地完成翻譯任務。最后作者探討了在翻譯教學中如何使用計算機翻譯和計算機輔助翻譯,這對培訓譯者和一般的外語學生都有所啟發。
參考文獻:
[1]Harold Somers. Computers and Translation: A Translators Guide[M]. Shanghai Foreign Languages Education Press. 2012.
[2]陳海東. 計算機翻譯存在的困難及解決方法新探[J]. 中國科技翻譯,2009(16).
[3]呂立松,穆雷. 計算機輔助翻譯技術與翻譯教學[J]. 外語界,2007(3).
[4]柯平. 歐美的機器翻譯[J]. 中國翻譯,1995(2).
[5]張政. “機器翻譯”、“計算機翻譯”還是“電子翻譯” [J]. 中國科技翻譯,2003(2).
基金項目:本文是江西省高校人文社會科學研究規劃項目(YY1507)和江西省社會科學規劃課題(項目編號:15WX314)的前期階段性成果。