□李偉超 宋亞軍
(一)構建西藏旅游外宣漢英平行語料庫的必要性。外宣翻譯是要完成那些以對外宣傳材料的翻譯任務為基本內容的翻譯實踐活動的總稱(張健,2013)。對旅游業出現的文本進行的翻譯實踐活動可稱之為旅游外宣,其目的在于“外”,即向來自海外的旅游者解釋、說明、推介相關旅游資源,其傳播方式在于“宣”,即以各種媒介為渠道,對來自海外的旅游者宣傳相關旅游資源。旅游外宣翻譯的質量高低,在一定程度上決定了旅游資源的宣傳效果以及海外旅游者的旅游舒適度。通過中國知識網CNKI 的檢索發現,學者們對西藏旅游外宣翻譯的研究并不多見,但也有學者做了深入的研究。比如譚益蘭(2013)通過運用語篇翻譯的相關理論,選取了布達拉宮、羅布林卡和拉魯濕地三個旅游景區中的地圖、旅游指南、門票、旅行社宣傳資料等的公示語篇,詳細分析了此類語料庫漢英翻譯存在的問題,并提出了提升西藏旅游景區公示語語篇漢英翻譯質量的具體對策與建議。此外,弋睿仙、賈麗萍(2014)運用賴斯的翻譯批評理論,對布達拉宮門票上的漢英翻譯質量進行了評估,從文本類型、語言內因素和語言外因素對譯文進行了全面、客觀的分析,發現了譯文在語義、詞匯和語法等方面存在的一些不足之處。上述兩個研究針對西藏旅游外宣文本的漢英翻譯進行了個案研究,西藏旅游外宣文本漢英翻譯現狀不容樂觀,存在著的大量問題亟待解決。隨著語料庫語言學以及語料庫翻譯研究的發展,不少學者提出建設旅游外宣類漢英平行語料庫為解決旅游外宣文本翻譯質量低下的問題提供了更為實用、方便的途徑。
(二)構建西藏旅游外宣漢英平行語料庫的可行性。語料庫(corpus)是應用計算機技術對海量自然語言材料進行處理、存儲,以供自動檢索、索引以及統計分析的大型資料庫(李文中,1999)。在建設語料庫的過程中,首要的任務就是搜集海量的自然語言,在語料稀少的情況下,是無法建設成具有一定規模的語料庫的。西藏自治區旅游資源豐富,充斥著大量的漢英對照的旅游文本,包含公示語、景觀介紹、門票信息、交通地圖、酒店餐飲介紹、博物館展品說明、特色旅游紀念品介紹等等。此外,每年西藏都有大型的節慶、博覽展出等活動,比如藏歷新年、賽馬節、雪頓節、林卡節等一系列具有民族特色的節慶活動。可以說,隨著西藏旅游走向國際化的道路,旅游外宣文本的多語對照已經形成常態,我們可以輕而易舉地獲得大量的語言數據。
(一)建庫目的。語料庫并不是大量自然語言數據的簡單集合,它是有嚴格的設計標準的。就語料庫的應用目標而言,其收錄的語言材料應該具有代表性(常寶寶、俞士汶,2009)。這就要求我們在建庫前明確哪些語言材料是建庫所需要的,同時應明確哪些語言材料是應剔除的。對于本研究中提出的西藏旅游外宣漢英平行語料庫建設來說,要建設高質量、精品化、本地化的旅游外宣漢英平行語料庫,使其能很好地服務于西藏旅游外宣漢英翻譯的工作;服務于西藏區內高校旅游專業學生翻譯教學的工作;服務于西藏區內旅游從業人員英語培訓提高的工作。因此,這就對建庫過程中的語料選取提出了更高、更優的要求。
(二)語料選取。在構建平行語料庫時,其中一個基本原則就是平行文本的來源和領域必須嚴格界定(李文中,2010)。針對本研究中語料庫的語料選取問題,首先要明確的是旅游外宣文本的含義。廣義的外宣翻譯涵蓋所有的對外宣傳方面的翻譯活動,狹義的外宣翻譯包括各種媒體報道、政府文件公告、政府及企事業單位的介紹、公示語、信息資料等實用文體的翻譯(張健,2013)。此外,根據上述的語料庫的建庫應用目標,本研究提出的西藏旅游外宣漢英平行語料庫側重于旅游文本在對外宣傳過程中的漢英翻譯,而并非外宣文本的漢英翻譯。本研究中的旅游外宣文本屬于外宣文本中的一個類別,它包含了所有在旅游活動中出現的,起到對外宣傳作用的文本。因此,在語料選取過程中,主要搜集以下幾類漢英對照的旅游文本材料:景觀介紹;觀光指南;景區公示語;餐飲住宿介紹;博物館陳列說明。通過購買印刷材料,收集網站資料,實地考察旅游景區等方式獲取相關語料。確定了語料來源之后,另一個需要解決的問題就是語料的代表性問題。采取根據社會語域的標準,利用分層抽樣、均衡抽樣和比例抽樣三者結合的方法,使得西藏本地旅游業中具有代表性的漢英翻譯文本成為入庫語料。由于本語料庫是應用型語料庫,主要用于為西藏旅游外宣翻譯提供可靠的參考,以及西藏本地高校旅游英語翻譯教學,那么必須要建設成為高質量、精品化、本地化的旅游外宣漢英平行語料庫,也就需要對收集到的文本中的語言材料的質量進行評估,以免質量不高的語言材料入庫,對以后的研究和英語產生負面效果。因此,在語料入庫時要注意以下幾個方面:一是含有語法、搭配、拼寫錯誤的文本,略加更正后入庫;二是出現譯文表達不準確甚至錯誤的文本不予入庫;三是組織翻譯專家對入庫語料進行二次審核把關,剔除或修改質量不高的譯文。
(三)語料錄入與保存。由于語料來自于印刷材料、網絡電子文本、拍攝下來的圖片資料,因此需要大量的人力物力將這些語料進行數字化的轉換。對于紙質的印刷材料,可以采取先掃描成PDF 格式的文件,再轉換成TXT 格式文本的方法;對于網絡文本,其轉換方法很簡單,需要注意的就是剔除嘈雜信息;然后拍攝的圖片資料則需要人工輸入。所有入庫語料經過掃描、轉換、剔除網絡嘈雜信息等過程后,經過多次的文字校對和格式整理,全部保存為TXT 格式的文檔備用。
(四)語料標記與標注。對于語料庫的標注的定義,李文中(2012)認為各家觀點不同,但分歧不大,因此他主張使用“標記”和“標注”兩個術語,語料庫標記表示添加與文本結構正字特征的表達和有關文本識別特征的過程,語料庫標注則表示詞性標注、語法標注、話語標注以及錯誤賦碼、語用特征賦碼等。關于語料庫的標注,李文中(2012)指出語料庫學界對于語料庫標注支持和反對的兩種截然不同的態度,不僅反映了語料庫研究中兩種既個性又相輔相成的學術思想(即基于語料庫的研究與語料庫驅動研究),也反映了研究者對待語料庫中語言數據態度和使用路徑的不同,但二者在研究實踐中并不是互相排斥的。他指出對語料庫設計標注或應用標注時,要立足于自己的研究實際。對于本語料庫的應用來說,在設計標注時只考慮對文本的元信息進行標記,以及對中英文進行詞性標注。文本的元信息指的是關于文本的信息,在本語料庫中,在進行元信息標記的時候,采用多數語料庫常用的XML 語言進行標記,主要注明語料來源、景區類別、景區所在地、譯者信息等。為方便進一步的檢索和研究,對英文文本采用免費的CLAWS7 軟件進行計算機自動詞性標注。然而機器自動標注的準確率只能達到96%左右,因此,在完成自動標注后需要對標注后的文本進行人工修正。
(五)語料對齊。相較于單語語料庫,平行語料庫需要進行雙語語料的對齊這一必不可少的步驟。對于語料對齊的問題,目前大部分平行語料庫能普遍能做到的是段落對齊和句子對齊,目前來說,還沒有對齊率達到百分百準確性的對齊軟件,因此,在進行語料對齊時要做到機器對齊和人工對齊相結合的辦法。Paraconc 軟件可以對語料庫中的中英文文本進行粗略的句子對齊,由于旅游文本的翻譯會出現摘譯、擴譯或省譯的情況,所以機器自動對齊軟件在某些句子無法實現一對一的對應,因此會造成對應混亂,這就要求進行人工核查,完成進一步的人工對齊。在人工對齊的時候,一句中文原文有可能譯成一句英文,因此實現一句中文對應一句英文;一句中文原文有可能譯成多句英文,因此實現一句中文對應多句英文;多句中文原文有可能譯成一句英文,因此實現多句中文對應一句英文。
一是研究者可以從旅游文本的漢、英語料的對比研究入手,從文體和功能方面探究二者的差異和共性,發現不同類型的西藏旅游文本及其英譯文本的語言特點,進一步結合翻譯學理論,探討西藏旅游文本外宣翻譯的翻譯策略、翻譯方法及其內在成因,為今后旅游文本的翻譯提供可靠的理論和實踐基礎。二是由于在建庫時嚴格控制入庫語料,所以建設成的西藏旅游外宣漢英平行語料庫可以為譯者提供可靠的翻譯參考,能夠有效地提高旅游文本翻譯的質量,達到良好的外宣效果。三是西藏旅游外宣漢英平行語料庫可以應用與西藏本地高校的旅游翻譯教學。基于該語料庫可以開發數據驅動式(data-driven learning,簡稱DDL)旅游翻譯教學手段。DDL 旅游翻譯教學內容豐富多彩,教學形式也更加多樣化,能夠有效地培養學生主動學習、獨立思考的學習習慣,進一步提高旅游翻譯教學的效果,為培養服務于西藏旅游業的專業人才提供更好的教學方法。
在建設西藏旅游外宣漢英平行語料庫的時候,需要大量的人力物力財力,需要旅游專業人士、翻譯專業人士以及計算機專業人士的共同協作和參與。盡管西藏旅游外宣漢英平行語料庫的建設并非一蹴而就,但可以肯定的是,建成后的語料庫其應用前景廣泛,必將對西藏旅游翻譯和旅游翻譯教學產生積極的影響。
[1] 常寶寶,俞士汶.語料庫技術及其應用[J].外語研究,2009,5:43~51
[2] 李德超,王克非.基于雙語旅游語料庫的DDL 翻譯教學[J].外語電化教學,2011,1:20~26
[3] 李文中.語料庫、學習者語料庫與外語教學[J].外語界,1999,1:51~55
[4] 李文中.平行語料庫設計及對應單位識別[J].當代外語研究,2010,9:22~27
[5] 李文中.語料庫標記與標注:以中國英語語料庫為例[J].外語教學與研究,2012,3:336~345
[6] 譚益蘭.從語篇分析角度研究西藏旅游景點公示語漢英語篇翻譯[J].西藏大學學報(社會科學版),2013,4:57~64
[7] 弋睿仙,賈莉萍.賴斯翻譯批評論在旅游文本翻譯中的應用——以布達拉宮門票漢英翻譯為例[J].牡丹江大學學報,2014,3:125~127
[8] 張健.全球化語境下的外宣翻譯“變通”策略芻議[J].外國語言文學,2013,1:19~27