999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于英語新疆游記的新疆風景語料庫建設

2022-01-01 06:35:10
科教導刊·電子版 2021年13期
關鍵詞:新疆記憶文本

龍 澄 董 伊

([1]新疆大學旅游學院 新疆·烏魯木齊 830046;[2]新疆大學外國語學院 新疆·烏魯木齊 830046)

1 研究背景

長期以來,新疆旅游從業人員在對外推廣旅游產品時面臨著缺乏參考資料的問題。當雙語導游用英語撰寫導游詞時,唯一的參考為謝旭升的《英語妙語說新疆——英語導游手冊》一書。除此之外,他們只能在網上搜尋英語使用者在旅行后寫的游記。景區導覽詞的英文翻譯也缺乏參考資料。相關管理者通常會把語言團隊審好的中文導游詞交與翻譯人員或翻譯引擎,以得到逐字逐句的翻譯。目前旅游外宣資料的英譯本還存在諸多問題,有的譯文甚至錯誤百出,損害了新疆的對外形象。部分譯者為了忠實原文,未考慮譯文能否被目標語讀者接受,譯文缺乏溝通性,其傳播效果不佳。

由于英語讀者對旅游譯本的期待與本國讀者不同,漢英篇章的敘述視角、風格也存在一定差異,例如:英語主語突出,漢語主題突出;英語常用無靈主語,漢語多用有靈主語;英語敘述多呈靜態;漢語敘述多呈動態;英語組句多焦點透視,句式呈樹式結構,漢語組句多散點透視,句式呈竹式。隨著中英比較研究的深入,翻譯界目前的共識是:景區導覽詞的外譯在保證功能對等的情況下更適合編譯,即以目標語受眾思維習慣為準對宣傳文本進行改寫。在改寫的過程中,譯者必須熟諳用英語表達的習慣,所生成的文本需具有和漢語導覽詞、導游詞相匹配的文學美感。提文學美感最好方法就是精讀、模仿主題相似的高質量英語文段。因此,為景區導覽詞、導游詞英譯人員提供體裁、主題、甚至描寫對象相同、相似的文本作參考對提高譯文質量是有一定輔助性的。然而,為譯好一篇景區介紹而從眾多原文書籍中尋出話題相同的英文原文參考句是非常耗時的。針對這一問題,我們設計研發了基于YiCAT協同翻譯系統的新疆風景漢英語料庫。翻譯從業人員在使用YiCAT翻譯協同系統將新疆風景類景區導覽詞、導游詞譯成英文的時候,可以從TMX語料商城獲得并調用該語料庫;在進行譯后編輯的時候,他們除了可以獲得機器翻譯的結果,還可以獲得與每一句漢語原文相對應的、且話題、描寫對象相似、相同的若干英語參考句,以便對機譯結果做譯后編輯和潤飾。

2 語料庫的創建

本課題擬構建的屬于單項對應平行語料庫(uni-directional parallel corpus),即由英語文本和將其譯成漢語的文本構成的平行語料庫,即語料庫中的所有漢語語料都是由英語文本翻譯而成的。該庫的創建共分為如下七個步驟:

(1)源語料的選擇:本研究選取的語料為英語新疆游記,即西方國家人士游歷新疆或中亞地區時用英語寫成的游記。由于中亞地貌具有相似性,因此上述游記中與新疆相似的中亞地貌、景色的書寫也在研究范圍內。東方學興起于19世紀末,因此西方人士來疆考察主要集中在19世紀末和20世紀初,且以英國人為主。在這些游記中,有一部分屬于考古調查報告,較少涉及地貌、景色描寫,如斯坦因的著作(Aurel Stein)。相比之下,類似登山家埃里克西普頓和其妻子戴安娜西普頓(Eric Shipton and Diana Shipton)的著作包含最多的地貌、景色描寫。本研究選擇的游記包括:The Antique Land(《古老的土地》)、The Six Mountain-Travel Books(《登山六記》)、The Duab of Turkestan(《突厥斯坦杜阿卜地區游記》)、Turkestan Solo.One Woman's Expedition from Tien Shan to the Kizil Kum(《女獨探突厥斯坦:從天山到克孜庫姆》)、Sand-buried Ruins of Khotan(《沙埋和田廢址記》)、That Untraveled World(《人跡罕至的世界》)、Chinese Turkestan(《中國的突厥斯坦》)、Through Asia(《穿越亞洲》)、和《外交官夫人的回憶》10本書為研究對象。

(2)語料電子化:語料的來源主要為書籍等印刷制品和電子書。印刷制品的文字轉寫工作如果由純人工完成需要花費大量的時間,本研究采用了一種比較高效的方法:全能掃描王高清掃描、OCR字體識別、進行格式及文字校對。經試驗,OCR軟件字體識別的正確率可以達到95%以上,可以大大提高印刷制品的文字轉寫效率。網絡文本主要涉及文字校對與格式整理,相對而言比較簡單。

(3)電子化語料的分類:從所有游記中挑選出描寫景色的篇章,之后按照題材將其分為九中類:沙漠、戈壁、湖泊、草原、冰山、綠洲農田、城市、河流、山谷(山區森林或灌木)。

(4)將選段譯成漢語。

(5)以句為單位將雙語文本對齊:語料對齊指將源語語料與譯語語料分別保存,并使兩個文本中的語料按段與段或句與句的關系一一對齊。由于英漢語言在表達、句式方面的差異,實際的翻譯過程中并非全部以句為單位。所以本研究首先由人工通過Word工具完成段與段對齊的工作,進一步通過TMXmall網站對齊軟件粗略達到句與句對齊,再由人工審查,最終達到句子層級的對齊。將對齊的語料輸出語言方向為漢譯英的tmx文檔,命名為“新疆風景漢英語料庫”。該語料庫庫容16萬字,所收集到的新疆漢英雙語風景語料中大多為南疆邊境山區,其中沙漠、冰川、山谷三類所占的比重超過65%,而城市、綠洲、河流等類別語料占比較少。

(6)語料輸入和測試:進入到TMXmall網站YiCAT界面,將語料導入到記憶庫中;在項目管理中創建翻譯項目,選擇一篇中文新疆導游詞為譯后編輯對象,目標導游詞共8篇,話題別分涉及喀納斯、喀什古城、澤普金胡楊林、吐魯番葡萄溝、天山天池、交河故城、烏魯木齊國際大巴扎和那拉提草原;選擇騰訊翻譯君進行預翻譯,選擇調用“新疆風景漢英語料庫”為記憶庫,匹配率設置為8%以上;進入譯后編輯界面,得到一個包含漢語源文本—預翻譯文本—記憶庫文本的界面以便編輯,其中,一句漢語源文本對應一句預翻譯文本以及若干條出自記憶庫的相似句以供參考;研究成員對各源文本—預翻譯文本—記憶庫文本項目進行評查。

(7)將“新疆風景漢英記憶庫”上傳至TMXmall語料商城,供用戶使用。

3 風景語料庫的測試結果

例1:在翻譯喀納斯導游詞的過程中,源文本為:“四周群山環抱、峰巒疊嶂、森林密布、草場繁茂,碧水藍天、青山白云、雪嶺草甸渾然一體,湖光山色美不勝收,”預翻譯結果為“Surrounded by mountains,stacked peaks,dense forests,lush grasslands,clear water and blue sky,green mountains,white clouds,snow-capped meadows,lakes and mountains are incomparably beautiful.”一條匹配率為14%的記憶庫參考句為:“The mountains are coloured here on a grand scale,one of them being quite purple,with patches of luscious green grass kept fresh by water trickling from large strips of white snow.”(群山色彩斑斕,其中一座色澤偏紫,大片雪化成了水滴,滋潤著甘美綠地。)

例2:在翻譯天山天池導游詞的過程中,源文本為“全球第三次氣候轉冷,天山山區孕育了頗為壯觀的山谷冰川運動,冰川挾帶著礫石緩慢下移,巨大的冰川像一把巨鏟對山體進行著強烈的挫磨和雕鑿,形成了多種冰蝕地形,山谷成為巨大的凹地冰窖,冰舌前端則因擠壓而消融,融水下泄,所挾帶的巖屑礫石逐漸停積下來,成為橫攔谷地的冰磧巨垅;隨著氣候的轉暖,冰川消退,四周雪峰上不斷消融的雪水在這里蓄水成湖,形成了我們今天看到的天池,天池北岸的天然堤壩就是一條冰磧垅。”其預翻譯為“the climate turned cold for the third time in the world,and the Tianshan Mountains gave birth to a spectacular valley glacier movement.The glaciers slowly moved down with gravel,and the huge glaciers were like a giant shovel to strongly grind and carve the mountains,forming a variety of ice erosion land forms.The valley became a huge concave ice cellar,and the front end of the ice tongue melted due to compression,melted water,and the debris gravel gradually stopped to accumulate.Become a huge moraine ridge across the valley.As the climate warms up and the glaciers recede,the melting snow water on the surrounding snow peaks forms a lake here,forming the Tianchi we see today,and the natural dam on the north bank of Tianchi is a moraine ridge.”一條匹配率為10%下的記憶庫參考句為:“The lakes follow each other,strung together like a chaplet,with great glaciers stretching down to their very waters,like a Greenland landscape.Among them,two glaciers face each other and almost join,their steep black moraines overhanging a lake of unimaginable turquoise-green,in which the shimmering outlines of the glacier are mirrored.”(湖泊彼此相連,像花環般串聯。巨大的冰川一直延伸到它們的水域,就像格陵蘭島的風景。其中,兩座冰川幾欲相融,陡峭的黑色冰川突顯在一個難以想象的青綠色湖泊之上,冰川閃閃發光的輪廓在湖面上映襯著。)

例3:在翻譯烏魯木齊國際大巴扎導游詞的過程中,源文本為“大巴扎由六個樓群組成。在建筑風格上,準確使用最本質、最有生命力的因素,采用土黃色為主色調,融合了希臘、古羅馬、西亞、中亞建筑因素,使之成為烏魯木齊的標志性建筑之一。”其預翻譯為:“The Grand Bazaar consists of six buildings.In terms of architectural style,it accurately uses the most essential and the most vital factors,using earthen yellow as the main color and integrating the architectural factors of Greece,ancient Rome,West Asia and Central Asia,making it one of the landmark buildings of Urumqi.”一條匹配率為10%下的記憶庫參考句為:“A glorious sunshine,pouring through the shaky tattered awnings that connect the houses and shops flanking the street,gave brilliancy to all the gaudy wares exhibited in the booths from which I selected mementoes.The old skill of the Khotan workmen still shows its elfin the quaint articles of dress which form a prominent feature of the Bazar stores.”(街道兩側的房屋和商店搭著昔日舊遮陽篷,燦爛的陽光從篷中傾瀉而下,把我挑選紀念品所在的貨攤上陳列的各種艷麗商品都照得閃閃發光,和田工匠古老的技藝仍然體現在古色古香的服飾上,構成了巴扎商店的顯著特征。)

例4:在翻譯喀什古城導游詞的過程中,源文本為:“著名的艾提尕爾清真寺周圍輻射狀街巷上,密布著國營商店和個體手工業店鋪與攤販,經銷著國內外的名貴商品。”其預翻譯經過去誤編輯后為“The radiation-shaped(誤;應為wheel-shaped)streets and alleys around the famous Attila(誤;應為Id Kah)Mosque are dotted with state-owned shops and self-employed handicraft shops and vendors,selling valuable goods at home and abroad.”一條匹配率為 10%下的機譯庫參考句為“Mosques are more elaborate,with wooden pillars and latticed windows carved to make the whole building cleaner and more majestic.”(清真寺更是精心修建,木制的柱子和格子窗欞精雕細琢,襯托地整個建筑愈發干凈雄偉。)

4 討論及意義

(1)經過逐句對比機器預翻譯結果和記憶庫參考句,不難發現,機器所使用的的詞匯和句型的多樣性比后者要低,且存在誤譯。(2)記憶庫參考句多為焦點透視,即第一人稱常人視角,而機譯結果則遵循漢語,多采用散點透視,即第三人稱上帝視角。(3)而由于語料庫庫容有限,描寫對象為人文景觀的參考句的匹配度比對象為自然景觀的低,因此參考價值也低。這說明,譯者在編譯漢語新疆風景類景區導覽詞、導游詞的時候,可以從參考句中獲得更為準確的詞匯和更為豐富的句型,也可以考慮將散點透視切換為焦點透視。

猜你喜歡
新疆記憶文本
在新疆(四首)
四川文學(2021年4期)2021-07-22 07:11:54
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
記憶中的他們
兒時的記憶(四)
兒時的記憶(四)
記憶翻新
海外文摘(2016年4期)2016-04-15 22:28:55
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
新疆多怪
絲綢之路(2014年9期)2015-01-22 04:24:46
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 亚洲国产日韩欧美在线| 无码国产伊人| AⅤ色综合久久天堂AV色综合 | 欧美成人精品一级在线观看| 99久久精品国产综合婷婷| 一级毛片免费观看不卡视频| 亚洲中文字幕97久久精品少妇| 国产精品污污在线观看网站| 亚洲精品不卡午夜精品| 中文字幕永久在线观看| 伊人91视频| 国产亚洲视频在线观看| 成年人视频一区二区| 人妻无码中文字幕一区二区三区| 免费毛片全部不收费的| 91在线播放国产| av一区二区无码在线| 国产特级毛片| 亚洲欧美日本国产综合在线| 日韩a在线观看免费观看| 亚洲欧美日本国产综合在线 | 亚洲 日韩 激情 无码 中出| 五月婷婷精品| 亚洲女同欧美在线| 免费va国产在线观看| 亚洲人成网18禁| 麻豆精品国产自产在线| 在线播放精品一区二区啪视频| 亚洲男人天堂久久| 三级欧美在线| 中文国产成人久久精品小说| 国产成人福利在线| 亚洲精品无码在线播放网站| 亚洲天堂免费在线视频| 亚洲精选无码久久久| 亚洲一区二区精品无码久久久| 青草91视频免费观看| 日韩精品高清自在线| 国产精品永久在线| 国产免费怡红院视频| www.av男人.com| 国产视频一二三区| 在线观看的黄网| 精品国产欧美精品v| 手机在线免费毛片| 国产免费久久精品99re不卡 | 欧洲亚洲欧美国产日本高清| 亚洲欧美色中文字幕| 999精品免费视频| 婷婷开心中文字幕| 免费在线色| 国内丰满少妇猛烈精品播| 国产精品lululu在线观看| 国产成人8x视频一区二区| 青青操视频免费观看| 极品私人尤物在线精品首页| 农村乱人伦一区二区| 欧美一级色视频| 99ri国产在线| 免费xxxxx在线观看网站| 亚洲国产欧美自拍| 欧美不卡视频一区发布| 日韩在线播放中文字幕| 伊人激情久久综合中文字幕| 91亚洲视频下载| 欧美成人精品一区二区| 欧美成人第一页| 亚洲福利一区二区三区| 男人的天堂久久精品激情| 国产丝袜第一页| 2021国产精品自产拍在线| 亚洲二区视频| 亚洲无线视频| 国产免费久久精品99re丫丫一| 亚洲一级毛片免费观看| 中国一级毛片免费观看| 精品国产三级在线观看| 欧美精品v欧洲精品| 99热这里只有精品免费| 免费高清毛片| 中文字幕 欧美日韩| 亚洲一区黄色|