999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于語(yǔ)料庫(kù)的東盟博覽會(huì)翻譯研究

2009-04-29 00:00:00何正國(guó)連建峰史忠志
文教資料 2009年14期

摘 要: 語(yǔ)料庫(kù)不僅為翻譯研究提供了新的工具,而且擴(kuò)展了翻譯的研究范圍,提出了新的研究思路。本文從翻譯語(yǔ)料庫(kù)對(duì)翻譯研究的重要意義入手,重點(diǎn)介紹了基于自建的中國(guó)東盟博覽會(huì)平行語(yǔ)料庫(kù)的翻譯批評(píng)研究, 通過(guò)Antconc、Wordsmith等語(yǔ)料庫(kù)軟件分析得到中文文本和英文文本這兩者的詞頻、字?jǐn)?shù)、詞匯類(lèi)別等信息進(jìn)行雙語(yǔ)間的比較,找出兩種語(yǔ)言文本的差別,以及其中的翻譯現(xiàn)象。作者認(rèn)為基于語(yǔ)料庫(kù)的翻譯批評(píng)方法不僅有助于在整體上比較客觀地把握文本,而且提出了新的研究思路。

關(guān)鍵詞: 東盟博覽會(huì) 平行語(yǔ)料庫(kù) 翻譯批評(píng) 文本

1.引言

許鈞教授曾歸納過(guò)客觀、合理、公允和科學(xué)的四種批評(píng)方法(1992:43-55),也曾旗幟鮮明地倡導(dǎo)“樹(shù)立科學(xué)的批評(píng)精神”(2003:409)。雖然科學(xué)的方法和精神被不斷強(qiáng)調(diào),但迄今為止中國(guó)的翻譯批評(píng)還多用定性批評(píng)方式,以具體數(shù)據(jù)說(shuō)話的批評(píng)仍然不夠。有鑒于此,筆者承擔(dān)了一項(xiàng)研究生創(chuàng)新項(xiàng)目,自建語(yǔ)料庫(kù)對(duì)東盟博覽會(huì)指南的翻譯文本進(jìn)行批評(píng)研究,以具體的數(shù)據(jù)為基礎(chǔ),對(duì)其中的規(guī)律性,尤其某些經(jīng)常為翻譯批評(píng)忽略的特點(diǎn)進(jìn)行探討,以判其得失。本項(xiàng)目掃描《中國(guó)東盟博覽會(huì)指南》(以下簡(jiǎn)稱《東博》)中英文兩個(gè)版本,得到TXT格式純文本。另外還到廣州博覽會(huì)官方網(wǎng)站下載電子文本,用以與《東博》的文本對(duì)比研究。收集好文本后,通過(guò)Antconc、Wordsmith等語(yǔ)料庫(kù)軟件分析得到中文文本和英文文本這兩者的詞頻、字?jǐn)?shù)、詞匯類(lèi)別等信息進(jìn)行雙語(yǔ)間的比較,以期找出兩種語(yǔ)言文本的差別,以及其中的翻譯現(xiàn)象。

2.創(chuàng)建小型的東盟博覽會(huì)平行語(yǔ)料庫(kù)的可行性

語(yǔ)言研究者已經(jīng)可以自行建立中小型語(yǔ)料庫(kù),進(jìn)行與語(yǔ)言相關(guān)的研究,包括翻譯研究。根據(jù)用途,筆者自建的語(yǔ)料庫(kù)規(guī)模不需要很大,因?yàn)檠芯繉?duì)象不是一般的自然語(yǔ)言資源,也就是說(shuō),進(jìn)行翻譯批評(píng)研究的語(yǔ)料庫(kù)是專用語(yǔ)料庫(kù)。同時(shí),與大多數(shù)現(xiàn)有語(yǔ)料庫(kù)不同的是,自建的翻譯語(yǔ)料庫(kù)是平行語(yǔ)料庫(kù),即是把漢英兩種語(yǔ)言中完全對(duì)應(yīng)的文本輸入計(jì)算機(jī),并通過(guò)對(duì)比分析找出兩者的對(duì)應(yīng)關(guān)系。

3.統(tǒng)計(jì)分析所利用的軟件介紹

筆者最初選擇著名的商業(yè)軟件Wordsmith Tools,該軟件是基于Windows平臺(tái)的索引軟件,是大型語(yǔ)料庫(kù)研究的重要軟件。但該軟件價(jià)格不菲,免費(fèi)版只能利用其中有限的一些功能。因此筆者后來(lái)選擇免費(fèi)的Antconc軟件,其是日本早稻田大學(xué)Laurence Anthony博士實(shí)驗(yàn)室研發(fā)的基于Windows XP的多平臺(tái)的語(yǔ)料庫(kù)分析工具包,是目前一個(gè)非常有用的文本分析工具。特別的是,Antconc除具有良好的英文文本分析功能外,也可以分析經(jīng)過(guò)分詞處理的中文文本。需要注意的是,利用Antconc 3.2.1w 2007處理中文文本時(shí),需作以下設(shè)置:1.語(yǔ)言選擇為中文(cp936):2.將經(jīng)過(guò)ICTCLAS軟件作分詞處理過(guò)的文本中的標(biāo)注符號(hào)隱藏。

眾所周知,英文是以詞為單位的,詞和詞之間靠空格隔開(kāi),而中文是以字為單位,句子中所有的字連起來(lái)才能描述一個(gè)意思。把中文的漢字序列切分成有意義的詞,就是中文分詞,或稱為切詞。筆者選用的自動(dòng)分詞和詞性標(biāo)注工具是中國(guó)科學(xué)院計(jì)算機(jī)漢語(yǔ)詞法分析系統(tǒng)ICTCLAS,其中文分詞準(zhǔn)確率高,免去人工分詞耗時(shí)耗力之苦。

4.東盟博覽會(huì)語(yǔ)料庫(kù)在翻譯批評(píng)中的實(shí)際應(yīng)用

筆者的自建語(yǔ)料庫(kù)語(yǔ)料以電子文本形式儲(chǔ)存,并且通過(guò)計(jì)算機(jī)自動(dòng)處理或者人機(jī)互助加工,進(jìn)行詞匯密度,詞頻,句子長(zhǎng)度,搭配模式,特定詞匯的使用,以及使用頻率的比較研究,等等,致力于多維度、多層面的翻譯批評(píng)工作,比如:考察原作和原作者的語(yǔ)言風(fēng)格和模式;考察譯文和譯者的語(yǔ)言風(fēng)格和模式;考察某種原語(yǔ)對(duì)譯文模式的影響;考察不同翻譯家對(duì)相似文本的不同處理和把握;在資料和數(shù)據(jù)充足的條件下,進(jìn)行譯者的認(rèn)知過(guò)程和翻譯策略等問(wèn)題的探索。

4.1詞頻(word frequency)

詞頻指各詞形(word form)在文本中出現(xiàn)的頻數(shù),詞頻統(tǒng)計(jì)是語(yǔ)料庫(kù)分析中一個(gè)基本的統(tǒng)計(jì)手段。詞頻統(tǒng)計(jì)可以用于教材設(shè)計(jì),文本分析和計(jì)算語(yǔ)言學(xué)等,其結(jié)果也可以用于其他更為復(fù)雜的統(tǒng)計(jì)之中。在翻譯研究中使用詞頻統(tǒng)計(jì)對(duì)原文的用詞風(fēng)格,譯文的用詞風(fēng)格乃至文體進(jìn)行研究也有一定的幫助。筆者以《東博》中英兩個(gè)版本比較為例,簡(jiǎn)要介紹自建語(yǔ)料庫(kù)進(jìn)行的詞語(yǔ)分布(parsing)和詞頻統(tǒng)計(jì)的研究。

在該項(xiàng)研究中用到是Edict Virtual Language Center提供的在線 Word Frequency Text Profile。第一步,筆者使用Edict的 profile 3,將《東博》、《廣州博覽會(huì)手冊(cè)》(以下簡(jiǎn)稱《廣博》)譯文粘貼在指定的方框內(nèi),文本分析軟件自動(dòng)將輸入的文本分別與英語(yǔ)中的最常用2000詞表和學(xué)術(shù)詞表作對(duì)比,結(jié)論如下:

(1)文本中分布的總詞數(shù)(total number of words parsed in this text)=5953;

(2)分布在最常用2000詞表中的總詞數(shù)(number of words in the 2000 Most Frequent Word Family List)=3327(55.89%);

(3)分布在學(xué)術(shù)詞表中的總詞數(shù)(number of words in the Academic Word List)=697(11.71%);

(4)不屬于上述兩個(gè)詞表的總詞數(shù)(total number of words not in either list)=1992(33.46%)。

第二步,對(duì)《廣博》譯本進(jìn)行類(lèi)似處理,得出的四項(xiàng)相關(guān)數(shù)據(jù)如下:(1)1047;(2)641(61.22%);(3)136(12.99%);(4)270(25.79%)。

對(duì)照兩個(gè)處理結(jié)果,有一些差異(卡方值為1.02)的項(xiàng)目是第三項(xiàng),據(jù)此基本可以認(rèn)為《廣博》的譯文用詞更學(xué)術(shù)化,行文更書(shū)面化,而《東博》的譯文次之。

筆者采用按照詞的頻率遞減排列列表,并與《紅樓夢(mèng)》回目楊憲益英譯作對(duì)比,見(jiàn)下表:

以上第一列是百分比(%),第二列是頻數(shù),第三列是類(lèi)符(types,指語(yǔ)篇一共有多少個(gè)不同的詞)。限于篇幅,上表僅為原始表格的極小一部分,但僅憑這一部分表格就可以發(fā)現(xiàn)不少問(wèn)題。of在三個(gè)譯文中出現(xiàn)的頻數(shù)差異比較明顯,《廣博》中出現(xiàn)頻率最多,達(dá)到5.3%,這可以證明,《廣博》使用的語(yǔ)言較為復(fù)雜,《東博》次之,《紅樓夢(mèng)》回目楊憲益英譯排最后,因?yàn)闀?shū)面語(yǔ)言或?qū)W術(shù)語(yǔ)言中of出現(xiàn)的頻率一般僅次于the。通過(guò)以上這個(gè)簡(jiǎn)單的例子可以說(shuō)明詞頻表能在一定程度上使研究者從整體把握譯文發(fā)現(xiàn)一些局部的具體分析容易忽視或無(wú)法證明的問(wèn)題。

4.2中英文版本詞頻對(duì)比

詞頻統(tǒng)計(jì)一般可以產(chǎn)生三種詞頻表(wordlist),一種按照詞的字母順序排列(sort alphabetically),一種按照詞的頻率遞減排列(sort most frequent words first),一種按照詞的頻率遞增排列(sort least frequent words first)。這三種詞頻表各有所長(zhǎng),都可能是進(jìn)一步研究所需要的。這里筆者采用第二種列表,見(jiàn)下表:

把兩個(gè)文本用Antconc軟件進(jìn)行統(tǒng)計(jì),Antconc中的詞頻統(tǒng)計(jì)產(chǎn)生了一些有趣數(shù)據(jù),Antconc中出現(xiàn)的有關(guān)這兩個(gè)文本的前100個(gè)出現(xiàn)頻率最高的詞的詞頻(以詞的頻率大小排列)能幫助我們了解文本的大意。在對(duì)以上資料進(jìn)行分析后,從有意義的實(shí)詞中得出結(jié)論,東盟博覽會(huì)發(fā)生于廣西,指南中提供大量的酒店信息,并且時(shí)間(月,日)和地點(diǎn)(VENUE)也是重點(diǎn)信息。

從中英文兩個(gè)版本的詞頻對(duì)比中,可以看到詞匯層面的不對(duì)應(yīng)。對(duì)應(yīng)詞(又稱“對(duì)等詞”)指某一語(yǔ)言中的一個(gè)詞與另一語(yǔ)言中的一個(gè)詞是對(duì)等的,盡管詞形和詞義不完全一致。如日語(yǔ)的“野球”和漢語(yǔ)的“棒球”為對(duì)應(yīng)詞。語(yǔ)料庫(kù)中,“中國(guó)”的對(duì)應(yīng)詞“China”,頻數(shù)就不一樣,這與譯者的翻譯策略有關(guān),可以看出譯者并不追求嚴(yán)格的形式對(duì)應(yīng)。

4.3詞匯類(lèi)別統(tǒng)計(jì)

語(yǔ)言學(xué)并不是語(yǔ)料庫(kù)檢索軟件應(yīng)用的惟一領(lǐng)域,它也可以用于翻譯批評(píng)領(lǐng)域來(lái)分析原語(yǔ)文本和譯入語(yǔ)文本。為進(jìn)一步探討語(yǔ)料庫(kù)檢索軟件在分析翻譯文本中的應(yīng)用,筆者選用《東博》英文版本,對(duì)其文本用Wordsmith軟件統(tǒng)計(jì),它提供了有關(guān)這個(gè)文本的一些簡(jiǎn)略統(tǒng)計(jì)數(shù)字:

在這個(gè)文本中,形符數(shù)(tokens)指語(yǔ)篇一共有多少個(gè)詞。類(lèi)符形符比(type/token ratio)指形符與類(lèi)符的比率,即用詞的變化性。從其字節(jié)數(shù),形符數(shù)和句子數(shù)可以斷言這是個(gè)較短的文本,把其類(lèi)符形符比(17)與標(biāo)準(zhǔn)類(lèi)符形符比數(shù)(29.53)相比較,可以推斷此文本的詞匯變化量為中等程度,因?yàn)閱渭兊男畏麛?shù)和類(lèi)符數(shù)不能反映語(yǔ)篇的本質(zhì)特征,但兩者的比率卻在一定程度上反映了語(yǔ)篇的某種本質(zhì)特征,即用詞的變化性。它的句長(zhǎng)為20.15,與平均句長(zhǎng)35相比,意味著它比一些簡(jiǎn)易文本句子要長(zhǎng)。平均詞長(zhǎng)為5,因而可以推斷這個(gè)文本屬中等難度水平,句子較長(zhǎng),篇幅較短。

6.結(jié)語(yǔ)

從以上的各種分析來(lái)看,《東博》的英文翻譯文本難度適中,語(yǔ)言簡(jiǎn)潔。這種譯本容易閱讀,而又不失嚴(yán)謹(jǐn),對(duì)閱讀者即參展商和參觀者來(lái)說(shuō)是合適的。我們還可以得知,譯者靈活翻譯,不追求嚴(yán)格的形式對(duì)等,使譯文流暢,達(dá)到功能對(duì)等,是一種較好的翻譯。

本項(xiàng)目研究只是小范圍、試驗(yàn)性的嘗試,但是可以看到,自建語(yǔ)料庫(kù)進(jìn)行研究,有助于客觀地分析原著和譯者的風(fēng)格,也有助于原文與譯文的對(duì)比分析,能為翻譯批評(píng)提供可靠的量化依據(jù),能比較令人信服地說(shuō)明問(wèn)題。但是該翻譯批評(píng)研究還有不少問(wèn)題需要進(jìn)一步探討和探索。比如對(duì)索引軟件的功能有限。此外,在語(yǔ)法結(jié)構(gòu),語(yǔ)言外的因素研究尚差強(qiáng)人意,我們不能讓語(yǔ)料庫(kù)的優(yōu)越性擋住了眼睛,看不見(jiàn)在翻譯研究中質(zhì)的分析往往比數(shù)量的分析更加重要(廖七一,2000:384)。

參考文獻(xiàn):

[1]卡特福德著.穆雷譯翻譯的語(yǔ)言學(xué)理論[M].北京:旅游出版社,1991.

[2]廖七一.語(yǔ)料庫(kù)與翻譯研究[J].外語(yǔ)教學(xué)與研究,2000,(9):380-384.

[3]許鈞.文學(xué)翻譯批評(píng)研究[M].南京:譯林出版社,1992.

[4]許鈞.翻譯論[M].武漢:湖北教育出版社,2003.

[5]肖維青.自建語(yǔ)料庫(kù)與翻譯批評(píng)[J].外語(yǔ)研究,2005,(4).

本文屬于廣西大學(xué)研究生科研創(chuàng)新項(xiàng)目(項(xiàng)目編號(hào):)2008105930502M101

主站蜘蛛池模板: 欧美精品黑人粗大| 日日拍夜夜操| 久久男人视频| 国产毛片高清一级国语 | 日韩高清中文字幕| 91福利免费| 2021无码专区人妻系列日韩| 久久6免费视频| 久久香蕉国产线看精品| 亚洲五月激情网| 欧美在线伊人| 凹凸国产熟女精品视频| 怡红院美国分院一区二区| 亚洲无线一二三四区男男| 国产精品网址你懂的| 999精品在线视频| 亚洲欧美日本国产综合在线| 伊人天堂网| 又爽又大又光又色的午夜视频| 波多野结衣一区二区三视频 | 国产国拍精品视频免费看 | 老司机精品一区在线视频| 国产福利拍拍拍| 欧美区一区二区三| 久久亚洲欧美综合| 午夜日韩久久影院| 亚洲第一av网站| 欧美午夜网| 无码国产偷倩在线播放老年人| 国产福利观看| 国模沟沟一区二区三区| 日韩区欧美区| 亚洲男人在线天堂| 热re99久久精品国99热| 午夜毛片免费观看视频 | 国产精彩视频在线观看| 久久黄色影院| 国产91线观看| 免费视频在线2021入口| 日本一区二区不卡视频| 又粗又硬又大又爽免费视频播放| 久久性妇女精品免费| 真实国产精品vr专区| 国产精品99在线观看| 免费看久久精品99| 亚洲最大看欧美片网站地址| 中美日韩在线网免费毛片视频| 亚洲天堂在线免费| 国产国拍精品视频免费看| 国产激情影院| 激情综合网激情综合| 日韩毛片基地| 免费看美女毛片| 国产超薄肉色丝袜网站| 夜夜操国产| a亚洲视频| 国产欧美日韩va另类在线播放| 国产黄在线观看| 一级爱做片免费观看久久| 亚洲国产一区在线观看| 中国国产一级毛片| 国产成人久久综合一区| 永久免费av网站可以直接看的 | 国产成在线观看免费视频| 亚洲视频黄| 精品无码一区二区在线观看| 91精品专区国产盗摄| 亚洲国产亚洲综合在线尤物| 欧美a在线看| 国产麻豆另类AV| 色婷婷视频在线| 国产91色在线| 国产va在线观看免费| 国产亚洲精品自在久久不卡| 天天摸夜夜操| 精品午夜国产福利观看| 五月天福利视频| 91九色最新地址| 亚洲αv毛片| 久久亚洲黄色视频| 久久精品aⅴ无码中文字幕| 亚洲中文字幕av无码区|