999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于漢法平行語料庫的唐詩語言特征研究

2022-11-04 09:33:00李婷婷
名家名作 2022年15期
關鍵詞:單詞文本

李婷婷

一、引言

唐詩代表了中國古典詩歌的最高成就,是中華文化和世界文化的寶貴財富,體現了中國人民的審美智慧,展現了中國語言文字的魅力。中國古詩詞的魅力深深吸引了國外讀者。早在18世紀,法國來華傳教士杜赫德便在其著作中談到了中國詩歌。19世紀下半葉至今,法國漢學家對于唐詩的翻譯和研究一直從未間斷,其中具有代表性的譯者有德里文、葛戴密、喬治·雅熱等。國內也有很多的翻譯家為唐詩的翻譯傳播做出了巨大貢獻,其中代表性的有徐仲年、梁宗岱、程抱一、許淵沖等。仔細閱讀各種版本的唐詩法譯本,我們可以發現每個譯本的用詞和句子構成都各不相同,存在著差異。但是如果用傳統的翻譯研究方法去研究各個譯本之間的差異,就會缺少定量分析,其分析結果是很難令人信服的。語料庫翻譯學的出現,為研究譯本的翻譯風格指明了一條新的道路。語料庫翻譯學是以語料庫為基礎,借助語言學、文學、文化等方面的理論,對雙語語料的翻譯現象、翻譯方法等進行系統分析的一門科學。

迄今為止,國內暫無專家學者運用語料庫翻譯學的研究方法,將定量分析和定性分析相結合來對唐詩法譯本的譯者風格進行分析和探討。因此,本文擬以許淵沖的《精選唐詩與唐畫》(法漢對照)和喬治·雅熱的《唐詩三百首詩選》(以下簡稱許譯和喬譯)為語料,自建小型唐詩中法文平行語料庫,運用語料庫語言學的研究方法來研究兩個譯本的語言特征。

二、唐詩平行語料庫的創建

(一)語料選擇和收集

筆者首先從許淵沖的《精選唐詩與唐畫》(法漢對照)中選取了10首詩歌的中法文,然后從喬治·雅熱的《唐詩三百首詩選》內找到對應的10首法譯本。第一步,通過OCR軟件對所有語料進行掃描并轉成Word文檔,然后進行人工核對。漢語語料有一個,命名為cn-tangshi;法語語料有兩個,命名為fr1-tangshi和fr2-tangshi,fr1為前綴文件,代表許淵沖譯文,fr2為前綴文件,代表喬治·雅熱譯文。

(二)語料清洗

語料清洗就是指對文本進行除噪處理,即消除文本的內容問題和格式問題,以獲得清潔文本的過程。在對唐詩語料進行降噪處理的過程中,筆者主要以人工校正為主,并輔以MS office Word 2016的內置功能來進行清理。首先,利用MS office Word 2016的法語糾錯功能,查找并修改文本中包括亂碼在內的單詞拼寫錯誤和語法錯誤等。處理完唐詩語料的文本問題之后,接著,筆者便使用MS office Word 2016的內置功能來解決文本的格式問題。語料清洗工作完成之后,將所有已清洗的文本另存為txt文檔,編碼格式設置為UTF-8,來方便進行之后的語料分詞和標注工作。

(三)語料加工

語料加工,即運用合適軟件進行文本分詞和標注處理。所謂分詞,指將一連串的字符轉換成相互分離、容易識別的形符的過程。詞性標注是指根據文本中上下文信息,自動標注文本中所有詞的詞性的過程。研究中,由于漢語和法語文字存在不同的構詞特征,所以筆者對法語語料和漢語語料分別進行了加工處理,主要步驟如下。

1.法語語料加工

由于法語屬于拼音文字,詞與詞之間的界限十分明顯,因此,我們就不需要對法語文本進行分詞處理,只需要進行詞性標注,以便于后續進行法語文本的詞匯密度統計。對于法語文本的詞形標注,筆者主要運用的是Tree tagger軟件來進行。該軟件標注簡單快捷,詞性賦碼標注符合法語詞性劃分的標準,準確率極高。

2.漢語語料加工

漢語語料加工主要涉及兩個操作:漢語文本的分詞和標注處理。在本研究中,筆者使用了國家語委開發的分詞軟件CorpusWordParser來對唐詩原文進行分詞和標注處理。由于詩歌表達結構的特殊性,筆者在使用該軟件進行一鍵分詞和標注之后發現了有些地名和人名沒有被分詞軟件識別,造成了“黃/nh 鶴樓/ns 送/v 孟/a浩然/a 之/u 廣陵/ns”“故人/n 西辭黃鶴樓/ns”“ 姑/n蘇/nhf 城外/nl 寒山寺/ns”中的詞形標注出錯,如“孟浩然”被分開標注且標記為形容詞、“西辭”沒有單獨標記等問題。

3.語料檢索

由于筆者研究的是兩個法譯本的譯者風格,而Paraconc只能實現一對一平行語料的檢索,因此筆者使用了由中國傳媒大學開發的CUC-Paraconc作為檢索軟件,來對唐詩的法漢平行語料進行檢索和分析。CUCParaconc軟件是一款免費共享綠色軟件,最多可實現1對16的平行語料檢索,這一點恰好彌補了Paraconc的不足。但是CUC-Paraconc對原文和譯文的對齊方式要求非常嚴格,必須完全對齊才能實現檢索,因此,語料是否真正實現對齊,通過CUC-Paraconc軟件便可以檢測出來。以《春望》中“春”字的法譯對比分析為例,筆者運用CUC-Paraconc進行了檢索:打開軟件,點擊“一對多平行語料檢索”,進入“加載語料及檢索參數設置”界面,選擇“源文本目錄”及“保存目錄”,將“選擇譯本數”設為2,“文本編碼”設為“Default”,在“檢索和提取”界面的“原文關鍵詞”欄中輸入“春”,檢測結果正常顯示在軟件頁面中,由此可見平行語料庫創建成功。

通過檢索結果可知,筆者所收集的語料中共有5條相匹配的句對,其中每一對應單元的最上面是漢語原文,兩位譯者都在與“春”相關的表述中使用了“printemps”一詞,但是采用不同的表達來翻譯與“春”相關的字眼或者詩句,讓讀者直觀地看到了不同背景譯者的不同處理方式。

三、基于唐詩平行語料庫的語言特征研究

胡開寶教授指出,翻譯語言特征大致分為翻譯語言共性和具體語言對翻譯文本的語言特征兩大類,具體語言對翻譯文本的語言特征主要表現在詞匯、句法等層面。本研究中,筆者主要利用WordSmith 6.0軟件從詞匯和句法兩方面對唐詩的兩個譯本進行語言特征的分析研究。

(一)詞匯特征

詞匯是語言的最小單位。研究譯文的詞匯特征有利于人們更好地了解譯者的用詞特點。譯本的詞匯特征可以利用語料庫分析軟件,通過分析文本的類符/形符比、詞匯密度、平均詞長、詞長分布等相關數據得出。

1.類符/形符比

類符/形符比(STTR),是指文本中不同單詞或漢字的數量與文本內單詞或漢字總數之間的百分比。一般來說,類符/形符比越高,譯者的用詞就越豐富。

根據相關統計數據,唐詩原文的STTR值為88.48,高于許譯本和喬譯本,由此可見,唐詩漢語原文的用詞豐富。許譯本的STTR值為53.68,而喬譯本的STTR值為51.42,這說明許譯本比喬譯本用詞更為豐富,從另一個側面說明喬譯本譯者使用解釋性語言的程度更高。另外,筆者通過對比發現,許譯本和喬譯本的形符數都明顯高于唐詩原文,有趨向顯化的特征,即將唐詩文本中隱含的信息以明確的方式解釋給讀者聽,以方便讀者感受唐詩原文的意境。

2.平均詞長和詞長分布

平均詞長是指一個文本所有單詞的平均長度,這個平均長度反映了文本的整體用詞難易度。詞長標準差是指文本每個單詞與平均詞長的差異,它能反映文本單詞詞長的分布情況。筆者使用WordSmith 6.0軟件得到的平均詞長和詞長標準差結果如表1所示。

表1 平均詞長和詞長標準差統計表

表1結果顯示,喬譯本的詞長標準差為2.44,大于許譯本的2.08,這正好說明喬譯本中單詞詞長差異比較大,說明喬譯本中譯者所用單詞與許譯本相比,難度要更大一些。筆者通過WordSmith 6.0軟件形成的這兩個譯本的詞長分布情況正好驗證了這一點,具體數據見表2。

表2 詞長分布情況統計表

續表

通過表2數據我們可以看到,兩個譯本中使用頻率高的詞匯均為由2個字母構成的單詞,且兩個譯本90%以上的單詞均由1~6個字母組成的單詞構成,這說明兩個譯本譯者均考慮了譯者的受眾群體,傾向于選用較簡單的單詞去翻譯文本,以便讀者能更好地理解詩文內容。

同時,統計數據也顯示出,喬譯本的詞長跨度為1個字母到16個字母單詞,許譯本詞長跨度為1個字母單詞到10個字母單詞。可見,喬譯本詞長跨度明顯大于許譯本。文本詞長與文本閱讀難度成正比,由此可見,許譯本用詞比喬譯本更為簡單,從人類認知規律來看,許譯本更易于被讀者理解,更適合進行詩歌誦讀。

(二)句法特征

譯文句法特征主要體現在譯文的平均句長、平均句段長、各類句式結構的使用頻率上。筆者利用Wordsmith6.0軟件對平均句長及句長標準差的統計結果如表3所示。

表3 平均句長和句長標準差統計表

1.平均句長

平均句長在一定程度上體現了句法結構的復雜程度,體現了總形符數與句子總數之間的比值關系,平均句長越短,說明譯文句子的結構越簡單,句子意思越容易理解。由表3數據來看,筆者所選十首唐詩原文,兩個譯本平均句長明顯高于漢語平均句長,這表明,由于中國詩歌以短小精練、意韻深遠為特點,單個漢字便能體現出深刻的內涵,需要譯者用語言去表達出來,兩個譯者為了較準確傳達出詩歌意義和內涵,均選擇顯化翻譯的方式,通過解釋性語言來盡可能地傳達詩文意思。與此同時,通過表3數據,筆者還發現許譯本的平均句長遠低于喬譯本的平均句長,許譯本是11.31,而喬譯本是16.92,由此可見,喬譯本句子比許譯本句子結構更為復雜。

2.句長標準差

標準差是反映數據分布離散程度的量化形式,句長標準差反映了每個句子長度與文本平均句長的差異。標準差越大,說明文本中句長差異越大。從表3數據可以看出,許譯本的句長標準差為5.72,而喬譯本則為8.17,顯然,喬譯本的標準差明顯大于許譯本,由此可見,喬譯本中句子之間長度差異較大,而許譯本的句長分布相對平穩。

四、結論

筆者在本文中基于自建的小型平行語料庫,利用語料庫相關軟件對兩個不同文化背景的譯者的唐詩譯文的語言特征進行了分析和研究。通過對兩個譯本的詞匯特征和句法特征的分析可以看出,喬譯本的詞匯密度大,用詞更為豐富,譯者以自由體翻譯的方式再現了原文詩歌的意境,符合西方人的語言習慣,適合西方人去閱讀;而許譯本句長標準差明顯低于喬譯本,句長基本保持一致,采用了意譯歸化的策略,譯者在翻譯上更貼近唐詩意境和韻律特點,形式上也顯得更加整齊。通過研究我們也發現,僅靠單一的語言特征的定量分析還不足以完全揭示譯者風格的差異。因此,在以語料庫為基礎進行譯者風格研究時,還需要結合譯者的翻譯觀、譯者所處社會的政治文化等因素,將定性和定量數據相結合,才能全方位了解譯者的風格。

猜你喜歡
單詞文本
What’s This?
Exercise 1
初中群文閱讀的文本選擇及組織
甘肅教育(2020年8期)2020-06-11 06:10:02
單詞連一連
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
看圖填單詞
看完這些單詞的翻譯,整個人都不好了
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
論《柳毅傳》對前代文本的繼承與轉化
人間(2015年20期)2016-01-04 12:47:10
主站蜘蛛池模板: 免费高清毛片| 久久久久人妻一区精品色奶水 | 免费观看三级毛片| 99热这里只有精品在线观看| 国产精品黑色丝袜的老师| 又污又黄又无遮挡网站| 婷婷午夜天| 国产成人免费| 欧美国产在线精品17p| 第九色区aⅴ天堂久久香| 国产色婷婷| 国产一在线| 久久亚洲AⅤ无码精品午夜麻豆| 国产真实自在自线免费精品| 国产欧美日韩另类| 狠狠色丁香婷婷综合| 国产精品部在线观看| aa级毛片毛片免费观看久| 亚洲AⅤ无码日韩AV无码网站| 亚洲欧美另类中文字幕| 国产毛片网站| 少妇精品网站| 波多野结衣在线se| 色网站免费在线观看| 91久久精品国产| 免费一级成人毛片| 凹凸国产分类在线观看| 免费国产黄线在线观看| 人人91人人澡人人妻人人爽| 成人在线欧美| 国内精品视频区在线2021| 亚洲精品亚洲人成在线| 日韩美毛片| 国产精品久久久久久影院| 国产成人精品一区二区三区| 亚洲精品人成网线在线| 国产香蕉97碰碰视频VA碰碰看| 亚洲欧洲日韩综合色天使| 国产精品太粉嫩高中在线观看| 在线日韩日本国产亚洲| 久久网欧美| 永久在线精品免费视频观看| 亚洲精品你懂的| aⅴ免费在线观看| 亚洲国产系列| 久久婷婷国产综合尤物精品| 色综合久久88| 一级毛片高清| 国产成人凹凸视频在线| 高清欧美性猛交XXXX黑人猛交 | 午夜视频免费试看| 欧美精品一二三区| 久久精品亚洲专区| 国产免费人成视频网| 一级片免费网站| 欧洲成人免费视频| 国产一级做美女做受视频| 久草视频精品| 91人妻日韩人妻无码专区精品| 午夜在线不卡| 91久久精品日日躁夜夜躁欧美| 色老头综合网| 丁香婷婷综合激情| 国产区在线观看视频| 国产在线视频二区| 亚洲一区二区三区香蕉| 亚洲日本一本dvd高清| 国产精品丝袜视频| 色婷婷在线影院| 久久香蕉国产线看观| 国产精品页| 四虎成人在线视频| 国产肉感大码AV无码| 思思热精品在线8| 国产美女主播一级成人毛片| 片在线无码观看| 欧美一级在线播放| 四虎成人在线视频| 国产h视频在线观看视频| 亚洲一区二区成人| 久久性视频| 四虎在线观看视频高清无码|