李毅鵬
(東莞職業技術學院 應用外語系,廣東 東莞523808)
雙語平行語料庫與詞語“假的”的翻譯研究
李毅鵬
(東莞職業技術學院 應用外語系,廣東 東莞523808)
從語料庫出現到現在已經有數十年歷史,許多學者運用其進行各種語言學或翻譯學領域的研究,并創立了語料庫翻譯學。在各種語料庫中,對翻譯研究貢獻最大的是已有二十多年歷史的雙語平行語料庫。隨著社會的發展,中文詞語“假的”的使用頻率大幅上升。文章將使用一個自建綜合類雙語平行語料庫對中文常用詞匯“假的”的翻譯情況進行調查。
假的;語料庫翻譯研究;雙語平行語料庫
著名翻譯學者Mona Baker于1993年發表的《語料庫語言學與翻譯研究:啟示與應用》(CorpusLinguisticsandTranslationStudies:ImplicationsandApplication)正式揭開了翻譯學和語料庫結合的序幕。自此之后,語料庫在翻譯研究中的地位得到顯著提高,越來越多的學者開始關注語料庫,并運用語料庫對某些翻譯原則和現象進行研究,如,翻譯的過程、共性、轉換與規范、翻譯痕跡等。語料庫在翻譯規范和翻譯普遍性這兩個譯學研究方向中發揮的作用最大。語料庫和翻譯研究的結合產生了“一種連貫、綜合和豐富的研究范式,涉及翻譯理論、描寫和實踐等方面的諸多問題,已成為當代描述翻譯研究中的一種新范式?!保?](P474)
隨著社會的發展,尤其是層出不窮的假冒偽劣產品的出現,中文詞匯“假的”已經成為現實生活和網絡世界的一個非常熱門的詞匯。據相關的漢語語料庫統計,2011年和2010年中,“假的”一詞在新聞稿出現的頻率遠比2009年高。但中文“假的”一詞有許多對應的英語單詞,許多譯者在譯稿中遇到它時都難以準確把握應該使用哪一個,大多依賴于查詢詞典和網絡資源來尋找對應的單詞,但從總體上分析,“假的”一詞翻譯的準確度并不高。針對此情況,本文將利用一個自建綜合雙語平行語料庫評估中文“假的”的翻譯情況,并對某些翻譯進行分析。
此語料庫屬于雙向雙語平行語料庫,在建設前,筆者已經對整個建設過程進行了詳細的探討、論證和咨詢,解決了一系列將影響語料庫質量和使用的關鍵性問題,目前,此語料庫已完成建設并投入使用。同時,建庫人員將按照實際要求對語料庫進行周期性的維護、更新數據和擴大規模。
此語料庫是綜合語料類型,語料分為兩大類:文學和非文學,其中文學語料占總量30%;非文學占70%。文學類主要是小說和散文;非文學類涵蓋商務、金融、科技、政治和工作報告等領域。所有語料主要來源于書本、公開出版的學術刊物和認可的網上資源。在代表性問題上,嚴格執行了Biber等人提出的“比例取樣”要求。
建設人員對每段收集來的語料的翻譯情況都根據奈達的“對等”理論進行了翻譯質量評估,符合要求的才被允許收錄。在預處理階段,所有入庫語料都經過格式轉換處理至純文本格式,統一以“語言_主題_類別_長度_來源_采集時間”命名,并采用結構標記采用<a></a>標記完整句子和<b></b>標記完整段落。在語料對齊階段,我們采用winalign軟件,主要以自動對齊為主,人工對齊為輔。建庫人員對經過軟件對齊的每一段語料對進行評估和校對,對于對齊精確率欠佳的語料對,將重新將其進行對齊,再導出收錄。
語料標注是大多數語料庫建設中,不可缺少的一個環節。生語料庫(所含的語料未經標注)在翻譯領域和語言學領域所能發揮的作用有限。語料標注主要分為兩種:詞性標注和句法標注。本語料庫主要采用漢語詞法分析系統(ICTCLAS)對所有中文語料進行詞性標注,精確率可達90%以上。對于系統自動完成的標注,建庫人員對其抽樣進行評估和校對,對于有誤的標注,將對照權威字典對其進行糾正。
我們采用ParaConc軟件對“假的”進行檢索和提取,發現有391條檢索結果,對應的英文翻譯一共有13種(按始字母順序排列):artificial,bogus,counterfeit,fallacious,false,fake,feigned,forged,mock,phony,sham,spurious,unreal。初步發現,在不同領域,它們各自的出現頻率有很大差異。
我們選取最具行業代表性且翻譯完全符合“對等”理論的譯文作為典型譯文列舉出來,并主要根據各單詞使用概率對譯文進行分析。
The regulators assert the bank had conducted fraud,using phony loans,phantom deposits and false accounting,starting a decade ago.
監管機構斷言,銀行在十年以前已經開始利用假的貸款、存款和賬行騙。
The improved Internet Explorer 7alerts you when you're visitingone of those fake banks or eBay Web sites(phishing scams).
改善了的探索者7瀏覽器會提醒您正在訪問那些假的銀行網站或易趣網站(釣魚欺騙網站)。
A Texas resident clicked on the link in the message,which took her to a counterfeit eBay site where she entered personal information.
一個得克薩斯州居民點擊了在留言中一個假的易趣網連接,在假網站中,她輸入了個人信息。
商務領域中,“假的”共出現96次,對應英文單詞出現頻率:artificial:5% ,bogus:1%,counterfeit:10%,fallacious:3%,false:41%,fake:21%,feigned:4%,forged:2%,mock:5%,phony:3%,sham:3%,spurious:1%,unreal:1%。
The report issued last month said officials were concerned counterfeiting could grow as computer use gains popularity,they note,counterfeiters can easily email prototypes of fake bills within seconds.
上月報告稱,政府人員關注隨著電腦的普及造假有所上升的現象,他們注意到造假人員可輕易地在數秒之內將假的鈔票原圖通過電郵發出。
The Coast Bank supplied US currency to overseas banks and businesses.The official working for it became publicity-shy after media reports of counterfeit$100bills traveling the globe.
海岸銀行向海外銀行和公司提供美國貨幣,在媒體暴出假的一百美元周游全球后,就職于該銀行的高官就不愿在公開場合露面了。
You might think that it would be easy to make a phony financial report.Many people have tried,but they failed.
你也許會認為造出假的財務報告很容易。許多人做過嘗試,但他們失敗了。
金融領域中,“假的”共出現83次,對應英文單詞有7個,出現頻率:bogus:7%,counterfeit:12%,false:27%,fake:32%,feigned:3%,phony:13%,unreal:15%。
Stealth technology is hardly a sham.
隱形技術絕不是假的。
A spurious electronic signal caused by a brief,unwanted surge of electric power.
假信號由一種多余的短暫電力增加引起的一種假的電子信號。
Some residents say they decline to use a web if they don't like its regulations,while some provide false information if they are uncomfortable with the regulations.
一些居民稱,如果他們不喜歡一個網站的規定,就會拒絕使用該網站;然而,另一些稱,如果他們對規定感到不舒服,他們會提供假的信息。
科技領域中,“假的”共出現69次,對應英文單詞有10個,出現頻率:artificial:15%,bogus:3%,counterfeit:3%,false:33%,fake:21%,feigned:3%,mock:2%,phony:2%,spurious:2%,unreal:16%。
It did not mean he had no experience with the law——his criminal records included robbery,resisting arrest,using false identification.
這并不意味他從來沒有跟法律接觸過——他的犯罪紀錄,包括:搶劫、拘捕和使用假身份證。
In July,he accused James of using and selling phony documents.
在七月,他起訴了詹姆斯使用和出售賣假文件。
We regulate all the researches which yield some bogus questions about authenticity and impartiality.
我們規范所有將產生真實性和公平性假問題的研究。
法律領域中,“假的”共出現75次,對應英文單詞有10個,出現頻率:artificial:5%,bogus:3%,counterfeit:13%,fallacious:3%,false:32%,fake:29%,phony:2%,spurious:3%,unreal:10%。
Sham is sham and the mask must be stripped off.
假的就是假的,偽裝應當剝去。
He got angry and asked Pig to bring Boy down from the tree;he ordered Monkey to carry the Boy on his Back.As they started to go,Red Boy jumped into mid-air,leavinga false Red Boy for Monkey to carry.
唐僧動怒,要八戒將紅孩兒救下,并要悟空背上紅孩兒走時,悟空背的只是個假的,紅孩兒真身早已跳到九霄云外。
“Come,dear ones,”said Morrel,“let us go and see,and heaven have pity upon us if it be false intelligence!.”
“來,親愛的孩子們,”莫雷爾說,“我們去看看,假如這個消息是假的,愿蒼天可憐我們?!?/p>
文學領域中,“假的”共出現68次,對應英文單詞有12個,出現頻率:artificial:6%,bogus:3%,counterfeit:6%,fallacious:12%,false:22%,fake:19%,feigned:3%,mock:3%,phony:3%,sham:3%,spurious:9%,unreal:11%。
在整個綜合雙語平行語料庫中,false和fake出現的概率非常接近且遠高于其他11個單詞。在不同領域里,每個單詞出現的頻率有很大變化,尤其是在特定領域里,個別單詞使用頻率出現驟升情況。為了確保研究結果準確無誤,我們依據奈達的“等值”理論對這391條結果進行逐一復查,發現全部翻譯準確無誤,結果有效。為了進一步驗證研究結果的可靠性,我們將這13個英文單詞輸入到美國楊百翰大學的現代美國英語語料庫進行詞頻檢測,發現false和fake兩者在現代美國英語中出現的頻率非常接近,而且遠遠高于其他11個單詞,這不僅說明筆者以上的研究結果可靠可信,同時表明此自建綜合雙語平行語料庫的可信度非常高。
隨著社會的變化發展,“假的”在各種文體中出現的頻率較以前大幅提高。雖然中英文存在較大的差異,但通過對這個中型自建綜合雙語平行語料庫進行檢索、統計和分析,發現其對應的英文單詞的范圍和使用頻率有一定的規律。這種利用雙語平行語料對具體翻譯問題進行研究的方法,為翻譯研究、翻譯實踐和翻譯教學提供了大量寶貴的真實范例與統計數據,大大地促進了整個翻譯領域的發展。以上研究成果望能給正使用語料庫研究翻譯具體問題的人員提供一點啟發,基于語料庫研究翻譯的方法在未來仍將大放光芒。
[1]Laviosa S.Corpus-based Translation Studies[M].Amsterdam & New York:Rodopi,1998.
李毅鵬(1985-),男,東莞職業技術學院應用外語系講師,碩士研究生,主要從事語料庫翻譯學、計算機輔助翻譯研究。