郭坤榮,史夢嬌(.河北農業大學;.河北金融學院,河北保定 07000)
關聯翻譯理論在茶企簡介翻譯中的實用性
郭坤榮1,史夢嬌2
(1.河北農業大學;2.河北金融學院,河北保定 071000)
茶企簡介是茶企對外展示的一扇窗口,本文基于茶企簡介翻譯提出了一種更有效的關聯翻譯方法。本方法的主要思想是:先找準一組褒貶中性詞庫,然后提取出待測詞與詞庫中基準詞詞匯的極性義原、詞性、其它義原,計算相應的相似度,并分別給出合適的權重值,由此計算出待測詞與基準詞的相似度,最后判斷待測詞的關聯傾向,希望該方法的提出可以進一步加快中國茶企的國際化進程。
關聯翻譯理論;茶企;簡介翻譯
茶企簡介發揮著日益重要的作用。隨著互聯網的飛速發展和普及,借助互聯網技術走向國際領域的茶企越來越多,各大茶企越來越熱衷于在互聯網上標注自己公司簡介,并表達茶企觀點和評論,茶企簡介成為了各大茶企向國際社會展示的名片,也是獲取信息最為重要的一個社交平臺。為此,我們在茶企簡介翻譯實踐中必須對中西方茶企簡介的不同特點加以重視,才能達到理想的交際效果。
語言和文字作為人類特有的用來關聯事物、進行思想交流的工具,這種社會現象是比較特殊的,而自然語言作為人類思想關聯最基本、最直接、最方便的表達工具,無時無刻不充斥在社會的每一個角落。迄今為止,關聯翻譯理論已經有將近50年的發展史了,在漫長的發展過程中,關聯翻譯理論形成了自己特有的理論和方法,形成了一門獨立的學科,有自己特定的科學內容。目前對“關聯翻譯理論”這一術語并沒有嚴格的定義,我們能夠看到的定義基本上是解釋性的,但并不影響我們對它的理解。
語言學家劉涌泉對自然語言的處理概括為:“作為人工智能方向的一個主要內容,關聯翻譯理論主要是借助電子計算機等工具處理包括口語信息及文字信息在內的人類的獨特的信息,并建立各種類型的人-機-人系統。作為它的核心內容,關聯翻譯理論主要是自動識別語音及語符和自動合成語音。”而美國計算機科學家對“關聯翻譯理論”的理解是:關聯翻譯理論是以人-人之間的交流和人-機之間的交流語言為主要目標的一門學科。關聯翻譯理論的目的是要構建出集語言能力及語言應用于一體的數學模型,通過搭建相應的計算框架來實現這樣的語言模型,然后通過提出相對應的方法來逐步完善這一語言模型,最后根據相應的語言模型設計出各種實用系統,并利用相關的評測技術來對這些實用系統進行判斷。
關聯翻譯理論的研究內容比較廣泛,研究方向主要涉及機器翻譯、自動文摘、信息檢索、文檔分類、問答系統、信息過濾、信息抽取、文本挖掘、輿情分析等,研究問題的層次一般主要包括語法學、形態學、語用學及語義學。相比于國外,國內的關聯翻譯理論起步相對較晚,目前的研究也面臨了比較大的困難,一方面,自然語言中存在大量的歧義性,歧義詞法、歧義句法、歧義語義和歧義語用,無論在什么語言單位,歧義性一直是困擾我們的根本問題。因此,針對不同語言單位,如何面向不同的應用目標,研究歧義消解的處理策略和方法,就成為了關聯翻譯理論面臨的核心問題。另一方面,對于一個特定的系統,可能會遇到未知詞匯、未知結構,而隨著社會的發展每一種語言也都在發展變化,新的詞義、新的詞匯、新的詞匯用法、新的句子結構,因此系統必須有良好的容錯能力。
2.1文本預處理
茶企簡介中的中文分詞是關聯翻譯理論的前置過程,簡單地說,中文分詞的任務是要通過計算機系統在中文文本語料中的詞匯及詞匯之間自動添加空格或者是其它的邊界標記。分詞問題看起來比較簡單,實則不然,對研究者來說仍然是個比較巨大的考驗。中文分詞的幾個基本問題是:未登錄詞識別問題、漢語分詞規范問題、歧義切分問題及語料庫的建設問題。中文自動分詞問題被提出后,茶企簡介翻譯譯員提出了很多分詞方法。
2.1.1基于詞典的方法
茶企關聯翻譯中經常回用到正/逆向最大匹配和正/逆向最小匹配方法,顧名思義,前者的基本思想就是字串以ML為長度按照從左至右的順序對字典進行掃描,如果掃描到該字串則對這個字串進行切分,然后將指針往后移動ML個長度繼續掃描,否則以(ML-1)為長度繼續與字典進行匹配。后者基本思想與前者差不多,主要區別在于匹配順序從后面開始執行,通過對簡介中文字的智能匹配能達到很好的翻譯成效。
2.1.2基于語義分析的方法
茶企簡介翻譯中時常會遇到語義不明的情況,針對此類問題,Gao et al.(2005)提出了一種基于語義的中文分詞方法,傳統的分詞方法只是簡單地將機器學習或篇章語言學應用于中文分詞當中,該方法是在分詞的過程中通過句法分析器先對句子的語義及句法進行分析,然后提出一種語用數學框架,在這個框架中詞的切分和生詞類型的檢驗能同時進行,最后,該方法認為中文的分詞標準不是唯一的,而是存在多重標準和不一樣的詞匯粒度。現在,該方法已經應用在微軟的亞洲研究所開發的適應性漢語分詞系統中。
2.1.3基于統計的方法
簡介翻譯同時也是行業內語言轉換的結果,通過建立如Hidden Markov Model、互信息等統計學習模型來提取文本的特征詞,由于在統計的過程中存在著共現率高但對關聯傾向判定沒有意義的詞,所以基于數理統計的方法通常需結合詞典法使用。
2.2詞性標注
茶企簡介翻譯中的詞性也將它定義為詞類,是詞匯基本的語法屬性。當前,我國茶企簡介翻譯面臨著三個方面的難題:一是漢語是一種較特殊的語言,詞的形態變化不多,因此不能通過詞的形態來對詞的類別進行簡單的判斷;二是常用詞兼類嚴重,雖然兼類現象在漢語詞匯中占的比例很小,但由于它的使用頻率較高,兼類現象比較繁多,覆蓋面廣,牽涉到漢語中大多數詞類,因而造成在文本中詞類歧義排除的任務量大,面廣且復雜多樣;三是由于研究人員自身的原因造成的,在詞性劃分的標準及目的等問題上,語言學界仍然存在著分歧。接下來用到的中文詞性標注規范。詞性標注所使用的方法主要包括三種:
基于統計模型的詞性標注方法。I.Marshall(1983)建立的LOB語料庫詞性標注系統CLAWS是基于統計模型的詞性標注方法的典型代表,該系統通過對 n元語法概率的優化統計,實現了133個詞類標注的合理標注,為我國茶企簡介翻譯提供了很好的理論指導。
基于規則的詞性標注方法。作為一種比較早的詞性標注方法,基于規則的詞性標注方法的主要思想是根據兼類詞搭配關系及上下文的語境構建詞類消岐規則。劉開英(2000)依據兼類詞與兼類詞之間的搭配關系構造了詞類識別規則,對于其中存在的動名詞兼類現象,總結出了九條詞性鑒別規則。E.Brill提出了一種基于機器學習的自動獲取規則,它的獲取途徑是大規模的語料庫,該方法為實現茶企簡介翻譯中基于規則的詞性標注系統提供了極大便利。
集統計及規則方法于一體的詞性標注方法。周強(1995)提出了一種集規則方法與統計方法于一體的詞性標注方法,其主要思想是對漢語句子的初始標注結果,先對它們進行規則排岐,將比較常見和明顯的歧義現象排除掉,然后使用統計排岐的方法,對那些剩余的多類詞進行處理及未登錄詞的詞性推理,最后通過人工校對的方式,獲得準確率較高的標注結果。
2.3停用詞處理
傳統的茶企簡介關聯翻譯的主要任務包括詞性標注、自動摘要、句法分析和指代消解等,基本方法主要有兩種,一種是理性主義方法,另一種是經驗主義方法。理性主義方法主張人的很大部分的語言知識是遺傳下來的,是與生俱有的,在具體的自然語言問題研究中,該方法主張建立符號處理系統,由人工整理和編寫初始的語言知識表示體系,構造相應的推理程序,系統根據規則和程序,將自然語言理解為符號結構,在關聯翻譯理論系統中,一般首先根據詞法規則,利用詞法分析器對輸入的句子詞匯進行詞法處理分析,然后語法分析器依據語法規則分析輸入的句子語法結構,最后再將語法結構映射到語義結構(如邏輯表達式、中間語言、語義網絡等)。
實際翻譯茶企簡介中,文本經過分詞處理后會出現一些對詞匯關聯傾向判斷沒有幫助的詞,這些詞就稱為停用詞。停用詞通常有兩類:
(1)虛詞,它們不能獨立地充當句法的成分,意義不是很明確,一般虛詞包括副詞、介詞、連詞、助詞、嘆詞和擬聲詞六類。針對茶企簡介中常見的虛詞,可作、可用經驗主義的方法來翻譯,也是從假定人腦所具有的一些認知能力開始的,它主張通過建立特定的數學模型來學習復雜的語言結構,然后通過模型識別、統計學和機器學等方法來訓練模型的參數,從而擴大語言使用的規模,它是以統計學為基礎建立的,因此我們也將它稱做統計關聯翻譯理論。
(2)雖然在訓練樣本中經常出現,但沒有實際意義,對訓練樣本的關聯傾向判定影響不大。例如某茶企簡介中的“全而無缺,聚而不散,仁德至上”的精辟詮釋,通過關聯翻譯理論,可以先構建一張停用詞表,在分詞處理過程中將得到的結果與停用詞匹配,若匹配成功,就將這個詞去掉,否則就保留下來。
關聯性的大小取決于語境效果與處理努力,對茶企簡介的翻譯具有強大的解釋力和實用性。然而,相比于國外的Twitter、Facebook等社交平臺,茶企簡介關聯翻譯研究的相對較少。用戶發表的評論觀點,一定程度上表達出了用戶對某產品或者是信息資源的態度,同時也表現出強烈的關聯傾向,因此關聯傾向分析便逐漸成為關聯翻譯理論研究的熱點。通過以上關聯翻譯理論對茶企簡介翻譯的分析可以看出,關聯理論給了譯者很大靈活度,同時也是茶企簡介文本關聯分析的基礎和前提,對茶企簡介翻譯實踐具有重要的實用價值。
[1]Ernst-August Gutt.Translation and Relevance:Cognition and Context CM.上海外語教育出版社,2004:106.
[2]程妍.中美茶企簡介體裁對比分析[J].湖北經濟學院學報(人文社會科學版).2012(5):69-71.
[3]何文靜,王春燕.茶企簡介的英譯策略與方法[J].三峽大學學報(人文社會科學版).2012(6):117.
[4]馮克江.論茶企簡介的翻譯[J].語文學刊(外語教育與教學).2010 (8):34-37.
郭坤榮(1980-),女,碩士研究生,講師,研究方向:英語語言文學。