鄭 茜 王 鈐 王明樹
(四川外國語大學,重慶 400031)
描寫性翻譯研究擺脫了傳統譯學研究的規約性本質,主張翻譯研究的實證性特點,通過對翻譯現象進行描寫,總結出普遍性的規則,進而對翻譯現象進行解釋。語料庫語言學是“以語料庫為基礎的語言研究方法”[1],旨在“揭示隱含的普遍規律”[2]。隨著語料庫語言學進入翻譯研究,“數據驅動的定量分析方法”[3]與描寫性翻譯研究不謀而合,逐漸形成了新興的“語料庫翻譯學”。
語料庫翻譯學以語言學理論和翻譯理論為指導,借助概率和統計手段,圍繞雙語真實語料進行歷時或共時的翻譯研究。[4]Mona Baker教授在1993年發表的文章CorpuslinguisticsandTranslationStudies:ImplicationsandApplications,標志著語料庫研究范式正式進入譯學研究。[5]111隨后眾多國內外學者開始圍繞這一話題進行探討,引起了一波熱潮。本文借助文獻計量工具CiteSpace(引文空間)對1996—2020年發表在國內核心期刊上的文獻進行科學圖譜的可視化分析,以發現國內語料庫翻譯學研究在核心研究圈的研究現狀、熱點話題、關注重點和存在的問題等,進而提出相關建議。
本文的研究工具為美國德雷塞爾大學知識可視化與科學發現聯合研究所的陳超美博士開發的CiteSpace軟件。“CiteSpace是應用Java語言開發的一款信息可視化軟件,它主要基于共引分析理論(co-citation)和尋徑網絡算法(pathFinder)等,對特定領域文獻(集合)進行計量,以探尋出學科領域演化的關鍵路徑及其知識拐點,并通過一系列可視化圖譜的繪制來形成對學科演化潛在動力機制的分析和學科發展前沿的探測。”[6]244
本文所用數據為發表在國內核心期刊上與語料庫翻譯有關的論文。借助中國知網的高級檢索功能,輸入關鍵詞“語料庫”,并含“翻譯”,選擇期刊來源為SCI、核心期刊、CSSCI,檢索獲得1215條結果。因其中包含眾多不符合條件的文獻,將其手動剔除,獲得659條有效文獻。檢索結果中第一篇與語料庫翻譯相關的文獻起始時間為1996年,因而將本文研究的時間跨度限定為1996—2020年。
首先將從中國知網下載的659條數據進行年發文量的大致分析以觀察國內語料庫研究的走勢。然后將數據導入CiteSpace轉換為符合該軟件的處理格式后,新建項目進行可視化,選擇時間期限為1996—2020年,時間切片為1年,閥值選定為50,依次對作者、機構、關鍵詞進行可視化圖譜共現,以發現國內語料庫研究的領頭作者、機構、研究領域和相關熱點等。
將659條數據導入Excel表格可以快速定位每年的發文量,依據年發文量繪制曲線圖可以推導出1996到2020年間國內語料庫翻譯研究在核心研究圈的走勢(如圖1)。圖1所顯示的年發文量呈波動增長,依據曲線圖走勢,可將核心研究圈的國內語料庫翻譯研究分為三個階段:起步階段(1996—2001)、低緩階段(2002—2008)、發展階段(2009—2020)。

圖1 年發文量曲線圖
起步階段的6年間核心期刊每年發表的論文數量為1-7篇,總數為16篇,年均發文量為2.7篇,發文量的基數較小,語料庫翻譯學受核心研究圈的關注度還不夠。低緩階段的7年間核心期刊每年發表的論文數量為9-19篇,總數為99篇,年均發文量為14.1篇,較起步階段取得了一定進展,但是發展緩慢。發展階段的12年間核心期刊每年發表的論文數量為32-57篇,總數為544篇,年均發文量為45.3篇,發文基數較低緩階段取得了較大增長,說明語料庫翻譯學開始受到較多核心圈學者的關注,并呈現起伏發展的態勢。
借助CiteSpace軟件對659條數據選擇節點類型(Node Types)為作者(Author)的可視化圖譜分析,得到圖2。圖2左上角的黑體字顯示了相關數據,重點關注其中的“N=590,E=445”這兩項數據。其中的“N”代表節點(即圖中的圓圈),圓圈和字號的越大,作者在659條數據中出現的頻次越高,“E”代表連線;節點之間的連線代表作者之間的聯系,連線越粗,說明他們在同一篇文獻中共現的頻次越高[7],由此可以看出作者之間的合作關系。作者合作圖譜中出現了590個節點,連線僅為445條,從圖中也可以直觀地看出各作者之間連線較少,幾個突出的作者(如王克非、胡開寶、秦洪武、黃立波等)間的連線也較少,說明研究者之間缺乏合作。

圖2 作者合作圖譜
借助CiteSpace中顯示的有關作者的分析數據,截取前10位高產作者的數據并制成表格,可得到如表1所示的結果。其中王克非、胡開寶、劉澤權、黃立波、秦洪武在核心期刊發表的文獻較多,最后3位作者發表的文獻數量皆為9篇。這10位作者之外的作者發表的文獻數量絕大多數在1-5篇。結合圖2可看出國內語料庫翻譯研究呈現出單核心的發展模式[5]115,少數核心成員占據重要地位,發揮著舉足輕重的作用。

表1 10位高產作者信息
在CiteSpace操作界面,選擇節點類型為機構(Institution)進行可視化分析,得到如圖3的可視化圖譜。根據左上角數據中“N=461,E=224”可以看出各機構間的合作也不夠緊密,仍需加強合作,以碰撞出新的火花。從圖中節點圓圈和字體的大小可以看出國內語料庫翻譯學最主要的研究機構為北京外國語大學中國外語教育研究中心和上海交通大學外國語學院。

圖3 機構圖譜
為了更加清楚地展現重要的國內相關研究機構,筆者借助CiteSpace中的相關數據繪制了表2,列出了前10所在核心期刊發表文獻較多的機構。表中的機構多為專業外語類院校或綜合類院校的外國語學院。其中外語類院校表現最為突出,前10名院校中有5個名額被外語類院校占據(有重復);在發文時間上,北京外國語大學在核心期刊上的發文時間最早,引領了后來的相關研究。

表2 重要機構研究信息
將CiteSpace操作界面的節點類型選擇為關鍵詞(Keyword)進行科學圖譜的可視化分析,可得到如圖4的關鍵詞共現圖譜。將圖譜中的關鍵詞按照相關算法進行聚類總結,可得到如圖5的關鍵詞聚類圖譜。聚類視圖“側重于體現聚類間的結構特征,突出關鍵節點及重要連接”[6]248,將兩張圖中的相關關鍵詞數據結合起來分析能夠得出核心研究圈有關國內語料庫翻譯學的主要研究領域。

圖4 關鍵詞共現圖譜
圖4中出現了語料庫、平行語料庫、機器翻譯、譯者風格、語料庫翻譯學、翻譯教學、雙語語料庫等字號較大的關鍵詞,說明這些關鍵詞在659條文獻中出現的頻率高,所受到的關注度較高。但是圖4中還有其他字號相對較小的關鍵詞,如口譯研究、語義韻、《紅樓夢》等,說明學者對其他的話題仍然有關注。圖4中的關鍵詞較多,總結起來很難做到十分精確。因此,為了提高總結研究領域的精確度,筆者借助CiteSpace軟件的關鍵詞聚類這一功能,將圖4中聯系較為緊密的關鍵詞進行匯總形成聚類,得到如圖5的關鍵詞聚類圖譜。
CiteSpace依據網絡結構和聚類的清晰度,提供了模塊值(Q值,即Modularity Q)和平均輪廓值(S值,即Mean Silhouette)兩個指標,當Q值>0.3時,聚類結構就是顯著的;當S值達到0.7就可認為聚類是令人信服的。[6]249圖5左上角的數據顯示Q值=0.7366,S值=0.5528,因此該聚類圖譜的聚類結構十分顯著,且結果令人信服。

圖5 關鍵詞聚類圖譜(LLR算法)
圖5中各聚類按數值從小到大所包含的文獻量依次遞減,筆者截取了CiteSpace中前9個聚類的相關數據匯入表3。表3中“聚類內代表性關鍵詞”一欄中的第一個關鍵詞為該聚類名稱,因為其代表性最強。筆者截取了每一聚類的前三個代表性最強的關鍵詞,借助這些關鍵詞有助于定位核心研究圈對于國內語料庫翻譯學的研究領域。

表3 聚類匯總
通過對表3中的關鍵詞進行整合分析,結合圖4中的關鍵詞信息,可將核心研究圈對國內語料庫翻譯的研究劃分為以下四個領域:
a.機器翻譯(人工智能、自然語言處理、雙語對齊等);
b.語料庫建設(雙語語料庫、平行語料庫、《紅樓夢》、莎士比亞戲劇、可比語料庫、口譯語料庫等);
c.翻譯教學(翻譯教學、口譯教學等);
d.翻譯研究(翻譯風格、翻譯共性、翻譯普遍性、譯者風格、語料庫翻譯學、語料庫翻譯研究、翻譯策略、翻譯批評等);
翻譯研究可細分為語言特征研究(語義韻、意義單位、詞匯特征)、譯者風格研究(譯者風格、翻譯文體)和翻譯共性研究(顯化、翻譯共性)和翻譯語言研究(翻譯風格)四個板塊。
將圖4的關鍵詞共現視圖改為關鍵詞時區視圖進行呈現,結合CiteSpace軟件總結的1996到2020年出現的研究爆發點,有助于發現不同階段的研究熱點。
圖6的關鍵詞時區視圖顯示研究初期的話題集中在機器翻譯上;1997年開始核心研究圈一直都在關注語料庫的建設,從最初的雙語語料庫發展到對創建口譯語料庫和自建語料庫的研究;2004年開始利用語料庫進行翻譯教學的探索;2008年開始將注意力放到翻譯研究上,對翻譯共性、譯者風格等進行研究,到現如今,基于語料庫的翻譯研究仍是核心研究圈的重點關注話題。

圖6 關鍵詞時區圖
基于對不同階段的主要研究話題有所了解,借助CiteSpace的爆發點總結功能,能夠準確發現不同階段的研究熱點,如圖7所示。總體來看,前半階段的研究重點關注機器翻譯相關的研究話題,后半階段研究重心轉向語料庫建設和語料庫翻譯學方面的研究。仔細分析圖7發現,1997—2005年機器翻譯都是研究的熱點話題,其間雙語語料庫的研究幾乎同步進行;1998—2008年重點研究由自然語言處理發展到人工智能,為語料庫建設和應用于翻譯研究打下基礎;2011—2015年開始運用語料庫技術來研究譯者的翻譯風格,并且興起了自建《紅樓夢》語料庫來研究譯者的翻譯風格和文體的熱潮;2012年,王克非將Baker命名的“基于語料庫的翻譯研究”和Tymoczko命名的“語料庫翻譯研究”正式采用“語料庫翻譯學”這一術語進行概括[8],于是從2012年至今,語料庫翻譯學相關的研究都是核心研究圈關注的熱點話題;2016—2017年核心研究圈開啟了對可比語料庫的研究,并形成一定熱潮,如王克非和秦洪武借助歷時復合語料庫來研究翻譯語言對漢語的影響[9];2018年開始,有關翻譯風格的研究興起。鑒于可比語料庫、歷時語料庫建設所取得的進展,2018年開始一直持續到2020年的翻譯風格研究較以往的譯者風格研究有了質的飛躍,不再單純分析譯者的翻譯偏好和策略等傳統話題,而是從翻譯語言的角度進行展開,如朱一凡和秦洪武借助英漢翻譯歷時語料庫考察了“individualism”一詞的漢語意義在中國經歷的歷時變化[10];秦洪武和孔蕾借助歷時類比語料庫將漢語原創語料和漢語翻譯語料進行對比,發現漢語語言確實受到了翻譯語言的影響,較多使用修飾語,因而結構容量有所拓展、復雜性增加,但是內部構成并沒有發生變化[11]。借助于語料庫建設取得的新成就,有關翻譯語言的研究逐漸引領語料庫翻譯研究的新潮流。

圖7 關鍵詞爆發點圖
國內語料庫翻譯研究經過了二十余年的發展,取得了相當大的進步,但是仍然存在一些問題亟待解決。筆者擬列出研究過程中發現的問題,并給出相關建議。
首先,國內語料庫翻譯研究存在重微觀輕宏觀的現象。語料庫翻譯學集合了描寫性翻譯研究和語料庫語言學重描寫和重實證的特點,但是在一定程度上過于重視對例子的描寫,而忽略了解釋這一維度,未能將微觀層面的語言現象上升為宏觀的文化層面,缺少對語言背后的意識形態和翻譯倫理等的探討。較多學者都是借助語料庫技術來探討譯者的翻譯風格和文體,沒有對譯者的翻譯動機和限制因素進行深入的分析,只停留在語言層面,忽視了社會和文化因素。針對這一問題,核心研究圈的學者們應該秉持探究的意識,脫離微觀語言層面的分析,可嘗試拓展語料庫批評譯學這一研究思路。胡開寶教授于2015年提出了“語料庫批評譯學”這一概念,并對其屬性、研究內容和意義等做了詳細解釋,明確指出“語料庫批評譯學”是采用語料庫方法,在觀察、分析和統計數據的基礎上,對文本特征和其背后的意識形態因素進行分析的研究[12];并且于2020年與盛丹丹一起進一步敘述了基于語料庫的文學翻譯批評研究的內涵、意義及發展方向[13]。胡開寶的這一思路值得核心研究圈的學者們深入探索并從中得到啟示。
其次,國內語料庫翻譯研究存在研究不均衡的現象。根據以上的數據分析可知,核心研究圈對于國內語料庫翻譯研究多集中在書面材料語料庫的建設上,對于口譯語料庫的研究相對薄弱;Baker和Laviosa等提出了第一代翻譯共性假設,包括顯化、簡化和傳統化(或規范化)等[14]。但是核心研究圈學者對于翻譯共性的探討集中在顯化這一因素上,缺少對其他幾個方面因素的探討;對于語料庫翻譯教學的探討相較于其他話題也較少。語料庫技術用于翻譯教學能夠改進教材編寫方式、改革教學方式和工具,核心研究圈的學者多為高校教師,若能對其深入研究,開發出更多選擇,那么國內MTI的翻譯學碩士的教學成效將大大提高。學者們還應該加強口譯語料庫的建設,推動國內語料庫翻譯研究均衡發展。
再次,國內語料庫建設在語種、技術、規模、規范性等方面仍存在一些不足。國內的語料庫多為英漢語,其他語種的語料庫較少,品類較為單一,且多為書面語料庫;我國平行語料庫在字句對齊技術和檢索工具方面仍需提升[15];我國雖有較大規模的語料庫,但是較國外的語料庫規模相比仍然還有提升的空間,且大型語料庫數量較少,其中的語料內容不夠完善,多是研究者自建的小型語料庫,因此在共享方面仍然存在問題,不利于研究者之間的合作與深入交流。在語料庫的規范性方面,各個小型語料庫的建設標準不一,給信息的共享和流通造成了阻礙。因此,核心研究圈的學者們應致力于語料庫的建設與提升,加強合作,共同建設囊括眾多語料的大型語料庫,在交流中制定出合理統一的建設標準,推動各大小語料庫的共享與信息流動,并且將完善的口譯語料庫的建設提上日程。在語料庫的建設方面,團隊合作是重中之重。從上文機構和作者的分析結果中發現核心研究圈國內語料庫翻譯學研究的研究者和研究機構之間缺乏合作,單核心的發展模式不利于語料庫的建設與共享。只有形成團隊,加強溝通交流,才能產出好的語料庫產品和研究成果。[16]
最后,國內語料庫翻譯研究在跨學科和理論發展方面仍有不足。我國的語料庫翻譯研究雖是語料庫語言學和描寫性譯學的結合,但是主要集中在這兩個領域,缺乏認知、社會學、心理學等學科知識的匯入,跨學科支撐不足。此外,國內語料庫翻譯研究多借鑒國外理論,缺乏本土理論的挖掘。國內學者應該在利用國外理論分析翻譯現象的同時,注意結合漢語的特色,從中發掘符合漢語的本土理論,并利用該理論對翻譯現象進行解釋,從而驗證理論的正確性和有效性。
在進行研究的過程中,有效利用研究工具能夠為研究者提供便利,甚至帶來新的發現。CiteSpace這一可視化軟件為研究國內語料庫翻譯學的發展概況提供了有力抓手。借助這一分析工具,筆者總結了國內語料庫翻譯研究的高產作者、領先研究機構、研究領域和熱點等重要信息。同時發現,在研究者方面,國內語料庫翻譯學研究存在單核心發展模式,對核心人物的依賴性過高;研究者和研究機構間缺乏團隊合作。在對研究領域和熱點的分析中,發現國內語料庫翻譯學研究存在重視微觀層面譯者風格和翻譯共性的探討,忽視從宏觀層面進行文化分析的現象,且存在研究領域不均衡、跨學科支撐不足等問題。此外,對于語料庫的建設仍存在不足、本土理論發展的能力較為薄弱。因此,核心研究圈的學者和機構之間應該加強合作,提升翻譯語料庫的建設水平,并與其他學科的專業學者加強溝通,推動語料庫翻譯研究的跨學科建設。此外,尋找新的研究點、加強對薄弱環節的研究,并且在研究中發掘本土理論也是研究者們面臨的重要課題。