□柯可 舒傳華/文
近十年來,語料庫的建設工作在世界范圍內迅速發展,而專門研究某一地區或領域的雙語專門語料庫卻并多常見,以某個地區民俗文化為主題的語料庫建設性研究更是少之又少。
作為中部大省,湖北省擁有豐富的民俗文化。湖北民俗文化雙語平行語料庫旨在通過收集并記錄當地具有代表性的民俗文化,構建一個小型的英漢雙語平行語料庫。利用信息化手段更好地服務于民俗文化的保護、傳承和延續,這對于傳承湖北地區的傳統社會歷史和傳承風俗文化有著十分重要的作用,對于當地人民形成文化認同具有重大意義,同時對于當地語言教學者和學習者也有很大的幫助。
目前國外民俗文化研究主要特點是:高度重視民俗文化的價值,不斷完善民俗文化保護的相關法律法規,將民俗文化保護和市場開發相結合,注重對廣大民眾的宣傳教育,為保護和發展民俗文化提供學術保障等。國內關于民俗文化的研究成果豐富,這些研究成果主要應用于文學、教育、藝術、美學、旅游業、產品設計、文化傳承及鄉村經濟振興等方面,具有極其廣泛的應用價值。然而關于湖北省民俗文化的研究數量較少,國外目前鮮有對湖北民俗文化的研究。國內關于湖北省民俗文化的研究聚焦在以下三個方面:一是對于湖北民間非物質文化遺產的開發、保護及傳播研究。二是關于推動湖北省民俗文化的產業發展途徑研究。三是基于某一個或某一類民俗文化的個體研究,從個體研究出發來研究地域符號以及民眾思想的變遷及民俗文化的傳承等[1]。
本研究借助構建湖北民俗文化語料庫,旨在使科學技術更好地服務于荊楚民俗文化的傳承,推動荊楚文化的國際傳播。通過對湖北民俗文化中文、英文語料的搜集、整理、歸類、分析、加工和技術處理,構建體系上較為完整、內容上較為翔實、使用較為方便、語料制作較為精細的語料庫。
首先,在建設語料庫之前需要明確研究目的和其構建的用途;其次,根據研究目的確定語料庫的類型和規模;最后,遵循一定的方法和原則去建設該語料庫。湖北民俗文化雙語平行語料庫主要收集民間傳說、民間美術、民間舞蹈、戲曲曲藝四方面內容,重點建設比較有代表性的民間傳說、民間美術、傳統舞蹈、傳統戲劇的雙語語料。
以湖北民間傳說為例,主要收集了湖北地區流傳的文學作品,其內容豐富多樣,涉及的主題包括神話傳說、歷史故事、愛情故事、英雄傳說等,如黃鶴樓傳說、炎帝神農傳說、王昭君傳說、木蘭傳說、屈原傳說等。該語料主要來源于湖北省民俗博物館的民俗文化資料、相關的數據庫和文獻資源。收集完成后,為確保語料的效度,對其進行篩選,剔除掉關聯性不高的語料[2]。
該過程涉及語料的整理、切分、標注和對齊等步驟。首先,針對收集后的雙語語料,分別以TXT格式(微軟系統自帶文本格式)保存。使用微軟平臺文本編輯器軟件(EmEditor)對漢英語料文本進行降噪處理,例如,刪除多余的空格和空行、進行替換等操作,以確保格式和編碼統一,沒有其他多余的雜質。
其次,對整理后的正確語料文本進行切分。該語料庫主要實現句子切分(根據內容和句意對漢英的語料進行分句),同樣使用EmEditor來實現此操作。利用EmEditor的替換功能,中文文本在查找欄中輸入“。”,替換為“。〈/seg〉〈seg〉”,而英文文本中則在查找欄中輸入“.”,替換為“.〈/seg〉〈seg〉”,最后將結尾的“〈seg〉”刪去,在開頭補充“〈seg〉”,將替換后的文本保存在TXT格式中。如圖1所示。

圖1 英文語料的分句操作
語料標注是指對語料庫中的文本進行語言學分析和標記的過程,其目的是方便研究者對語料庫中的文本進行進一步的分析和研究,也可以用于自然語言處理、文本挖掘等領域的研究,以便機器能夠理解和使用這些數據。而語料標注通常包括詞性標注、句法分析、語義標注等,它可以使用人工標注和自動標注兩種方法。本語料庫采用了SegmentAnt軟件(中文分詞軟件名)進行分詞和標注操作,對標注后的語料還需要人工進一步進行校對,以確保其準確性。
語料的平行與對齊是非常重要的步驟,也是為了實現平行語料庫檢索的目的。該語料庫利用ParaConc工具軟件(中國傳媒大學平行語料檢索工具軟件名)來實現此操作。首先將分句后的中英文文本在TXT格式中另存為“ANSI”格式(編碼格式名,能避免文字亂碼),然后再同時打開這兩個文件進行原文和譯文在句子層面上的平行對齊。由于英漢兩種語言之間差異較大,自動對齊在處理一些復雜的語言結構時可能會出現錯誤,所以還需人工進行校對與調整以確保研究的準確性與可信度。如圖2所示。

圖2 語料的平行對齊
在語料庫語言學中,通過語料檢索可以獲取大量的語言數據,從而研究語言現象。例如,可以通過語料檢索研究詞匯的使用頻率、詞性分布、句法結構等。對加工處理后的語料進行檢索,將需要查詢的關鍵詞或語句輸入到計算機程序中,在語料庫中查找與查詢語句相匹配的記錄。本語料庫運用ParaConc軟件進行檢索操作,如圖3所示。
湖北民俗文化雙語語料庫的建立,一方面加強湖北民俗文化教育。另一方面擴大湖北民俗文化在全國乃至全世界的影響力[3]。
在英語教學應用方面,湖北民俗文化雙語語料庫能為本土高校英語翻譯、口語、寫作等實踐教學工作提供豐富、規范的語料資源。比如,在本土高校英語翻譯教學中,可以從文本的漢、英語料的對比研究入手,從文體和功能方面探究二者的差異和共性,發現不同類型的湖北民俗文化文本及其英譯文本的語言特點,進一步結合翻譯學理論,探討湖北民俗文化文本外宣翻譯的翻譯策略、翻譯方法及其內在成因。
湖北民俗文化雙語平行語料庫將有助于在湖北地方政府實施文化強市戰略基礎上樹立湖北民俗文化對外宣傳的新形象。由于在建庫時嚴格控制入庫語料,所以建設成的湖北民俗文化雙語平行語料庫可以為湖北省地方政府門戶網站的構建提供理論指導和素材積累,達到良好的外宣效果,推進湖北省各地市政府網站的國際化發展和國際傳播能力建設[4]。
湖北民俗文化雙語平行庫的建設不僅能夠提高湖北地區的宣傳度,彌補當地民俗文化宣傳方式及種類的不足,還能夠幫助人們對當地民俗文化有更深刻的了解,加強語言類學生對語言的學習和翻譯的練習,對了解湖北當地的民俗文化具有重要意義。該語料庫的構建將為其他語料庫的建設和研究提供一定的參考,助力中華民俗文化翻譯研究及海外傳播。■
引用
[1] 王克非.雙語對應語料庫:研制與應用[M].北京:外語教學與研究出版社,2004.
[2] 王克非,黃立波.語料庫翻譯學十五年[J].中國外語,2008(6):9-14.
[3] 姚爽.民俗翻譯平行語料庫建設研究[J].佳木斯職業學院學報,2016(08):370-371.
[4] 于淑芳.皖西紅色文化雙語語料庫的構建及應用[J].皖西學院學報,2022(38):10-14.