侯建華


摘 要: 中國語言資源有聲數據庫,旨在用現代信息技術對中國各縣域的語言實態進行調查記錄、保存建庫、研發利用,是科學保護各民族語言文字,傳承弘揚中華優秀傳統文化的一項重大工程。唐山庫的建設能夠帶動河北其他地區語言資源有聲數據庫建設工作的順利實施,有利于了解河北的語言實情,有利于提高我省的綜合經濟實力,有利于河北優秀傳統文化的傳承,為京津冀一體化的和諧發展和2016年唐山世界園藝博覽會的召開營造良好語言文化氛圍。
關鍵詞: 語言資源 有聲數據庫 方言調查
用現代信息技術將我國語言的現實狀況采錄下來, 建成可滿足社會多方需求、可不斷維護更新的有聲數據庫, 是利在當代、惠及后人的事業,對我國語言規劃和語言科學研究將產生重要影響。2013年7月,中國語言資源有聲數據庫河北庫試點工作會議在唐山召開,標志著河北庫建設以唐山(4個方言調查片區)和承德灤平(1個普通話調查點)為試點正式啟動,教育部語信司領導和北京語言大學專家組參會。2015年7月,河北庫建設試點預驗收工作會議在唐山師范學院召開,教育部領導和專家對河北庫建設給予了高度評價,中新社、央視網等38家媒體進行了相關報道和專訪。
一、唐山方言資源有聲數據庫建設的重要性
教育部、國家語委主持的“中國語言資源有聲數據庫”工程于2007年開始前期論證,2008年在江蘇省蘇州、常熟、昆山等市區開展試點工作,2010年試點工作結束。2011年上海、北京、遼寧的語言資源有聲數據庫建設工作相繼開展,我省于2013年7月啟動試點工作。
教育部副部長,國家語委主任李衛紅同志講道,建設中國語言資源有聲數據庫,具有重大而深遠的意義。第一,通過中國語言資源有聲數據庫的建設,可以全面掌握語言國情,有利于科學制訂國家的語言規劃和語言政策;第二,可以促進普通話的推廣,提高普通話的學習質量;第三,可以保存語言實態,保護中華語言文化遺產;第四,可以推進我國語言科學的發展;第五,數據庫的建設成果能提高語言文字信息化水平,從而推動我國信息產品的發展,保護國家信息安全。
將唐山作為河北庫建設的試點城市,具有積極而深遠的意義。“冀東三支花”是河北省唐山地區三種主要的文藝形式,即評劇、皮影、樂亭大鼓,作為中國非物質文化遺產,蜚聲海內外。影視作品如《唐山大地震》、《鬼子來了》,侯寶林、趙麗蓉等表演藝術家的曲藝作品,惟妙惟肖的唐山方言也多有體現且深入人心,具有廣泛的群眾基礎。另外,唐山市多年來對語言文字事業的高度重視也是促成唐山作為河北庫試點的重要原因。唐山庫的建設,對發掘我省語言資源有較大參考價值,能夠為河北庫的建設提供翔實的數據支持,為我省方言地圖的構建提供支撐,為京津冀一體化的和諧發展和2016年唐山世界園藝博覽會營造良好語言文化氛圍,拓寬語言社會服務的渠道和領域,從而推動我省語言文化產業的良性發展。
二、唐山庫的設計與實施
(一)工作模式
“中國語言資源有聲數據庫”建設是一項系統工程。唐山庫的建設工作發揮教育行政部門、語委的行政職能作用,專家的專業引領作用,調動各方面力量,提高其社會知曉度,形成“政府主導,語委牽頭,專家引領,部門協調,社會參與”五位一體的工作模式,并制定一系列行之有效的專家團隊運作及管理辦法。這種模式是在唐山市二類城市語言文字評估、三類城市語言文字評估、語言文字工作達標縣評估等順利實施的基礎之上形成的,得到了上級主管部門的高度認可。另外,在語言資源有聲數據庫建設的調研、論證階段,應該制訂切實可行的工作實施方案,以便統籌整體工作安排和進度。
(二)調查點的設置
唐山方言屬于北方方言區內冀魯次方言區的一個方言分支。唐山地區雖然毗鄰北京,千百年來一直居于官話區的要沖之地,但唐山方言一直保持著自己的特色。現在唐山方言作為一種語言現象,與普通話有著系統的差別。
根據唐山市各縣(市)區的語言面貌及方言區域劃分相對統一的原則,結合《中國語言資源有聲數據庫調查手冊-漢語方言》(以下簡稱《調查手冊》)上對調查地點的要求,劃分出四個方言調查片區:灤縣、灤南、樂亭、曹妃甸片區以灤南為組長單位,其他縣區為成員單位;豐潤、玉田、遵化片區以玉田為組長單位,其他縣區為成員單位;遷西、遷安片區以遷西為組長單位,遷安為成員單位,市區片區(路南、路北、古冶、開平、豐南、蘆臺、漢沽)以古冶為組長單位,其他區為成員單位。以上是河北庫建設唐山試點工作開展階段確定的四個方言調查片區,隨著前期工作經驗的積累和調查工作的深入開展,其他未開展的縣(區)按照《調查手冊》的要求也應該陸續開展相關調查工作。
(三)調查對象
調查對象(方言發音人)的遴選和培訓是“中國語言資源有聲數據庫”建設工作的重要一環,也是完成方言調查的前提與基礎。按照國家語委《調查手冊》的要求和方言調查的基本規律,每個方言調查片區均需要調查4名方言發音人和3名地方普通話發音人,具體遴選條件見表1。
表1 方言發音人遴選條件及說明
選擇發音人應該堅持廣泛宣傳、重點遴選、抓好培訓的原則,目的是爭取讓盡可能多的符合條件的發音人主動報名參與遴選,以便能好中選優,留有余地。唐山庫的方言發音人遴選環節,調查團隊考慮時間、人手、交通便利、經費預算等各項因素,采取由市語委統籌布置、調查片區語委配合的方式,先由調查片區語委通過新聞媒體、報紙櫥窗、公共場所發放宣傳單等多種形式進行廣泛宣傳發動,進行初次選拔,再由市調查團隊進行現場面試、遴選,最終確定符合要求的方言發音人,并進行角色分工和培訓、輔導。
(四)調查內容
調查內容分語言結構調查和話語調查兩大部分。語言結構調查是基礎, 用1000字調查語音系統, 用1200詞調查基本詞匯系統, 用50句調查主要的語法現象。話語調查是重點,分為講述和對話兩部分。講述包括“規定故事”和“自選話題”。規定故事為《牛郎和織女》, 它具有中國文化的特點, 分布地域也比較廣泛。自選話題要能反映當地文化特色,例如: 當地口耳相傳的民間故事;當地的童謠、諺語、歇后語、順口溜;當地的地方文藝、風俗習慣和傳統節日;個人和家庭的情況; 當地的旅游景點和土特產;時事熱點評論等。方言發音人分角色調查內容見表2。
表2 方言發音人分角色調查內容說明
(五)調查方式
“中國語言資源有聲數據庫”河北庫唐山試點的調查涉及田野調查(前期遴選、培訓和確定音系階段)、音像攝錄(正式采集錄制階段)、資料整理(后期加工整理階段)、存檔管理(最終上報階段)、成果編寫和開發利用(延展開發階段)等環節,方言發音人分角色調查方式見表3。
表3 方言發音人分角色調查方式說明
(六)建庫與開發
“中國語言資源有聲數據庫”河北庫唐山試點將收錄唐山方言四個調查片區的所有資料。數據庫建設完畢后,將唐山庫的所有調查材料統一建檔上報,由國家語委審核后統一歸入“中國語言資源有聲數據庫”國家總庫。我們應該充分重視數據庫的開發運用,數據庫的建設可與唐山文化建設的“十二五”規劃,與唐山重點文化建設的項目,如博物館、文化館、展覽館、公共文化設施的建設結合起來,在地方文化建設中,發揮語言文字資源的獨特作用,使這個資源能夠共享。
三、唐山庫建設的準備工作
“中國語言資源有聲數據庫”建設是語言文字工作的一項基礎建設的民心工程,建設周期長,科學性強,工作要求高,特別是語言資源的采集質量,直接關系到國家數據庫的質量和價值。“萬事開頭難”,尤其唐山作為河北庫建設的試點城市,一切都要摸索著前進,為此,唐山調查團隊本著認真負責、精益求精的工作態度,做了大量的前期準備工作,不帶有疑問操作,保證建設的科學性和規范性。
(一)組建調查團隊
按照《調查手冊》的要求,在調查團隊成員的選擇上,具備以下三個條件:1.熱愛語言文字工作,責任心強,富有團隊精神;2.有較高的業務素養,熟悉唐山方言,有豐富的語言文字工作經驗;3.有一定的文字功底和計算機應用能力,善于溝通、交流。基于以上原則,遴選出符合標準的調查團隊核心成員6名,每個調查片區再配備工作人員2-3名輔助調查團隊的工作。另外,根據工作需要,配備錄音、攝像、照相的專業人員4名;配備調查后期加工、整理階段的工作人員3-4名。
(二)調查團隊的培訓
“打鐵需要自身硬”,調查團隊成員業務水平的高低決定著調查工作的成敗。為此,我們對調查團隊成員進行了嚴格的培訓,一是通過聘請專家講座、調研,使調查團隊熟悉《調查手冊》整體工作流程和技術指標。二是調查團隊進行方言語音聽辨、音系整理、國際音標記音、漢字轉寫等業務的強化訓練。三是對攝錄人員進行設備使用和操作方法的專門培訓。
(三)方言發音人的培訓
一是針對每個發音人的任務不同,制定培訓手冊。二是在每一位發音人熟悉自己承擔的任務的前提下,對《調查手冊》中的內容進行方言轉注。三是對發音人進行分角色培訓,同時分角色進行模擬演練。通過培訓,有效保證正式錄制階段的工作順利進行。
(四)制定各調查片區工作安排
唐山庫的建設工作,在每個方言調查片區開展工作之前都要制定詳細的工作日程安排,這項工作是河北庫唐山試點的創新點,得到了“中國語言資源有聲數據庫”首席專家、北京語言大學曹志耘教授的高度認可。方言調查片區工作安排從工作階段、時間安排、工作內容、負責部門、負責人等幾個方面,對調查的各個階段(前期準備、采集錄制、后期加工整理、終審上報)的工作進行詳盡的布置,力求做到分工明確、責任明晰,有效推動工作的開展。
(五)搭建信息化調查平臺
根據《調查手冊》對“中國語言資源有聲數據庫”建設技術指標的要求,唐山庫的建設搭建了信息化的調查平臺。一是保證調查環境達標,我們選擇唐山師范學院多媒體演播廳和錄音棚作為調查地點。二是保證調查核心技術指標(音像質量)達標, 攝錄硬件使用SAMSON C03U話筒錄音,使用索尼D70攝像機攝像,照相使用尼康D7000,錄音軟件使用錄音軟件使用Byly(北語錄音),使用Auducity進行錄音效果的監測和編輯錄音文件。三是保證調查資料的標準化、規范化,配備專業的工作軟件,國際音標的轉寫使用IpaPanNew配合Unicode進行,音高分析和語音標注使用Praat編輯,配備專業字庫軟件進行方言字、詞、句、話語的漢字轉寫,使用大洋線性編輯系統進行音像資料的編輯、合成。通過搭建高標準的信息化調查平臺,唐山庫的建設質量邁上了新臺階。教育部副部長、國家語委主任李衛紅同志認為河北庫唐山試點的工作為全國其他省份開展“中國語言資源有聲數據庫”建設樹立了典型。
目前開展的“中國語言資源有聲數據庫”建設應該說迫在眉睫,是搶救性保護,國家語委主持開展此項工程應該說是高瞻遠矚,這一工作開展得越早越好,越早越全面。科學保護方言資源不是為了推廣,而是為了更好地傳承,形成一個歷史時期的印記。唐山方言資源有聲數據庫應該作為唐山的文化瑰寶世代相傳,成為唐山靚麗的文化名片,下一步,我們希望通過后續的深入開發和有效利用,在即將召開的2016年世界園藝博覽會上,讓此項工程成為世界了解唐山、認識唐山的一個窗口,為京津冀一體化的和諧發展營造和諧的語言氛圍。
參考文獻:
[1]李宇明.論中國語言資源有聲數據庫的建設[J].中國語文,2010(04):356-363.
[2]中國語言資源有聲數據庫建設領導小組辦公室.中國語言資源有聲數據庫調查手冊[M].北京:商務印書館,2010.
[3]王世凱,張亮.論“中國語言資源有聲數據庫遼寧庫”的建設[J].渤海大學學報(哲學社會科學版),2011(06):86-89.
基金項目:
1.唐山師范學院教育教學改革研究項目《計算機輔助評測背景下高校普通話教學改革研究》(2015001008)。
2.河北省高等學校人文社會科學研究重點資助項目(語言文字專項)《唐山方言音變規律研究》(YWZX201502)。