【摘 要】當(dāng)前對莽語研究基本上是以文本形式,學(xué)術(shù)研究為主。莽人語言資源有聲數(shù)據(jù)庫的建設(shè),是用現(xiàn)代信息技術(shù),借鑒國內(nèi)外語音數(shù)據(jù)庫建設(shè)的經(jīng)驗,將莽語完整記錄下來,歸檔建庫,永久保存。本文將就這一問題進(jìn)行展開研究。
【關(guān)鍵詞】莽人 莽語 數(shù)據(jù)庫建設(shè)
【中圖分類號】TP392 【文獻(xiàn)標(biāo)識碼】A 【文章編號】1674-4810(2014)10-0012-02
“一個民族的精神特性和語言這兩個方面的關(guān)系極為密切,……民族的語言即民族的精神,民族的精神即民族的語言,二者的同一程度超過了人們的任何想象?!币粋€民族的語言也可以理解該民族的精神,它是一個民族在特定地域環(huán)境,經(jīng)過無數(shù)代人積累而形成的財富。是該民族文化遺產(chǎn)和文化精髓的集中體現(xiàn)。隨著人類文明進(jìn)入全球化和信息化的新時代,在國家對少數(shù)民族關(guān)心下,一些封閉、半封閉狀態(tài)的地區(qū)、族群的迅速開放、搬遷。一些弱勢語言將更加減弱,尤其是人口在10萬的少數(shù)民族的語言已進(jìn)入嚴(yán)重瀕危狀態(tài)。讓人們深刻認(rèn)識到我國人口較少民族語言搶救和保護(hù)的緊迫性。
對人口較少民族語言保護(hù)行動刻不容緩,然而,如何保護(hù)瀕危語言的資源技術(shù)問題一直沒有得到解決。到2009年啟動中國語言資源有聲數(shù)據(jù)庫建設(shè),為少數(shù)民族語言保護(hù)提供了強有力的技術(shù)保障?!爸袊新曊Z言資源數(shù)據(jù),是國家語委正在開展的一項語言工程,旨在用現(xiàn)代信息技術(shù)、遵循統(tǒng)一的工作規(guī)范、將中國各縣域的語言實態(tài)記錄下來,歸檔建庫,永久保存”。本課題從人口較少民族——云南省紅河州金平縣布朗族支系莽人(以下簡稱莽人)研究著手,建立莽人語言資源有聲數(shù)據(jù)庫,讓莽人語言(以下簡稱莽語)資源得到較好的保護(hù)。
一 研究背景
國內(nèi)莽人指的是云南省金平縣居住最后一個中國原始部落,野居在中越邊境的高山密林中,他們居住在透風(fēng)漏雨的茅草房、杈杈房中,依靠采集野果、野菜、狩獵為生,人口僅六百余人。該族群有自己獨立的莽語,即莽人的語言。法國學(xué)者奧德里古爾分析,“莽語屬于南亞語系孟高棉語族。但由于他們居住在比較偏僻的地區(qū),與苗和藏緬語集團毗鄰生活,莽語有了變化”,莽人只有語言沒有文字,傳承方式主要為口傳。
2009年,在各政府的關(guān)心支持下,莽人從原始深山密林遷入建筑面積為122.4平方米兩層小洋房。從此,中國最后的原始部落莽人走進(jìn)了現(xiàn)代生活。然而,“生存環(huán)境的變遷,必然給移民原有傳統(tǒng)文化帶來挑戰(zhàn),甚至面臨失散或消亡的危險?!痹诿诉^上幸福日子的同時,卻失去了許多原汁原味具有地方特色和民族元素的莽人。廣播、電視、大眾傳媒也在村里日益普及,官方語言、通用語言傳播力度的加強,莽語也將面臨前所未有的挑戰(zhàn)。
二 研究意義
利用中國語言資源有聲數(shù)據(jù)庫建設(shè)的大環(huán)境,借鑒江蘇省、北京等各省市語言資源有聲數(shù)據(jù)庫的建設(shè)方法,建設(shè)莽語有聲數(shù)據(jù)庫。這樣做:(1)有利于莽語的傳播。利用互聯(lián)網(wǎng)可以高效、擴大莽語的利用率。(2)有利于長期保存莽語的原生性和完整性。莽語沒有文字,傳承全靠口傳,這種方式受傳承人、環(huán)境等儲多因素的影響。在傳播中容易失真,如果沒有合適的傳承人,莽語也將消失。借助數(shù)據(jù)庫技術(shù),可將莽語長久保存下去。(3)有助于莽人文化深入研究。通過莽語研究可進(jìn)一步深入研究莽人其他文化,建立莽語資源有聲數(shù)據(jù)庫,這不僅對莽語資源積累和語言研究具有重要的意義,也是對莽人民族傳統(tǒng)文化遺產(chǎn)的保護(hù),具有重大的現(xiàn)實意義。
三 存在的問題
建立莽語有聲數(shù)據(jù)庫主要問題有:(1)莽語語料收集、處理難。莽人生存環(huán)境的變遷,莽語特定環(huán)境也隨之改變。對一些資源的收集、對譯、意譯注釋及描述等資料分析整理工作難度大。(2)語言有聲資源語檔不統(tǒng)一。有聲資源語檔建設(shè)是一項規(guī)范性和標(biāo)準(zhǔn)化很強的工作。國內(nèi)現(xiàn)在少數(shù)民族的語言有聲資源語檔存在很多種,莽語資源有聲數(shù)據(jù)庫建設(shè)難以確定參考的標(biāo)準(zhǔn)。(3)國內(nèi)語言有聲數(shù)據(jù)庫缺乏統(tǒng)一的權(quán)威機構(gòu)進(jìn)行數(shù)據(jù)庫整體規(guī)劃和協(xié)調(diào),建成的數(shù)據(jù)庫結(jié)構(gòu)簡單、標(biāo)準(zhǔn)不統(tǒng)一、共享性差。
四 莽人語言資源有聲數(shù)據(jù)庫構(gòu)建
莽人語言資源有聲數(shù)據(jù)庫是一項涉及面廣的繁瑣工程,制定系統(tǒng)開發(fā)流程是必不可少的工作。根據(jù)莽人現(xiàn)在的實際情況,筆者認(rèn)為數(shù)據(jù)庫工程的任務(wù)可分為兩大部分:(1)數(shù)據(jù)庫前期準(zhǔn)備階段:數(shù)據(jù)庫開發(fā)溝通,包括數(shù)據(jù)庫可行性分析、數(shù)據(jù)庫建設(shè)原則、數(shù)據(jù)庫需求分析;原始語言材料收集,入庫數(shù)據(jù)源數(shù)據(jù)庫。(2)數(shù)據(jù)庫應(yīng)用平臺的開發(fā)階段:語言材料分析整理;數(shù)據(jù)庫設(shè)計,包括存儲結(jié)構(gòu)設(shè)計、軟件、硬件環(huán)境建設(shè);數(shù)據(jù)庫信息門戶建設(shè)。整個莽人語言資源有聲數(shù)據(jù)庫構(gòu)建流程如下:
1.數(shù)據(jù)庫前期準(zhǔn)備階段
整個數(shù)據(jù)庫是否開發(fā)成功很大程度上取決于前期準(zhǔn)備階段情況,前期準(zhǔn)備工作的好壞將最終影響到整個數(shù)據(jù)庫系統(tǒng)的質(zhì)量。
第一,數(shù)據(jù)庫開發(fā)溝通。數(shù)據(jù)庫工程是溝通的產(chǎn)物,數(shù)據(jù)庫開發(fā)過程實際上是將原始的信息原料轉(zhuǎn)化成有序計算機信息軟件的過程。數(shù)據(jù)庫開發(fā)溝通包括數(shù)據(jù)庫可行性分析、數(shù)據(jù)庫建設(shè)原則、數(shù)據(jù)庫需求分析。(1)對莽語數(shù)據(jù)庫的技術(shù)可行性、經(jīng)濟可行性、開發(fā)環(huán)境可行性及法律可行性進(jìn)行分析,羅列出在開發(fā)過程中可能出現(xiàn)的問題,并列出相應(yīng)的解決方案。(2)數(shù)據(jù)庫建設(shè)原則。莽人語言資源有聲數(shù)據(jù)庫應(yīng)堅持群眾化、全面化、標(biāo)準(zhǔn)化及共享性的原則。面向大眾全面地收集莽人語言資源,標(biāo)準(zhǔn)化處理語料,最終實現(xiàn)資源共享。(3)“需求分析階段是信息系統(tǒng)開發(fā)過程中的重要一步,也是決定性的一步。”分析其在功能目標(biāo)是否達(dá)到要求,認(rèn)真聽取莽人口傳者、語言學(xué)專家的意見進(jìn)行改進(jìn)。溝通是系統(tǒng)工程中必不可少的工序。
第二,莽人原始語言材料收集。“語料是一個數(shù)據(jù)庫的靈魂所在,語料的質(zhì)量直接關(guān)系著數(shù)據(jù)庫的實用價值。建設(shè)方言數(shù)據(jù)庫的主要目的是保存鮮活、真實的方言語料,以利于人們學(xué)習(xí)方言,后人研究和保護(hù)方言”。莽語數(shù)據(jù)庫語料主要包括:(1)原始錄音錄像資料,主要是用視頻原始地記錄采集口語的情境。這種語料含有莽人在生活、風(fēng)俗、家庭、婚姻、喪葬、節(jié)慶、禁忌與信仰等內(nèi)容。(2)原始語料注釋、轉(zhuǎn)寫、翻譯等文字材料。(3)語料其他產(chǎn)品實體。反映真實原始錄音錄像其他資料,如語料事件、圖像、場景文字記錄、說話方式等。
2.數(shù)據(jù)庫應(yīng)用平臺的開發(fā)階段
第一,語言材料分析整理。語言材料分析整理工作是在整個系統(tǒng)工程中很關(guān)鍵的一步,應(yīng)同語言學(xué)專家、計算機專家及當(dāng)?shù)孛苏Z言口傳專家組成一個團隊,進(jìn)行分析整理工作。該項工作主要包括:(1)標(biāo)音和轉(zhuǎn)寫,根據(jù)《國際音標(biāo)》參考高永奇著的《莽語研究》制定了一套適合莽人學(xué)習(xí)的拼音方案,對無文字莽語進(jìn)行標(biāo)音和轉(zhuǎn)寫。(2)對譯和意譯。根據(jù)不同的莽語情況,有時用對譯和意譯更準(zhǔn)確。(3)注釋與描述。對原始莽語資料的人物、地點、事件及背景進(jìn)行必要的注釋和描述,是對莽語更完整的保護(hù)。(4)莽語材料整理完成后入庫數(shù)據(jù)源數(shù)據(jù)庫。
第二,莽語數(shù)據(jù)庫平臺設(shè)計。主要包括設(shè)計數(shù)據(jù)庫的存儲結(jié)構(gòu),配置數(shù)據(jù)庫實現(xiàn)在軟硬件平臺。數(shù)據(jù)庫應(yīng)采用基于Microsoft Windows的OODB 的數(shù)據(jù)存儲方式。采用面向?qū)ο蟮腗icrosoft Visual Studio.net平臺和Visual C++開發(fā)工具予以實現(xiàn)。
第三,建立數(shù)據(jù)庫信息門戶。利用上述軟硬件平臺,將各種應(yīng)用系統(tǒng)、數(shù)據(jù)資源和互聯(lián)網(wǎng)資源集成到一個莽語信息管理平臺之上,圖形、音頻、視頻信息集合于一體,以統(tǒng)一的用戶界面提供給用戶,以方便用戶從各個角度找到自己想要的數(shù)據(jù)。其中包括分類、查詢、關(guān)鍵字全文模糊檢索、數(shù)據(jù)庫分項檢索、數(shù)據(jù)庫高級檢索、二次(多次)檢索等,實現(xiàn)莽人語言資源有聲數(shù)據(jù)庫的建設(shè)。
參考文獻(xiàn)
[1]洪堡特.論人類語言結(jié)構(gòu)的差異及其對人類精神發(fā)展的影響[M].北京:商務(wù)印書館,1997
[2]李宇明.中國語言資源有聲數(shù)據(jù)庫的建設(shè)[J].中國語文,2010(4)
[3]楊六金.越南西北部的莽人[J].世界民族,1997(1)
[4]黃永臻.移民生存環(huán)境的變遷與民族文化傳承的矛盾——以紅河州元陽縣哈尼族移民為例[J].紅河探索,2012(5)
[5]劉玉照、陳萍麗、王莉莉.信息系統(tǒng)開發(fā)中的需求分析[J].情報雜志,2003(5)
[6]杜福強.方言數(shù)據(jù)庫建設(shè)初探[D].寧波大學(xué),2012
〔責(zé)任編輯:高照〕