999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

瀕危少數民族語言的檔案編制工作探究

2017-03-27 21:35:24饒敏
科教導刊 2017年4期

饒敏

摘 要 本文基于筆者長期的語言田野調查實踐,以四川省甘孜州康定縣麥崩鄉的少數民族瀕危藏緬語貴瓊語為例,結合瀕危語言研究的最新理論,探討瀕危少數民族語言的檔案編制(language documentation)工作。本文將細化瀕危語言檔案編制工作的五個步驟,既口語語料的錄制、口語語料的數字化、口語語料的分析、口語語料的留存及口語語料的傳播,并探究這五步驟中所涉及的問題及應對。

關鍵詞 瀕危語言 語言檔案 貴瓊語 錄制 數字化

中圖分類號:D633 文獻標識碼:A DOI:10.16400/j.cnki.kjdks.2017.02.066

Abstract This paper takes Guiqiong language as example for discussing language documentation of endangered minority languages. Guiqiong is a Tibeto-Burman language of Dar.rtse.mdo County of Dkar.mdzes Prefecture, in Sichuan province, China. We have chosen to study Guiqiong spoken in Maibeng Canton. There are five procedures in language documentation. In this article, we will discuss measures and strategies about record, digitalization, analyze, archive and diffusion of Guiqiong language.

Keywords endangered language; language documentation; Guiqiong; record; digitalization

瀕危語言的消失是當今世界語言發展演變的一個大趨勢,是對語言多樣性及文化多樣性的一種嚴重破壞,是人類文化財富的重要損失。國際語言學界從20世紀60年代起開始關注瀕危語言問題,從80年代末起對瀕危語言的研究開始不斷升溫。直至2003年2月,一部支持語言保護和搶救重要文獻《語言活力與語言瀕?!芬约啊缎袆佑媱澖ㄗh書》終于在法國巴黎聯合國教科文組織總部舉行的瀕危語言專家會議上通過。其后在聯合國教科文組織2006 年的《保護非物質文化遺產公約》的鼓勵下,催生了一系列關于保護及留存非物質文化遺產的研究工作,其中包括對瀕危語言的保護及留存,也就是本文要探究的瀕危語言檔案編制工作(language documentation)。

我國是一個多民族的語言資源及其豐富的國家,記錄并留存瀕危語言的原生態面貌和信息,既是當務之急的任務更是一個長期且有意義的研究方向。我們在長期的田野調查實踐和理論研究中發現,貴瓊語作為一門瀕危的少數民族語言,在研究及保護搶救方面急需展開相關工作。本文將首先介紹作者前期對貴瓊語的田野調查工作,然后再以此為基礎,結合瀕危語言研究的最新理論,通過瀕危語言檔案編制工作的五個步驟,既口語語料的錄制、口語語料的數字化、口語語料的分析、口語語料的留存及口語語料的傳播,來探究這五步驟中所涉及的問題及其應對。

1貴瓊語簡介

貴瓊語在學術界普遍被認為是屬于藏緬語族羌語支的一門語言(孫宏開 1983; 黃布凡 1991)。說貴瓊語的人主要分布在四川省西部地區,這一區域被稱為“川西民族走廊”(孫宏開 1983)或“藏彝走廊”(費孝通 1982),其間分布著藏、彝、羌等幾十個少數民族。確切地說,說貴瓊語的人主要分布在甘孜藏族自治州康定縣境內大渡河沿岸的四鄉一鎮,即時濟鄉、舍聯鄉、前溪鄉、麥崩鄉和姑咱鎮,如圖1所示。

語言學家們從上個世紀80年代起開始對貴瓊語進行研究,但是能看到的相關文獻也為數不多。孫宏開(1983)在《六江流域的民族語言及其系屬分類》中談到了貴瓊語的語音系統及語法概況;宋伶俐(2011)出版專著《貴瓊語研究》以及姜麗(2015)《A grammar of Guiqiong》都對貴瓊語的語音及語法進行了描述。

2貴瓊語的田野調查概況

貴瓊語是一門口頭語言,所以必須通過數據采錄從而建立起可供學習和研究這門語言的素材。采集數據的工作主要通過田野調查來實現。除此之外,如果條件允許的話也通過電話調查的方式來進行補充調查,這時主要涉及的就是一些核對的工作和補充信息的獲得。

2.1 前期調查

我們從2006年-2016年先后深入康定縣故咱鎮、麥崩鄉、前溪鄉等地做貴瓊語的田野調查,共計八次,累計超過15個月,主要采集的是數據是詞匯、長篇傳統故事錄音及部分山歌、酒曲子等。

2006年的4月:我們開始了首次對貴瓊語的田野調查,調查為期一個月。首次調查主要以社會語言學的調查為主,也下到了不同的鄉鎮進行走訪調查,調查對象的選擇主要參考變化了以下幾個因素:性別、年齡、居住、對藏語的熟知度以及對漢語的熟知度。這次的調查主要使我們獲得了大量的社會語言學的數據,從而可以研究語言的使用現狀及其瀕危狀態。同時我們也記錄了一些詞匯,開始熟悉并學習這門口傳語言,對它的音位系統也有了自己初步的認識。

2007年1-4月:我們又深入魚通地區,對貴瓊語做了三個月的田野調查。這次的調查主要在故咱鎮進行。我們用一個1500詞的詞表,對不同年齡、不同性別、不同居住地及不同藏漢語認知度的發音人進行了分別的調查、記錄和核查。在這次的調查中,我們還采集記錄了一位貴瓊/西南官話雙語的78歲阿婆唱的兩首酒曲子和10首山歌。本次調查的發音人大部分來自麥崩鄉,其他的還有來自前溪鄉的,剩下的均來自姑咱鎮。

2008-2015年間:我們又先后又對貴瓊語做過六次田野調查。這些調查主要是有征對性地和主要發音人合作,以記錄、轉寫和翻譯長篇故事語料為主。通過自然語料來研究并整理貴瓊語的語法系統。對發現的問題,也會通過啟發式的直接問詢調查(elicitation)來進行核對和補充。另外也有專門為研究聲調而進行的專項實驗調查。

2.2 主要調查方法

我們在田野調查過程中所使用的方法隨著我們對該語言的認知程度以及調查內容的不同而變換。

被動的啟發式調查法(Controlled elicitation):利用這樣的所謂被動的啟發式調查法,我們可以進行以下的田野調查:比如為了收集貴瓊語的詞匯、獨立的句子我們會使用到詞表或者調查問卷CASSQ(由中國社會科學院民族與人類學研究所所編著的《中國語言資料有聲數據庫》問卷);為了調查貴瓊語的時-式-體,我們會采用Dahl (1985) Tense-Mood-Aspect Questionnaire (時-式-體問卷TMAQ)。另外我們在田野調查中還會用到刺激物(stimuli)通常是照片、視頻、音頻等來誘使發音人說出我們想要的語音材料。

半被動的啟發式調查法(Semi-Controlled elicitation):這個調查方法主要用來收集和分析長篇傳統故事語料,或者是即時的對話語料等。有的時候我們也會兼容并用被動的啟發式調查法和半被動的啟發式調查法。

3貴瓊語的語言檔案編制工作

為了能做到一個好的語言檔案的編制(language documentation),Austin (2006:89) 將語言檔案編制工作劃分為主要的五個步驟。我們將以貴瓊語為例,在接下來的五個小節中講述我們在這五個步驟中的所做與缺失: 錄制、數字化、分析、留存以及傳播。

3.1 貴瓊語的口語語料的錄制(record)

語言檔案編制的第一步是數據的采錄。這個步驟必須要求使用高質量的錄音設備、高質量的話筒、監聽耳機以及存儲設備。錄制的過程我們一直嚴格恪守以下兩條:(1)永遠不錄制壓縮格式例如mp3格式的音頻文件。(2)不直接將數據錄制在計算機的硬盤上,以免意外丟失數據。

我們在貴瓊語的口語語料采集中,使用的錄音設備隨著技術的不斷更新也在不斷變化,堅持的原則一直是不錄制壓縮格式的音頻數據。目前我們一直使用的是索尼的PCM D100錄音棒(如圖2所示)。

這款設備因具有便攜且錄音質量高的特點,所以一直為我們所用。其特點如下:

(1)支持1-bit audio DSD錄音格式,音質自然流暢、貼近原聲,與SACD格式相當。忠實錄制原聲且音質十分清晰,錄音接近原聲且空間感優于線性PCM。

(2)支持192kHz/24bit無損壓縮線性PCM錄音格式。清晰度優于錄音的標準格式96kHz/24bit。

(3)其100dB信噪比模式,降低內部噪聲,錄制細小聲音時能達到高清晰度。

(4)采用DSD(直接數字流編碼)編碼技術。DSD是一種前沿編碼技術,常用于SACD。眼下,CD、DVD和電腦聲音等數字音頻使用的仍是PCM格式,而DSD是一種與PCM截然不同的數字音頻格式。不同大小的音頻信號用1-bit數字脈沖集中表示,音質得到進一步提高。DSD格式消除了傳統PCM格式所具有的“數字感”。能讓人們在數字技術下也能聽到模擬技術才還原的音質質感。兼具模擬錄音的流暢度和數字錄音的清晰度。

(5)配備新開發的大直徑定向麥克風,針對DSD錄音格式進行優化。新開發的15毫米直徑麥克風采用駐極體電容麥克風,具有出色的信噪比,可將鳥叫聲等細小聲音如實錄制下來,且不帶多余噪聲。通過細心設計麥克風組件的安裝位置甚至細節的間隙部分,麥克風的內部空間得到優化且達到約31dB/Pa 1KHz的高靈敏度。超過20kHz的頻率特性,可以有效發揮DSD錄音格式的優勢。可通過改變麥克風角度來適應采集聲音所在的區域。例如,當麥克風距離聲源較近時,如單人表演或兩至三人的會議場合,可選擇“X-Y位置”來錄制音頻,如此便能錄制出富有空間感的自然立體聲;對于管弦樂隊、合唱團或其他有很多人表演的大型場所,錄音時可選擇“寬立體聲位置”,如此便能采集到具有廣闊空間感的高保真飽滿聲音(如圖3所示)。

(6)REC音量旋鈕:此裝置可同時調節左聲道和右聲道的錄制音量。可以通過小幅調整左右聲道的差異實現錄音音量水平的調整。

(7)內置內存最多可錄制約10小時50分鐘的DSD格式音頻,可將錄制的音頻復制到存儲卡中并立刻與親友分享。還可使用SD XC存儲卡(48GB 或以上容量)。

3.2 貴瓊語的口語語料的數字化(digitalization)

口語語料的數字化涉及到將所有語言材料轉化成信息化的電子版本。這里面除了音頻及視頻資料外,還包括我們在田野調查過程中所做的所有手寫的記錄。在數字化保存這些數據時我們尤其注意到要將一些重要的信息和電子文件聯系在一起。這些重要的信息叫做元數據“metatdata”。關于語料的元數據格式存在有一些國際標準,我們主要參照的是OLAC(Open Language Archive Community)和 IMDI(ISLE Metadata Initiative) 。

對于我們的每個錄音,我們都至少做到了提及以下信息(Himmelmann 2006:11-12):

(1)錄制章節的題目,這樣可以方便我們在語料庫查找識別這段音頻的對應部分。

(2)錄制的地點和日期。

(3)錄音人的名字和其他在場人姓名(不管其是否參與了對話)。

(4)錄制人姓名及所使用的器材設備。

(5)關于錄音質量的指示(錄音環境、發音人的能力水平等)。

(6)對錄制內容的簡短描述:題目,話語類型——對話、獨白等。

(7)涉及同一內容的不同媒質間的聯系也一并提及出來(比如這段錄音對應的是哪段筆記、哪段對應這個錄音的文本)。

(8)關于這段錄音的詳細的可使用性accessibility。

(9)發音人的社會語言學特性(性別、年齡、出生地、所說語言、受教育程度等)。

(10)如果記錄轉寫錄音的人不是錄制者本人還會提及到轉寫人的社會語言學特性、轉寫的日期和地點( Austin 200:94)。

3.3 貴瓊語的口語語料的分析(analyze)

語料分析這部分是最復雜的,也是最難以預估所需花費時間的部分。Schultze-Berndt (2006?: 216) 估計過1分鐘的錄音根據所想要達到的分析的詳盡程度所花費的時間能從1小時跨度到150小時。為了更好地做語料分析,業內的標準操作是將語料文本以行間注釋(interlineation)的形式來進行呈現。比如一個貴瓊語的例子(表1):

(1)分析數據的第一行是音頻數據的轉寫記錄。轉寫要盡可能忠實地反映錄音里面所講的,包括停頓、錯誤、糾正、重復和其他的音韻細節。我們對貴瓊語的轉寫采用IPA國際音標并遵循貴瓊語的音位系統來書寫。這樣更便于文本被更多的人看懂并會讀。記錄的文本我們也會拿給發音人看。

(2)第二行是語素分解。按照預先分析的最小語義單位來進行劃分,這樣的劃分能分出最小的語義單元(比如組合詞的不同語素)、詞干及其前后綴等。這一行和第三行注釋行(gloss)是緊密聯系的,因為它決定了我們所有需要加注釋的單元。關于注釋學界存在有很多慣例,比如The Leipzig Glossing Rules (Bickel, Comerie & Haspelmath 2004), Lehmann (2005)。我們在第三行采用的就是The Leipzig Glossing Rules的注釋規則,這樣更便于資料的流通和易懂性。

(3)第四-六行是翻譯。一般我們會選擇發音人的所在國家的官方語言首先來進行翻譯,然后再將其翻譯成一門廣泛被識別的語言比如英語,這樣可以讓全世界的人都有機會能讀懂。翻譯我們會先給個字到字的翻譯,第二個翻譯才給出按照官方語言慣用表達翻譯的流暢版。這樣能讓意思更易于理解。

有不少可以用于語料分析的軟件,可以讓我們在一個界面里實現所有信息的整合。歷史最久和最被人使用的多的是Toolbox。這也正是我們在貴瓊語的調查和研究中一直采用的。Toolbox可以允許我們實現文本編輯和對語料進行行間注釋同時能自建一個詞庫。但是這個軟件沒法讓我們實現分析、注釋與音頻、視頻文件的對齊。由荷蘭的心理語言學學院Max Planck開發的軟件ELAN(EUDICO Linguistic Annotator)能實現直接對視頻及音頻文件的注釋。Toolbox和ELAN兩個軟件都可以實現文件輸出成xml格式,這是很多進行語言檔案編制的機構都很推行的文檔格式。

3.4 貴瓊語的口語語料的留存(archive)

傳統的存檔主要集中于具體物件的留存,比如歷史文化、古籍的收藏與保存。現代的技術已經開始顛覆這個領域的傳統概念。許多數字檔案館應運而生,使我們的數據能實現更長期的留存。所有的語言檔案都應該提交數字檔案庫,首先實現短期應用,比如制作語言教材或者是信息再添加補充,以便最終實現長期保存,讓這些語言的錄音可供大家使用即使是這門語言不再有發音者。目前比較有名的語料庫:

(1)The Berkeley Linguistic Archives, University of California, Berkeley

(2)AILLA (Archive of the Indigenous Languages of Latin America), The University of Texas

(3)ELAR (Endangered Languages Archive), University of London

(4)PARADISEC (Pacific And Regional Archive for Digital Sources in Endangered Cultures),The University of Sydney

(5)les archives du LACITO (Langues et Civilisations €?Tradition Orale) du Centre national de recherche scientifique en France. (法國口傳語言及文化實驗室的數據庫)

(6)First Voices Language Archive,Canada

然后這些數據庫都沒有實現我們之前提到的開放存取。經常的狀況是,鑒于各種安全原因而無法通過互聯網進入這些數據庫。其實現在的安全手段可以實現數據庫訪問權限的分級,有了安全的保證也就能更大程度地開放類似的語言數據庫以便更多人使用。比如ELAR就有四種訪問權限的設置:

(1)全公開。

(2)僅對研究人員及說本語言的群體成員開放。

(3)僅對說本語言的群體成員開放。

(4)請求授權才能進入。

我們國家2015年開始啟動的語保工程,在我國提供了語言資源庫存的可能。在這樣大政策的背景下,我們自己的田野調查數據也應當盡可能地按照規范化來留存,以便日后可以更兼容地融入一些大型的數據庫來進行保護,實現資源共享。我們目前在貴瓊語的語語料留存中做到了遵循以下的原則:

(1)使用.XML(Extensible Markup Language)(可擴展標記語言)文件形式來留存。可擴展標記語言XML是一種簡單的數據存儲語言,使用一系列簡單的標記描述數據,而這些標記可以用方便的方式建立,雖然XML占用的空間比二進制數據要占用更多的空間,但XML極其簡單易于掌握和使用。

(2)使用Unicode的字體,以避免不識別出現亂碼的情況。

(3)視頻文件按照無壓縮的 MPEG2形式保存。

(4)音頻文件按照wav格式(44kHz, 16bits)保存。

(5)所有的田野調查紙質筆記也會保存。

(6)所有錄制有數據的CD\DVD及mini-disc也將被保存,多形式多介質的保存錄制資料能最大程度地降低信息丟失的可能性。

3.5 貴瓊語的口語語料的傳播(diffusion)

口傳語言語料收集留存后,其傳播也應當是我們少數民族語言的檔案編制工作中的一個不可忽視的環節。傳統的語言語料傳播的手段有出版專著、語法書、字典、詞匯集、論文集等,雖然也很有用,但是這些出版的作品無法讓人身臨其境地感受到語言的真實性?,F在借助科技的手段,我們可以實現如下的語料傳播模式:(1)提供可交互式語料資源,界面做的簡介、易懂、易查找使用,這樣使用者不會被大量數據所瞬間吞噬而迷失方向。(2)實現語料的網上傳播。將語料放置于互聯網上,即可方便語言學家的查閱,也可利于大眾的了解。但是對于不方便上網的來自村落發音人來說,還是應該為其提供紙質的版本、多媒體媒介的材料(CD-ROM, DVD-ROM)(Csato & Nathan 2003; Morey 2010)。關于貴瓊語的語料傳播,目前我們所做到的有出版發表相關文章,將語料以CD-ROM, DVD-ROM等形式回饋說貴瓊語言群體。

4結論

一個好的語言研究的素材或者資料庫應該具備以下的特征(Woodbury, 2003:12-13) : 多樣(diverse)—語料應該多樣化,比如發音人的不同年齡和性別的變化、話語形式的多樣性(獨白、敘述、對話、多人交談等);大量(large) –現代技術已經能夠允許我們儲存量大的驚人的數據了;持續、共享、充滿機會 (onging, distributed, and opportunistic)–能夠讓參與者/發音者連續地在已有數據庫里加入新數據; 透明易懂(transparent)– 注釋清晰且至少要翻譯成一門大眾語言;可保存的、可攜帶的 (preservable, ethical and portable)– 錄制數據的形式要便于日后隨著技術的發展轉變成新的形式實現可保存課攜帶;和情理(ethical) – 著作權和當地語言群體的意愿都要同時兼顧。針對這些特征檢視我們所做過的工作,會發現還有很多的有待改進的地方,比如缺少大量視頻數據的采集。音頻數據的信息含量要遠遠低于視頻數據。視頻數據能夠讓我們捕捉到語言使用的更多維信息,但是也隨之帶來了處理和分析的復雜性。對視頻的分析處理涉及到復雜軟件的使用,而且視頻資料的存儲需要很大的空間。不過,組合并同步錄制音頻和視頻的方法依然是語言檔案編制所希望的中最理想的方法。在以后的研究調查中,我們盡最大可能地擴大口語交流的數據錄制的種類。隨著技術的發展,數據容量再大也不再是問題。能獲取的語言資料容量越大,越能為我們提供更多的關于語言本身、語言使用及語言發音者相關的信息。

瀕危少數民族語言的檔案編制工作是一項急需我們去著手的工作,同時也是一項紛繁復雜的工作。相關的工作者和研究者務必要在整個語言檔案編制的過程中采取相應的措施以確保做好一個完美的語言檔案庫存工作。

參考文獻

[1] 孫宏開.六江流域的民族語言及其系屬分類.民族學報,1983.3:99-274.

[2] 宋伶俐.貴瓊語研究[M].民族出版社,2011.

[3] BICKEL, B., B. COMRIE ET M. HASPELMATH (2004). The Leipzig Glossing Rules. Conventions for Interlinear Morpheme by Morpheme Glosses, Leipzig, Max Planck Institute for Evolutionary Anthropology.

[4] Croft, William.2003.Typology and universals. 2nd ed. Cambridge: Cambridge University Press, pp. xix-xxv.

[5] CSAT€? €? et D. NATHAN (2003). Spoken Karaim, Institute for the Study of the Languages and Cultures of African and Asia, HRELP, Tokyo University of Foreign Studies, School of Oriental and African Studies.

[6] Jiang, Li. 2015.A grammar of guiqiong : a language of Sichuan. Brill Academic Publishers.

[7] Lehmann,Christian. 1982. "Directions for interlinear morphemic translations". Folia Linguistica 16:199-224.

[8] LEHMANN, C. (2005). Interlinear morphemic glossing , in G. Booij & al., Morphology : An International Handbook on In?ection and Word-Formation, Berlin/New York, Walter de Gruyter, p. 1834-1857.

[9] MOREY, S.D. (2010). Turung : A Variety of Singpho Language Spoken in Assam, Canberra, Paci?c Linguistics.

[10] SCHULTZE-BERNDT, E.(2006). 《Linguistic annotation 》, in J. Gippert, N.P. Himmelmann & U. Mosel (dir.), Essentials of Language Documentation, Berlin/New York, Mouton de Gruyter, p.213-251.

主站蜘蛛池模板: 日韩人妻精品一区| 欧美成人二区| 亚洲综合欧美在线一区在线播放| 亚洲精品无码在线播放网站| 在线观看欧美精品二区| 97影院午夜在线观看视频| 欧美精品v日韩精品v国产精品| 99在线国产| 99在线视频精品| 91福利免费| 特级毛片8级毛片免费观看| 亚洲精品日产AⅤ| 亚洲男人在线天堂| 色婷婷天天综合在线| 午夜日b视频| 亚洲精品高清视频| 免费一级α片在线观看| 日韩在线影院| 国产乱人伦AV在线A| 亚洲国产精品无码AV| 国产精品亚洲五月天高清| 欧美精品H在线播放| 国产91蝌蚪窝| 久久这里只有精品66| 免费又爽又刺激高潮网址| 噜噜噜久久| 国产乱子伦精品视频| 亚洲成年人网| yjizz视频最新网站在线| 真人免费一级毛片一区二区| 国产精品一区在线麻豆| 中国国产高清免费AV片| 日本免费一区视频| 亚洲欧美日韩另类| 制服丝袜国产精品| 国产菊爆视频在线观看| 亚洲Av激情网五月天| 欧美成人区| 欧美日韩理论| 无码一区18禁| 老司国产精品视频91| av尤物免费在线观看| 亚洲中文字幕国产av| 91网在线| 色老头综合网| 国产精品青青| 青青热久免费精品视频6| 国产尤物在线播放| www亚洲天堂| 亚洲一区色| 国产欧美日韩va| 久久免费成人| 亚洲精品第一页不卡| 69av在线| 欧美日本在线观看| 国产精品99在线观看| 国产福利一区视频| 宅男噜噜噜66国产在线观看| 久久久久国产精品免费免费不卡| 久久香蕉欧美精品| 亚洲欧洲综合| 97久久免费视频| 1024国产在线| 中文字幕丝袜一区二区| 欧美午夜视频在线| 精品三级在线| 国产日韩欧美视频| 国产探花在线视频| a毛片在线播放| 亚洲国产精品国自产拍A| 中文一级毛片| 亚洲午夜福利在线| 全部免费特黄特色大片视频| 欧美日韩专区| 97无码免费人妻超级碰碰碰| 国产在线视频导航| 亚洲第一黄片大全| 欧美成人区| 色久综合在线| 日本尹人综合香蕉在线观看| 日韩无码一二三区| 亚洲一区无码在线|