葛艷青 陳兆軍
【摘 要】多模態(tài)語(yǔ)料庫(kù)在多媒體交互技術(shù)支持下收集音頻、視頻等語(yǔ)料,全面記錄語(yǔ)言運(yùn)用的真實(shí)語(yǔ)境,從多個(gè)模態(tài)分析語(yǔ)言在語(yǔ)音、語(yǔ)義、語(yǔ)用等方面的全貌。專(zhuān)門(mén)用途英語(yǔ)小型多模態(tài)語(yǔ)料庫(kù)的提出具有新穎性和必要性,對(duì)專(zhuān)門(mén)用途英語(yǔ)教學(xué)具有改革意義。
【關(guān)鍵詞】多模態(tài)語(yǔ)料庫(kù);專(zhuān)門(mén)用途英語(yǔ);Elan軟件
一、引言
專(zhuān)門(mén)用途英語(yǔ)(English for Specific Purposes, 簡(jiǎn)稱(chēng)ESP),是指與某種特定職業(yè)或?qū)W科相關(guān)的英語(yǔ),當(dāng)前ESP語(yǔ)言分析方法還局限于針對(duì)單一模態(tài)的語(yǔ)言本體的分析與研究,其教學(xué)活動(dòng)還囿于“語(yǔ)法-翻譯”法為主的靜態(tài)的信息輸出模式。[1] 多模態(tài)語(yǔ)料庫(kù)的建設(shè)及相應(yīng)研究已成為語(yǔ)料庫(kù)語(yǔ)言學(xué)的新起之秀,堪稱(chēng)語(yǔ)料庫(kù)的4.0版。[2] 傳統(tǒng)的語(yǔ)料庫(kù)多以文本為語(yǔ)料,多模態(tài)語(yǔ)料庫(kù)不僅具有傳統(tǒng)的文本,更具有音頻、視頻等以多種模態(tài)形式存在的信息,語(yǔ)料中蘊(yùn)含的多種信息為語(yǔ)言教學(xué)及研究提供了豐富的資源。現(xiàn)階段的專(zhuān)門(mén)用途英語(yǔ)語(yǔ)料庫(kù)主要是文字語(yǔ)言單模態(tài)的語(yǔ)料庫(kù),那么構(gòu)建專(zhuān)門(mén)用途英語(yǔ)小型多模態(tài)語(yǔ)料庫(kù),可以完整地記錄下語(yǔ)料的多模態(tài)信息,更好地從多模態(tài)理論視角對(duì)專(zhuān)門(mén)用途英語(yǔ)展開(kāi)研究。
二、專(zhuān)門(mén)用途英語(yǔ)小型多模態(tài)語(yǔ)料庫(kù)的建設(shè)構(gòu)想
專(zhuān)門(mén)用途英語(yǔ)不僅要關(guān)注普通的語(yǔ)料文本,更要關(guān)注相應(yīng)的學(xué)科知識(shí),對(duì)語(yǔ)料庫(kù)研究提出了新的挑戰(zhàn)。當(dāng)代專(zhuān)門(mén)用途英語(yǔ)語(yǔ)料庫(kù)表現(xiàn)出三大發(fā)展趨勢(shì)—語(yǔ)料庫(kù)的專(zhuān)門(mén)/小型化、語(yǔ)料數(shù)據(jù)的(交際)多模態(tài)化和語(yǔ)料庫(kù)的本土化。[3] Sinclair早在2003 年的語(yǔ)料庫(kù)語(yǔ)言學(xué)國(guó)際會(huì)議上指出,大型語(yǔ)料庫(kù)建設(shè)的勢(shì)頭已緩,取而代之的是小型語(yǔ)料庫(kù)。在努力建立超大型的、綜合性的語(yǔ)料庫(kù)的同時(shí),建立更多的、具有專(zhuān)業(yè)性的和相對(duì)較小的ESP語(yǔ)料庫(kù)將是未來(lái)語(yǔ)料庫(kù)語(yǔ)言學(xué)發(fā)展的趨勢(shì)。[4]
(一)確定構(gòu)建的軟件平臺(tái)
多模態(tài)語(yǔ)料庫(kù)的建設(shè)需要借助文本、音視頻等處理技術(shù)和數(shù)據(jù)管理與檢索技術(shù)。言語(yǔ)、手勢(shì)和身體姿勢(shì)等多模態(tài)話語(yǔ)研究均可在ELAN軟件的幫助下完成,此軟件也可適用于多模態(tài)語(yǔ)料庫(kù)建設(shè)。[5] 國(guó)內(nèi)多模態(tài)語(yǔ)料轉(zhuǎn)寫(xiě)與標(biāo)注大多使用ELAN 這款工具。此軟件在話語(yǔ)分析、態(tài)勢(shì)語(yǔ)研究、語(yǔ)言存檔、口語(yǔ)語(yǔ)料庫(kù)建設(shè)等方面被廣泛使用[4]。通過(guò)文獻(xiàn)考察和初步試用,我們認(rèn)為ELAN因具有的特點(diǎn)比較適合用于專(zhuān)門(mén)用途英語(yǔ)多模態(tài)語(yǔ)料庫(kù)建設(shè)。
(二)語(yǔ)料的收集
在確定該語(yǔ)料庫(kù)語(yǔ)料的來(lái)源過(guò)程中,要依據(jù)專(zhuān)門(mén)用途英語(yǔ)的特點(diǎn),要選取具有針對(duì)性、代表本專(zhuān)業(yè)領(lǐng)域英語(yǔ)語(yǔ)言特征的語(yǔ)料,注重不同類(lèi)型語(yǔ)料分布的合理性。要在本專(zhuān)業(yè)領(lǐng)域內(nèi)的英語(yǔ)真實(shí)會(huì)話文獻(xiàn),相關(guān)專(zhuān)業(yè)領(lǐng)域信譽(yù)比較高的專(zhuān)業(yè)教材,盡量覆蓋研究?jī)?nèi)容的各種情況,選取具有代表性的語(yǔ)料。語(yǔ)料的選擇過(guò)程中,要能夠最大限度地反映相關(guān)專(zhuān)業(yè)的語(yǔ)言特征、體現(xiàn)其話語(yǔ)的真實(shí)性。在本專(zhuān)業(yè)領(lǐng)域英語(yǔ)真實(shí)會(huì)話交際中,語(yǔ)料包括專(zhuān)業(yè)教材、工具書(shū)、會(huì)話文獻(xiàn)、專(zhuān)業(yè)論著等材料,它們的分布不同,因此語(yǔ)料的選擇比例也要盡量與專(zhuān)業(yè)化的實(shí)際情況相一致,以便增強(qiáng)專(zhuān)門(mén)用途英語(yǔ)語(yǔ)料的實(shí)用性。例如:具有專(zhuān)業(yè)特征的高頻度詞匯、語(yǔ)篇中的句式、修辭特征等要素的分析,則可以對(duì)本專(zhuān)業(yè)英語(yǔ)句法的構(gòu)成規(guī)則進(jìn)行梳理。
(三)元數(shù)據(jù)的創(chuàng)建
多模態(tài)語(yǔ)料的創(chuàng)建過(guò)程中,通常要根據(jù)研究需要賦予語(yǔ)料一些具體的信息,首先需要確定用于描述語(yǔ)料屬性的元數(shù)據(jù)規(guī)范,將收集到的語(yǔ)料分門(mén)別類(lèi)地打上標(biāo)簽。語(yǔ)料庫(kù)的建設(shè)需要取樣語(yǔ)料具有代表性,話語(yǔ)產(chǎn)生的環(huán)境及說(shuō)話人的背景等信息都會(huì)影響多模態(tài)分析,這些信息就是語(yǔ)料的元數(shù)據(jù)(也稱(chēng)元信息(Meta-data)。針對(duì)專(zhuān)門(mén)用途英語(yǔ)各學(xué)科領(lǐng)域的特點(diǎn),在語(yǔ)料庫(kù)建設(shè)中,既需要標(biāo)記這些語(yǔ)料的共有屬性,也需要針對(duì)每一類(lèi)語(yǔ)料制定其特有屬性。首要要利用工具Arbil創(chuàng)建該語(yǔ)料的元數(shù)據(jù),主要標(biāo)注語(yǔ)料的性質(zhì),主題,時(shí)間,地點(diǎn)、長(zhǎng)度等信息,創(chuàng)建新的元數(shù)據(jù)文件。然后以IMDI保存元數(shù)據(jù)文件。最后,用ELAN等軟件對(duì)特定音頻、視頻語(yǔ)料按著一定的要求進(jìn)行切分與標(biāo)注。
(四)語(yǔ)料的切分與轉(zhuǎn)寫(xiě)
由于多模態(tài)語(yǔ)料庫(kù)的特殊性,語(yǔ)料切分是多模態(tài)語(yǔ)料加工中的一個(gè)難點(diǎn)。ELAN軟件中的切分單位通常是以音頻、視頻中話語(yǔ)的停頓而構(gòu)成的片段為分割。ELAN軟件提供了比較方便的轉(zhuǎn)寫(xiě)界面,軟件會(huì)自動(dòng)播放切分片段的語(yǔ)音,轉(zhuǎn)寫(xiě)人員可以把所聽(tīng)到的內(nèi)容在界面中直接輸入。完成轉(zhuǎn)寫(xiě)后,然后將語(yǔ)料保持并以某種格式(包括Text Grid、TXT等)輸出。然后對(duì)輸出語(yǔ)料進(jìn)行分詞,再重新錄入或?qū)氲紼LAN等軟件中。最后如實(shí)、詳盡地將語(yǔ)音轉(zhuǎn)寫(xiě)為文本,這需要在初步轉(zhuǎn)寫(xiě)少量多類(lèi)型語(yǔ)料的基礎(chǔ)上制定一個(gè)轉(zhuǎn)寫(xiě)規(guī)范,并隨著語(yǔ)料的豐富和轉(zhuǎn)寫(xiě)的深入不斷修訂。
(五)語(yǔ)料的標(biāo)注
在標(biāo)注過(guò)程中應(yīng)特別注意“標(biāo)注集的科學(xué)性和可靠性,盡量避免主觀性和片面性,使語(yǔ)料庫(kù)的標(biāo)注盡可能地反映語(yǔ)言的真實(shí)面貌;特別注意語(yǔ)料庫(kù)標(biāo)注集的標(biāo)準(zhǔn)化和規(guī)范化,提高標(biāo)注結(jié)果的共享程度” [6]。Elan等軟件支持對(duì)音頻和視頻文件的多層標(biāo)注,建設(shè)專(zhuān)門(mén)用途多模態(tài)語(yǔ)料庫(kù)時(shí)可以依據(jù)據(jù)語(yǔ)料庫(kù)的檢索需求設(shè)定詳細(xì)的標(biāo)注信息。
三、結(jié)語(yǔ)
專(zhuān)門(mén)用途英語(yǔ)小型多模態(tài)語(yǔ)料庫(kù)的構(gòu)建,有利于由單模態(tài)向多模態(tài)深化發(fā)展,能夠?qū)崿F(xiàn)和保證語(yǔ)言材料的真實(shí)性,提供大量真實(shí)語(yǔ)境中的真實(shí)會(huì)話、專(zhuān)業(yè)文獻(xiàn)等案例的使用,突出專(zhuān)業(yè)性和實(shí)踐性,為專(zhuān)門(mén)用途英語(yǔ)教學(xué)研究提供了一種新的手段和方法,為學(xué)生個(gè)性化學(xué)習(xí)、碎片化學(xué)習(xí)、探究式學(xué)習(xí)提供資源支持。
【參考文獻(xiàn)】
[1]劉宇. 多模態(tài)話語(yǔ)理論觀照下的專(zhuān)門(mén)用途英語(yǔ)教學(xué)模式研究[J].成都航空職業(yè)技術(shù)學(xué)院學(xué)報(bào),2012(2):32-34.
[2]黃立鶴.語(yǔ)料庫(kù)4.0:多模態(tài)語(yǔ)料庫(kù)建設(shè)及其應(yīng)用[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2015(3):1-7.
[3]黃大崗,秦羿,徐賽穎.專(zhuān)門(mén)用途英語(yǔ)語(yǔ)料庫(kù):挑戰(zhàn)、理?yè)?jù)與愿景[J].寧波大學(xué)學(xué)報(bào)(人文科學(xué)版)2010(5):48-51.
[4]崔維霞,王均松.國(guó)內(nèi)學(xué)科專(zhuān)業(yè)語(yǔ)料庫(kù)研究現(xiàn)狀及發(fā)展趨勢(shì)[J].西安外國(guó)語(yǔ)大學(xué)學(xué)報(bào),2013(1):55-58.
[5]張振虹,何美,韓智.大學(xué)公共英語(yǔ)多模態(tài)語(yǔ)料庫(kù)的構(gòu)建與應(yīng)用[J].山東外語(yǔ)教學(xué),2014(3):5O-55.
[6]馮志偉.語(yǔ)料庫(kù)與計(jì)算語(yǔ)言學(xué)研究叢書(shū)[M].北京:世界圖書(shū)出版公司,2013.