張夙艷 丁 玫
(山東建筑大學(xué) 外國(guó)語(yǔ)學(xué)院,山東 濟(jì)南 250100)
多模態(tài)語(yǔ)料庫(kù)是指視頻、音頻、圖像、文字語(yǔ)料等多種信息進(jìn)行集成整合,使用者運(yùn)用計(jì)算機(jī)通過多模態(tài)方法對(duì)其進(jìn)行加工、檢索、應(yīng)用的大型語(yǔ)料集合[1]。平行語(yǔ)料庫(kù)是由原文文本及其平行對(duì)應(yīng)的譯文文本構(gòu)成的雙語(yǔ)或多語(yǔ)語(yǔ)料庫(kù),其雙語(yǔ)對(duì)應(yīng)程度可有詞級(jí)、句級(jí)和段級(jí)幾種,是機(jī)輔(器)翻譯的核心要素。當(dāng)前,我國(guó)多模態(tài)語(yǔ)料庫(kù)的研究與建設(shè)正處在發(fā)展階段,顧曰國(guó)教授已于2013年建立起包含三個(gè)子庫(kù)(話語(yǔ)活動(dòng)庫(kù)、幼兒成人庫(kù)、網(wǎng)上良師庫(kù))的“SCCSD”多模態(tài)語(yǔ)料庫(kù);2014年,中國(guó)社會(huì)科學(xué)院與北京外國(guó)語(yǔ)大學(xué)聯(lián)手建立了中國(guó)多語(yǔ)言多模態(tài)語(yǔ)料庫(kù)暨大數(shù)據(jù)研究中心,旨在全面推動(dòng)我國(guó)多模態(tài)語(yǔ)料庫(kù)的研創(chuàng)與發(fā)展;上海交通大學(xué)的劉劍自2014年起就開始建設(shè)多模態(tài)口譯平行語(yǔ)料庫(kù),利用跨平臺(tái)多媒體標(biāo)注軟件ELAN對(duì)音頻、視頻語(yǔ)料進(jìn)行切分、多層次標(biāo)注、分析、建檔與檢索,實(shí)現(xiàn)了原文、譯文與對(duì)應(yīng)音頻和視頻的同步呈現(xiàn)[2]。但目前,國(guó)內(nèi)還沒有具有一定影響力的多模態(tài)、多語(yǔ)種的建筑工程平行語(yǔ)料庫(kù),僅有少部分小型建筑工程英漢雙語(yǔ)平行語(yǔ)料庫(kù),建庫(kù)目的是嘗試實(shí)現(xiàn)建筑英語(yǔ)詞匯的在線索引、數(shù)據(jù)共享、檢索、查詢、下載等服務(wù),所需語(yǔ)料庫(kù)技術(shù)主要涉及對(duì)齊、術(shù)語(yǔ)標(biāo)注、檢索與提取[3-4]。這些小型建筑工程語(yǔ)料庫(kù)提供的應(yīng)用遠(yuǎn)遠(yuǎn)無法滿足日益發(fā)展的建筑行業(yè)語(yǔ)言服務(wù)、教學(xué)實(shí)踐及學(xué)術(shù)研究的需求。……