摘要:隨著全球化進(jìn)程的不斷推進(jìn),口譯教學(xué)在新文科視域下扮演著越來(lái)越重要的角色。為了提高口譯教學(xué)的效率和質(zhì)量,自動(dòng)測(cè)評(píng)系統(tǒng)被引入口譯教學(xué)之中。然而,目前大多數(shù)口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)在其工作原理和結(jié)果的解釋方面出現(xiàn)了諸如模型的黑盒化、評(píng)估結(jié)果的不透明及評(píng)分標(biāo)準(zhǔn)的不明確等問(wèn)題。該研究以新文科翻譯學(xué)視角,通過(guò)對(duì)口譯任務(wù)的要素進(jìn)行分析,設(shè)計(jì)了一種可解釋的口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng),并基于人工智能的可解釋理論分析,提出了相應(yīng)的可持續(xù)性優(yōu)化路徑,以提高系統(tǒng)的透明度、可信度和準(zhǔn)確度。
關(guān)鍵詞:可解釋人工智能;新文科翻譯學(xué);口譯教學(xué);自動(dòng)測(cè)評(píng)系統(tǒng)
中圖分類號(hào):G434 文獻(xiàn)標(biāo)識(shí)碼:A
* 本文系2022年度河南省哲學(xué)社會(huì)科學(xué)項(xiàng)目“可解釋人工智能在口譯自動(dòng)測(cè)評(píng)系統(tǒng)建構(gòu)中的應(yīng)用研究”(項(xiàng)目編號(hào):2022BYY023)、2022年度上海市社科規(guī)劃課題“面向突發(fā)公共事件的應(yīng)急語(yǔ)言服務(wù)研究”(課題編號(hào):2022BYY009)階段性研究成果。
在全球化的浪潮中,口譯作為一種高度專業(yè)化的語(yǔ)言技能,其教學(xué)與評(píng)估在新文科視域下的地位和作用日益凸顯。然而,與傳統(tǒng)的書(shū)面翻譯相比,口譯教學(xué)與評(píng)估面臨著更為復(fù)雜的挑戰(zhàn)。口譯不僅要求即時(shí)性和準(zhǔn)確性,還涉及到非語(yǔ)言因素,如語(yǔ)調(diào)、停頓、表達(dá)的自然流暢度等,這些因素都給傳統(tǒng)的人工評(píng)估帶來(lái)了難度。為了應(yīng)對(duì)這些挑戰(zhàn),自動(dòng)測(cè)評(píng)系統(tǒng)應(yīng)運(yùn)而生,并迅速成為輔助口譯教學(xué)和評(píng)估的有力工具。自動(dòng)測(cè)評(píng)系統(tǒng)利用先進(jìn)的語(yǔ)音識(shí)別技能和自然語(yǔ)言處理算法,能夠?qū)谧g的內(nèi)容和形式進(jìn)行快速而準(zhǔn)確的評(píng)分,可以節(jié)省大量的人力成本。因此,引入自動(dòng)測(cè)評(píng)系統(tǒng)成為提高口譯教學(xué)效率和質(zhì)量的必然選擇。
然而,盡管自動(dòng)測(cè)評(píng)系統(tǒng)在實(shí)踐中展現(xiàn)出了一定的潛力,但其在可解釋性方面的不足卻制約了其進(jìn)一步應(yīng)用和發(fā)展。在傳統(tǒng)的口譯教學(xué)中,教師通過(guò)與學(xué)生的面對(duì)面交流和個(gè)性化指導(dǎo)來(lái)提升其口譯水平。而自動(dòng)測(cè)評(píng)系統(tǒng)作為一種人工智能技術(shù)工具,其評(píng)估結(jié)果往往難以被教師和學(xué)生所理解,導(dǎo)致了一定程度上的信任缺失和效果降低,并具有不透明性,常被詬病為黑盒子。2009年保羅˙漢弗萊斯(Paul Humphreys)對(duì)人工智能的不透明性進(jìn)行了分析,認(rèn)為“計(jì)算系統(tǒng)在t時(shí)刻相對(duì)于認(rèn)知主體X不透明,以防X在t時(shí)刻不知道(系統(tǒng))的所有認(rèn)知相關(guān)元素”[1]。據(jù)此可推知,計(jì)算機(jī)系統(tǒng)本身從來(lái)都不是不透明的,只是對(duì)于某個(gè)特定主體而言是不透明的。為了增強(qiáng)用戶對(duì)機(jī)器翻譯的信任度和認(rèn)可度,讓不透明的計(jì)算系統(tǒng)變得透明,需要對(duì)相應(yīng)的算法和原理進(jìn)行合理的解釋和闡釋。由此,可解釋人工智能(Explainable Artificial Intelligence)的概念也在國(guó)內(nèi)外學(xué)者們持續(xù)關(guān)注中開(kāi)始浮出水面。斯沃圖特(William R.Swartout)率先以解決代碼合理性問(wèn)題建議充分解釋人工智能系統(tǒng)行為[2]。米勒(Tim Miller)等將“可解釋性”定義為“展示自己或其他主體做出的決定所依賴的原因”[3]。對(duì)于自動(dòng)測(cè)評(píng)系統(tǒng)可解釋性的研究旨在洞悉深度網(wǎng)絡(luò)內(nèi)部工作機(jī)制、理解模型的決策,扮演人類與深度網(wǎng)絡(luò)模型間的接口角色,幫助人們?nèi)绾螛?gòu)建一個(gè)可解釋的網(wǎng)絡(luò)模型以及模型的輸出是否合理與可靠。針對(duì)口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的可解釋性研究還處于早期階段,主要聚焦自動(dòng)測(cè)評(píng)系統(tǒng)的深度網(wǎng)絡(luò)方面研究。深度網(wǎng)絡(luò)主要是由卷積核、池化層、線性層以及激活算子堆疊而成,其中包含了大量非線性運(yùn)算,難以厘清其中邏輯理路。在已有的可解釋方法中,大致研究角度主要涵蓋事前解釋方法(Intrinsic Explanation)和事后解釋方法(Post-hocExplanation)。事前角度的可解釋性研究主要通過(guò)更改網(wǎng)絡(luò)結(jié)構(gòu)或調(diào)整訓(xùn)練過(guò)程,使網(wǎng)絡(luò)本身具有一定的可解釋性。諸如,Plumb等人在網(wǎng)絡(luò)中加入一個(gè)可解釋的正則器[4],來(lái)提高對(duì)網(wǎng)絡(luò)輸出進(jìn)行歸因的質(zhì)量。Zhang等人在網(wǎng)絡(luò)層次中每個(gè)神經(jīng)元添加一個(gè)損失項(xiàng)來(lái)引導(dǎo)每個(gè)神經(jīng)元學(xué)習(xí)的不同視覺(jué)概念[5]。Li等人在系統(tǒng)的神經(jīng)網(wǎng)絡(luò)中加入一個(gè)原型層[6],收集某一類別中共有的特征原型,測(cè)試圖像的前向傳播過(guò)程類似于人類的推理過(guò)程,若圖中的特征與某一類別的原型的整體相似度高,則該圖像屬于這一類。Huang等人引入塊分割和注意力機(jī)制,設(shè)計(jì)了一種細(xì)粒度分類的可解釋性框架[7],該模型的可解釋性體現(xiàn)在可以給出塊分割圖與顯著性圖。而事后角度的可解釋性研究主要從訓(xùn)練好的模型出發(fā),觀測(cè)網(wǎng)絡(luò)的行為規(guī)律、抽取網(wǎng)絡(luò)邏輯規(guī)則或提取其他人類可解釋的模式。諸如,Zeiler等人通過(guò)反卷積、反池化的方式將網(wǎng)絡(luò)神經(jīng)元輸出的激活至反向映射再至輸入空間,觀測(cè)每個(gè)神經(jīng)元在關(guān)注的圖像中的特征,網(wǎng)絡(luò)的淺層更關(guān)注圖像的角、邊緣等特征,而高層次更關(guān)注于更具有區(qū)分性的全局特征[8]。
綜上可見(jiàn),自動(dòng)測(cè)評(píng)系統(tǒng)的出現(xiàn),為口譯教學(xué)帶來(lái)了革命性的變革。然而,如何確保自動(dòng)測(cè)評(píng)系統(tǒng)在評(píng)估過(guò)程中的透明度和公正性,成為了研究者關(guān)注的焦點(diǎn)。為厘清人工智能技術(shù)與口譯教學(xué)測(cè)評(píng)手段跨學(xué)科交叉融合的理路,本研究以新文科翻譯學(xué)的視角研究口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的可解釋性問(wèn)題,旨在通過(guò)深入分析系統(tǒng)構(gòu)建的各個(gè)環(huán)節(jié)以及評(píng)估結(jié)果的表現(xiàn)形式,力求找到解決方案,以提高系統(tǒng)的可用性和可信度。
人工智能技術(shù)的突飛猛進(jìn)極大推動(dòng)了翻譯行業(yè)的發(fā)展,催生了翻譯記憶、術(shù)語(yǔ)管理、神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯等一大批新技術(shù),引發(fā)了翻譯生產(chǎn)模式的劃時(shí)代變革[9]。新文科視域下翻譯學(xué)科的創(chuàng)新發(fā)展可以稱之為“新文科翻譯學(xué)”(New Liberal Arts Translation Studies),其概念主要源于王立非等于2022年提出的“新文科語(yǔ)言學(xué)”(New Liberal Arts Linguistics)發(fā)展構(gòu)想[10],是立足于中國(guó)維度、聚焦當(dāng)前新時(shí)代國(guó)際傳播語(yǔ)言服務(wù)問(wèn)題而提出的中國(guó)模式解決方案。傳統(tǒng)翻譯學(xué)的研究主要關(guān)注人類語(yǔ)言的詞匯、語(yǔ)法、語(yǔ)用等基礎(chǔ)語(yǔ)言單元和規(guī)則,而新文科翻譯學(xué)則更注重現(xiàn)代科技環(huán)境下的翻譯問(wèn)題,例如機(jī)器翻譯、自然語(yǔ)言處理等方面的翻譯問(wèn)題,其內(nèi)容涵蓋了語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、人工智能、心理學(xué)等多個(gè)領(lǐng)域的知識(shí)、前沿技術(shù)與方法。可以說(shuō),新文科翻譯學(xué)的構(gòu)想具有深刻的歷史和時(shí)代背景,并隨著人工智能技術(shù)的發(fā)展和應(yīng)用,在很大程度上引領(lǐng)了翻譯學(xué)邁向智能化時(shí)代,已經(jīng)日益覆蓋到外語(yǔ)學(xué)術(shù)體系建設(shè)、翻譯教學(xué)和翻譯測(cè)評(píng)領(lǐng)域,涵蓋了不同領(lǐng)域中有關(guān)機(jī)器學(xué)習(xí)算法可解釋性的研究,具有“文化性、生成性、跨學(xué)科性及社會(huì)性特征”[11]。由此推知,新文科翻譯學(xué)要求口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的建構(gòu)應(yīng)考慮語(yǔ)言學(xué)、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、評(píng)估標(biāo)準(zhǔn)等多個(gè)方面的要求,以實(shí)現(xiàn)口譯教學(xué)質(zhì)量的自動(dòng)評(píng)估和可解釋反饋。因?yàn)槠淇山忉屝圆蛔悴粌H會(huì)影響系統(tǒng)的應(yīng)用效果,也限制了對(duì)口譯教學(xué)過(guò)程的深入理解和改進(jìn),具體表現(xiàn)為如下幾個(gè)方面:
(一)模型的黑盒化問(wèn)題
口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的算法往往被視為黑盒,即用戶無(wú)法了解系統(tǒng)內(nèi)部的工作原理和決策過(guò)程。這種算法黑盒化使得教師和學(xué)生難以對(duì)系統(tǒng)的評(píng)估過(guò)程進(jìn)行監(jiān)督和驗(yàn)證,無(wú)法確定評(píng)分是否合理和可信。算法黑盒化也增加了系統(tǒng)的不可解釋性和不可信度。在口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的運(yùn)作過(guò)程中,首先需要對(duì)學(xué)生的口譯錄音進(jìn)行語(yǔ)音識(shí)別,將其轉(zhuǎn)換為文本數(shù)據(jù)。隨后,系統(tǒng)會(huì)分析這些文本數(shù)據(jù)中的多種語(yǔ)言特征,如詞匯的準(zhǔn)確性、語(yǔ)法結(jié)構(gòu)的復(fù)雜性、句子的連貫性等。此外,一些高級(jí)的自動(dòng)測(cè)評(píng)系統(tǒng)還能夠評(píng)價(jià)非語(yǔ)言特征,例如語(yǔ)調(diào)、停頓的適當(dāng)性以及表達(dá)的自然流暢度等。通過(guò)這些分析,系統(tǒng)能夠給出一個(gè)綜合評(píng)分,以此來(lái)反映學(xué)生的口譯能力。盡管自動(dòng)測(cè)評(píng)系統(tǒng)在技術(shù)上取得了顯著的進(jìn)步,但它們?cè)趯?shí)際運(yùn)用中仍面臨著一系列的挑戰(zhàn)。其中最為關(guān)鍵的挑戰(zhàn)之一便是如何確保評(píng)分的公正性和透明性。由于當(dāng)前大多數(shù)口譯自動(dòng)測(cè)評(píng)系統(tǒng)所采用的機(jī)器學(xué)習(xí)算法往往是黑箱模型,難以解釋其內(nèi)部的決策邏輯和評(píng)估過(guò)程,直接導(dǎo)致了師生對(duì)系統(tǒng)的信任度降低,影響其使用體驗(yàn)和接受程度。
(二)評(píng)估結(jié)果的不透明問(wèn)題
口譯教學(xué)自動(dòng)評(píng)分系統(tǒng)的評(píng)分過(guò)程往往被認(rèn)為缺乏透明度,即用戶難以理解系統(tǒng)是如何得出評(píng)分結(jié)果的。這主要源于系統(tǒng)內(nèi)部算法和模型的復(fù)雜性,用戶往往無(wú)法準(zhǔn)確把握評(píng)分的具體依據(jù)。另外,數(shù)據(jù)質(zhì)量和標(biāo)注偏差也會(huì)影響口譯教學(xué)評(píng)估結(jié)果的可解性。如果系統(tǒng)訓(xùn)練數(shù)據(jù)的質(zhì)量不高或存在標(biāo)注偏差,那么系統(tǒng)學(xué)習(xí)到的模式和規(guī)律可能不準(zhǔn)確或不全面,導(dǎo)致評(píng)分結(jié)果的不確定性和不可信度。口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的評(píng)估結(jié)果通常以分?jǐn)?shù)或等級(jí)的形式呈現(xiàn),但系統(tǒng)很少提供詳細(xì)的解釋或反饋,使得教師和學(xué)生難以理解評(píng)估結(jié)果的具體含義和背后的原因。這給教學(xué)和學(xué)習(xí)過(guò)程中的改進(jìn)提出了挑戰(zhàn)。
(三)評(píng)估標(biāo)準(zhǔn)的不明確問(wèn)題
口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的評(píng)估標(biāo)準(zhǔn)往往是模糊的,反饋過(guò)于晦澀或抽象,缺乏明確的定義和解釋。學(xué)生難以理解口譯表現(xiàn)的“優(yōu)秀”“良好”和“不足”,無(wú)法根據(jù)評(píng)估標(biāo)準(zhǔn)來(lái)有針對(duì)性地改進(jìn)口譯技能。另外,口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)在評(píng)分過(guò)程中往往忽略了文化和語(yǔ)境因素的影響,導(dǎo)致評(píng)分結(jié)果缺乏準(zhǔn)確性和客觀性。口譯涉及到不同語(yǔ)言和文化之間的轉(zhuǎn)換,而不同文化背景下的表達(dá)方式和習(xí)慣可能存在差異,這些差異沒(méi)有被充分考慮可能導(dǎo)致評(píng)分偏頗或不公正。
以上這些可解釋性問(wèn)題嚴(yán)重影響了口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的應(yīng)用和推廣。缺乏對(duì)評(píng)估過(guò)程和結(jié)果的清晰解釋,使得教師和學(xué)生難以接受系統(tǒng)的評(píng)估結(jié)果,也無(wú)法根據(jù)評(píng)估結(jié)果進(jìn)行有效的教學(xué)和學(xué)習(xí)。由此,基于新文科翻譯學(xué)的理論框架,嘗試構(gòu)建具有可解釋性的口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)是當(dāng)前研究和實(shí)踐中的重要任務(wù)之一。
新文科視域的涌現(xiàn)為口譯教學(xué)帶來(lái)了新的理論和方法,強(qiáng)調(diào)跨學(xué)科的整合和創(chuàng)新。這意味著口譯自動(dòng)測(cè)評(píng)系統(tǒng)的建構(gòu)不僅需要考慮評(píng)估模型的準(zhǔn)確性和效率,還需要關(guān)注其可解釋性問(wèn)題。口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)不僅是一個(gè)技術(shù)工具,更是一個(gè)教學(xué)輔助平臺(tái),應(yīng)該與口譯教學(xué)的理論和實(shí)踐密切結(jié)合,為教師和學(xué)生提供個(gè)性化的支持和指導(dǎo)。因此,在構(gòu)建口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)時(shí),必須充分考慮新文科視域的要求,注重跨學(xué)科的整合和創(chuàng)新,以實(shí)現(xiàn)口譯教學(xué)的現(xiàn)代化和智能化。
(一)口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的理論框架
口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的建構(gòu)是一個(gè)復(fù)雜而系統(tǒng)的過(guò)程,涉及到測(cè)評(píng)每個(gè)環(huán)節(jié)和技術(shù)手段的綜合運(yùn)用。在新文科視域下,構(gòu)建一個(gè)具有可解釋性的口譯教學(xué)自動(dòng)評(píng)分映射模型至關(guān)重要,需要充分考慮到語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)以及教育學(xué)等領(lǐng)域的理論與實(shí)踐結(jié)合,同時(shí)關(guān)注人工智能技術(shù)與口譯測(cè)評(píng)手段融合過(guò)程的透明度和可解釋性,進(jìn)而形成基于人工智能的口譯自動(dòng)評(píng)分系統(tǒng)構(gòu)念圖。整體設(shè)計(jì)思路如圖1所示。
首先,參照相關(guān)研究成果及標(biāo)準(zhǔn)確定口譯測(cè)評(píng)系統(tǒng)的評(píng)分參數(shù),包括詞匯、句法和邏輯、音段和超音段層面特征。針對(duì)音段和超音段層面,采用語(yǔ)音自動(dòng)測(cè)評(píng)方法以及HMM技術(shù)獲得考生的語(yǔ)音特征值;針對(duì)詞匯層面,采用關(guān)鍵詞覆蓋率、N元組提取、PageRank算法、文本覆蓋率等方式獲取考生譯文的關(guān)鍵詞、術(shù)語(yǔ)、語(yǔ)義相似度、銜接性情況;針對(duì)句法和邏輯層面,采用FDG、Chart-based parser等語(yǔ)法分析工具對(duì)考生譯文的語(yǔ)法完整性進(jìn)行分析;借助LISP等邏輯編程語(yǔ)言,對(duì)譯文中的命題邏輯及謂詞邏輯情況進(jìn)行考察。其次,借助人工神經(jīng)網(wǎng)絡(luò)技術(shù)以及深度學(xué)習(xí)對(duì)機(jī)器進(jìn)行訓(xùn)練。最后,采用描述性分析和相關(guān)性分析方法測(cè)試并修正口譯測(cè)評(píng)系統(tǒng)。尤其在確定口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)參數(shù)方面,包括如下兩個(gè)層面特征:
(1)音段和超音段層面特征。構(gòu)建由多名專業(yè)譯員錄制的參考答案語(yǔ)音語(yǔ)料庫(kù)。交傳、同傳語(yǔ)料分別采用單聲道和雙聲道錄制,以mp3格式保存,能夠體現(xiàn)專業(yè)譯員對(duì)流利度、重音、節(jié)奏等音段和超音段、同步性等層面的準(zhǔn)確把握。此外,收集由考生考試現(xiàn)場(chǎng)錄音組成的語(yǔ)料,并統(tǒng)計(jì)考生的成績(jī)分布情況。提取語(yǔ)音特征并構(gòu)建語(yǔ)音模型。采用MFCC(Mel-Frequency Ceptral Coefficients)特征參數(shù)與PLP(Perceptual Linear Predictive)特征參數(shù),分別用在考生的語(yǔ)音識(shí)別以及評(píng)估模型的構(gòu)建方面。基于HMM模型(Hidden Markov Model)的概率統(tǒng)計(jì)法構(gòu)建讀音模型,作為口譯評(píng)分映射指標(biāo)之一,旨在判斷不同考生的語(yǔ)音在音段和超音段層面的差異,以此來(lái)評(píng)價(jià)考生的語(yǔ)音情況。此外,采用音素后驗(yàn)概率法內(nèi)置標(biāo)準(zhǔn)語(yǔ)音庫(kù)(基于標(biāo)準(zhǔn)語(yǔ)音數(shù)據(jù)訓(xùn)練獲得的標(biāo)準(zhǔn)語(yǔ)音模型)。根據(jù)范文裁剪后的定制語(yǔ)言模型進(jìn)行連續(xù)語(yǔ)音識(shí)別,利用二元語(yǔ)言模型對(duì)識(shí)別結(jié)果予以解碼,得到最大似然序列。

(2)詞匯、語(yǔ)義、句法和邏輯層面特征。將關(guān)鍵詞、術(shù)語(yǔ)和銜接詞等的覆蓋率、語(yǔ)義相似度、句法和邏輯結(jié)構(gòu)等維度評(píng)分特征,輸入到專家評(píng)分映射模型中作為技術(shù)模型,采用線性映射方法,對(duì)人工標(biāo)注評(píng)分的數(shù)據(jù)庫(kù)訓(xùn)練,以便為最終自動(dòng)評(píng)分提供準(zhǔn)備。關(guān)鍵詞、語(yǔ)義相似度、術(shù)語(yǔ)和銜接詞等維度評(píng)分特征輸入,由專業(yè)譯員標(biāo)注參考答案中涉及的關(guān)鍵詞集以及術(shù)語(yǔ)的多種表達(dá)方式,并生成詞圖。同時(shí),將原文各句劃分為2—3個(gè)語(yǔ)義單位,對(duì)照多篇最佳譯文中的N元組提取(N元組匹配數(shù)量及其百分比),考察譯文語(yǔ)義質(zhì)量。關(guān)鍵詞對(duì)齊數(shù)量,可借助詞典的詞對(duì)齊及模糊匹配的方法;對(duì)于考生出現(xiàn)的用自己的語(yǔ)言繞過(guò)關(guān)鍵詞進(jìn)行表達(dá)的情況,可通過(guò)文本覆蓋率的方法處理,以便對(duì)關(guān)鍵詞等覆蓋率進(jìn)行考察。針對(duì)銜接詞,構(gòu)建考生譯文的詞圖,借助PageRank算法計(jì)算基于權(quán)重的詞匯銜接,形成WLC以及依賴詞性的PWLC(post-WLC)詞匯銜接評(píng)價(jià)方法。針對(duì)句法和邏輯結(jié)構(gòu)評(píng)分特征輸入,則主要對(duì)譯文進(jìn)行完整的語(yǔ)法分析,并借助于FDG、Chart-based parser等語(yǔ)法分析工具對(duì)此進(jìn)行處理。而邏輯編程語(yǔ)言,如LISP則通過(guò)命題邏輯以及謂詞邏輯的方法對(duì)自然語(yǔ)言予以分析處理。
(二)口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的評(píng)分理?yè)?jù)
口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的評(píng)分過(guò)程是基于口譯的準(zhǔn)確性、完整性、流暢性、文化適應(yīng)性等多方面進(jìn)行綜合評(píng)估的。通過(guò)這些準(zhǔn)則,系統(tǒng)主要采用語(yǔ)音自動(dòng)測(cè)評(píng)方法以及HMM技術(shù)獲得考生的語(yǔ)音特征值,與專業(yè)譯員的語(yǔ)音進(jìn)行聲學(xué)差距對(duì)比。同時(shí),基于人工智能相關(guān)技術(shù)構(gòu)建口譯評(píng)分映射模型,并不斷訓(xùn)練,從多維層面全面、客觀評(píng)價(jià)考生的口譯水平。如圖2所示。
首先,構(gòu)建專業(yè)譯員語(yǔ)料庫(kù),并通過(guò)PLP、MFCC特征參數(shù)提取其發(fā)音特征,以便訓(xùn)練發(fā)音模型。隨后,通過(guò)識(shí)別端導(dǎo)入考生口譯待測(cè)語(yǔ)音,并進(jìn)行預(yù)處理,形成考生語(yǔ)音語(yǔ)料庫(kù)。提取相關(guān)特征并預(yù)處理后,計(jì)算機(jī)能夠自動(dòng)分析出考生與專業(yè)譯員發(fā)音的聲學(xué)差距。同時(shí),提取關(guān)鍵詞、術(shù)語(yǔ)和銜接詞等的覆蓋率、語(yǔ)義相似度、句法和邏輯結(jié)構(gòu)等維度特征,形成專家評(píng)分映射模型,不斷訓(xùn)練人工標(biāo)注評(píng)分?jǐn)?shù)據(jù)庫(kù),自動(dòng)獲得最終得分(詞匯、句法和邏輯、音段和超音段層面的分?jǐn)?shù)合計(jì))。
(三)可解釋口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的構(gòu)建
1.模型構(gòu)建
設(shè)計(jì)一個(gè)可解釋的口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)模型,需要考慮到口譯的核心要素和評(píng)估標(biāo)準(zhǔn),同時(shí)確保系統(tǒng)的可解釋性。主要針對(duì)上述關(guān)于自動(dòng)測(cè)評(píng)系統(tǒng)的模型黑盒化、評(píng)估結(jié)果不透明及評(píng)估標(biāo)準(zhǔn)不明確問(wèn)題構(gòu)建了可解釋口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)。如下頁(yè)圖3所示:可解釋口譯教學(xué)自動(dòng)測(cè)評(píng)模型主要涵蓋輸入、處理及輸出三個(gè)模塊。其中,在輸入模塊選用了語(yǔ)音和文本同步輸入的正則器嵌入技術(shù),便于追溯到評(píng)估結(jié)果的產(chǎn)生過(guò)程,包括使用了哪些數(shù)據(jù)、哪些特征、哪些模型和算法等。在處理模塊主要添加一個(gè)損失項(xiàng)來(lái)引導(dǎo)神經(jīng)元學(xué)習(xí)的不同視覺(jué)概念,考慮多個(gè)方面的口譯表現(xiàn)評(píng)估,包括語(yǔ)音語(yǔ)調(diào)、詞匯運(yùn)用、語(yǔ)法準(zhǔn)確性等,以全面評(píng)估學(xué)習(xí)者的口譯能力,尤其是語(yǔ)音降噪技術(shù)與口譯測(cè)評(píng)手段的結(jié)合,使得評(píng)估過(guò)程能夠成為口譯教學(xué)的一部分,促進(jìn)學(xué)習(xí)者的有效學(xué)習(xí)和提高口譯能力。在輸出模塊主要嵌入了反卷積、反池化的可解釋技術(shù),以成績(jī)展示和糾正展示提供及時(shí)有效的反饋機(jī)制,便于幫助學(xué)習(xí)者了解自己的口譯表現(xiàn),指出表現(xiàn)中存在的問(wèn)題,并提供改進(jìn)建議。
2.數(shù)據(jù)集構(gòu)建
在英語(yǔ)基礎(chǔ)口譯教學(xué)成績(jī)單中,選出1 5 8條記錄,每條記錄中選擇ECSentence Interpretation1—5的音頻文件作為訓(xùn)練數(shù)據(jù),共有158*5=790條音頻數(shù)據(jù)。在成績(jī)單中得分呈現(xiàn)離散分布:0,0.25, 0.5,0.75,1,1.25,1.75,2,2.25,2.5,2.75,3共13個(gè)類別。接著,將音頻轉(zhuǎn)換成聲波圖形,圖像分辨率統(tǒng)一為640*640。為了能夠更加準(zhǔn)確提取波形特征,使用OPENCV(這是一個(gè)常用圖像處理模塊)對(duì)圖像進(jìn)一步處理提取邊界特征,然后生成數(shù)據(jù)標(biāo)簽。每行標(biāo)簽記錄分為兩部分組成:第一部分為圖片文件名,文件命名由記錄序號(hào)和題目序號(hào)組成,這里得分是類別序號(hào),從0—12分別對(duì)應(yīng)實(shí)際得分0—3,每個(gè)臨近類型相差0.25分。標(biāo)簽數(shù)據(jù)記錄保存到train.txt中,從原始數(shù)據(jù)抽取100個(gè)數(shù)據(jù)作為驗(yàn)證數(shù)據(jù),保存驗(yàn)證標(biāo)簽數(shù)據(jù)到valid.txt中。
3.模型訓(xùn)練

在訓(xùn)練模型前,首先需要打亂標(biāo)簽記錄順序,從中一次取出8個(gè)記錄,輸入模型,模型通過(guò)運(yùn)算后得到預(yù)測(cè)值,直到790個(gè)數(shù)據(jù)全部計(jì)算完成,使用損失函數(shù)計(jì)算預(yù)測(cè)值與真實(shí)值之間的誤差,則模型會(huì)自動(dòng)朝著使誤差較小的方向進(jìn)行調(diào)整,最終實(shí)現(xiàn)盡可能多地滿足預(yù)測(cè)值,這個(gè)過(guò)程就是模型反向傳播。模型經(jīng)過(guò)第一次自動(dòng)調(diào)整后,再去在驗(yàn)證數(shù)據(jù)集上使用,可以等到一個(gè)預(yù)測(cè)正確的概率。這樣就完成一輪數(shù)據(jù)運(yùn)算,也叫一個(gè)epoch。整個(gè)訓(xùn)練過(guò)程進(jìn)行了90個(gè)epoch運(yùn)算,每經(jīng)過(guò)20個(gè)epoch,模型反向傳播的幅度(也叫學(xué)習(xí)率)變成原來(lái)的1/10,這就是朝著正確方向更新的幅度減小,之所以這樣,是因?yàn)殡S著計(jì)算的進(jìn)行,模型會(huì)逐漸朝著最正確的方向進(jìn)行,在越接近正確值時(shí),速度要降低一些,否則就容易更新趨于絕對(duì)化,會(huì)相應(yīng)得出一個(gè)效果不理想的值。在每個(gè)epoch運(yùn)算完成后,就用驗(yàn)證值檢查一個(gè)正確率,如果正確率比上次高,就把模型記錄到一個(gè)best.pt文件中,如果正確率下降,就直接略過(guò),依此循環(huán)反復(fù),經(jīng)過(guò)90個(gè)epoch之后,把正確率最高的模型保存下來(lái),由此,可以初步獲得一種可解釋口譯教學(xué)自動(dòng)測(cè)評(píng)映射模型。
4.實(shí)驗(yàn)結(jié)果與分析
如圖4所示,通過(guò)使用best.pt模型文件,對(duì)整個(gè)數(shù)據(jù)集中790數(shù)據(jù)進(jìn)行預(yù)測(cè),其中,有752個(gè)圓點(diǎn)與曲線重合,表明模型的預(yù)測(cè)正確率達(dá)到了95.18%,具有較高的準(zhǔn)確度,同時(shí)又以文本可視化進(jìn)行了解釋反饋,與預(yù)期構(gòu)建目標(biāo)基本達(dá)成了一致性。
實(shí)驗(yàn)結(jié)果表明:(1)該系統(tǒng)基于新文科翻譯學(xué)的理論框架,能夠?qū)谧g表現(xiàn)進(jìn)行解釋,包括口譯中的語(yǔ)法結(jié)構(gòu)、語(yǔ)義表達(dá)、語(yǔ)用特點(diǎn)等情況給予反饋,通過(guò)解釋系統(tǒng)對(duì)這些語(yǔ)言現(xiàn)象的識(shí)別和分析過(guò)程,可以較好解決模型的黑盒化問(wèn)題,增加系統(tǒng)評(píng)估結(jié)果的可信度和可理解性;(2)系統(tǒng)能夠利用語(yǔ)言知識(shí)和自然語(yǔ)言處理技術(shù)對(duì)口譯文本進(jìn)行分析,并將分析結(jié)果轉(zhuǎn)化為最終的評(píng)分和反饋,通過(guò)透明的評(píng)估過(guò)程能夠較好解決評(píng)估結(jié)果的不透明問(wèn)題,便于更好地理解系統(tǒng)的工作原理和評(píng)估結(jié)果的可信度;(3)系統(tǒng)的評(píng)分標(biāo)準(zhǔn)能夠被解釋和理解,反映新文科翻譯學(xué)的觀點(diǎn)和原則,已經(jīng)包括評(píng)估口譯質(zhì)量所考慮的準(zhǔn)確度、流暢度、表達(dá)能力等關(guān)鍵因素,能夠較好解決評(píng)分標(biāo)準(zhǔn)的不明確問(wèn)題。
在新文科翻譯學(xué)視域下,對(duì)口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的可解釋性分析需要更加注重系統(tǒng)的理論框架與語(yǔ)言現(xiàn)象解釋、評(píng)分標(biāo)準(zhǔn)的解釋與建構(gòu)、評(píng)估過(guò)程的透明性以及反饋信息的解釋和指導(dǎo)等方面,以適應(yīng)復(fù)雜多變的社會(huì)需求和跨文化交流挑戰(zhàn),也相應(yīng)形成了多學(xué)科融合、符號(hào)主義與連接主義結(jié)合及多模態(tài)數(shù)據(jù)處理技術(shù)整合的可解釋分析理論依據(jù)。
(一)多學(xué)科融合的可解釋分析


基于算法的復(fù)雜度導(dǎo)致的模型黑盒化問(wèn)題,上述系統(tǒng)考慮到利用語(yǔ)言學(xué)知識(shí)、自然語(yǔ)言處理技術(shù)及學(xué)習(xí)者的認(rèn)知心理對(duì)口譯文本進(jìn)行分析,基于新文科翻譯學(xué)的學(xué)科交叉融合特征,主要是借鑒解釋學(xué)理論和方法,深入探討可解釋性在口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)模型中的應(yīng)用,提高其模型的解釋性和可理解性,使可解釋人工智能技術(shù)更加接近人類表達(dá)和思考方式。口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的解釋性可以分別從認(rèn)知心理學(xué)、哲學(xué)和計(jì)算機(jī)科學(xué)的多學(xué)科融合視角進(jìn)行闡釋。諸如:解釋性的理論基礎(chǔ)起源于認(rèn)知心理學(xué)。其中,人類的認(rèn)知系統(tǒng)是一個(gè)有機(jī)的整體,單獨(dú)的思考方面難以對(duì)整個(gè)人類認(rèn)知系統(tǒng)做出有效的描述。人類認(rèn)知過(guò)程中,通過(guò)感知到的信息和知識(shí)體系進(jìn)行思考、發(fā)現(xiàn)和理解新信息。因此,了解人類認(rèn)知心理學(xué)對(duì)于設(shè)計(jì)并使口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)有較好的可解釋性是至關(guān)重要的。而解釋學(xué)作為哲學(xué)范疇,強(qiáng)調(diào)了解和表達(dá)人類理解力和創(chuàng)造力、思考人類認(rèn)為是真理和價(jià)值觀的方式。從傳統(tǒng)的哲學(xué)思考到現(xiàn)代哲學(xué)研究,解釋學(xué)對(duì)于文化、社會(huì)、自然科學(xué)等領(lǐng)域均有深刻的影響。另外,以機(jī)器學(xué)習(xí)和人工智能為代表的計(jì)算機(jī)科學(xué),也為口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的可解釋性研究與應(yīng)用提供了理論基礎(chǔ)和技術(shù)支持。機(jī)器學(xué)習(xí)和人工智能通過(guò)把具有經(jīng)驗(yàn)性質(zhì)的信息數(shù)據(jù)提供給計(jì)算Fw3i3aKcEvc7a7fanENSSRM8lBvjPcOJouxowhbhLcU=機(jī)來(lái)實(shí)現(xiàn)模式的識(shí)別和處理。這些技術(shù)研究的結(jié)果可應(yīng)用于解釋模型決策過(guò)程中的不透明性。同時(shí),計(jì)算機(jī)科學(xué)中的交互式技術(shù),如可視化和對(duì)話機(jī)制,也允許用戶更好地理解和控制口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)。
(二)符號(hào)主義與連接主義相結(jié)合的可解釋分析
基于標(biāo)注偏差和數(shù)據(jù)質(zhì)量導(dǎo)致的評(píng)分結(jié)果不透明問(wèn)題,上述口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)主要利用符號(hào)主義與連接主義相結(jié)合的自然語(yǔ)言處理技術(shù),以處理口譯文本的語(yǔ)言特征、語(yǔ)法結(jié)構(gòu)和語(yǔ)義信息。包括分詞、詞性標(biāo)注、句法分析、語(yǔ)義分析等技術(shù),以便能夠準(zhǔn)確理解口譯文本的含義和表達(dá)方式,從而進(jìn)行評(píng)估和反饋。基于新文科翻譯學(xué)的生成性特征,重視自然語(yǔ)言處理中語(yǔ)境和語(yǔ)義的復(fù)雜性,從而在開(kāi)發(fā)可解釋的AI算法時(shí)主動(dòng)考慮語(yǔ)言和文化的多元性,符號(hào)主義(Symbolism)與連接主義(Connectionism)相結(jié)合的技術(shù)語(yǔ)言識(shí)別性,這樣可以提高人工智能技術(shù)在各種不同地理、社會(huì)和文化背景下的應(yīng)用效果,更好地服務(wù)于不同用戶群體。其中,符號(hào)主義認(rèn)為語(yǔ)言是由離散的符號(hào)組成的,這些符號(hào)具有固定的意義和組合規(guī)則。利用形式語(yǔ)言學(xué)和邏輯學(xué)方法來(lái)研究語(yǔ)言的本質(zhì),從而實(shí)現(xiàn)人工智能在自然語(yǔ)言處理方面的應(yīng)用。符號(hào)主義的一大優(yōu)點(diǎn)是可以理解和解釋人類語(yǔ)言使用的規(guī)則,但它也存在一個(gè)難題,就是難以處理語(yǔ)言的模糊性和多義性。而連接主義則認(rèn)為語(yǔ)言是由神經(jīng)元之間的連接關(guān)系組成的。神經(jīng)網(wǎng)絡(luò)可以通過(guò)海量的語(yǔ)料庫(kù)學(xué)得語(yǔ)言規(guī)律和語(yǔ)義聯(lián)想,從而實(shí)現(xiàn)自然語(yǔ)言處理。連接主義的優(yōu)點(diǎn)在于能夠處理多義性和模糊性等語(yǔ)言特征,但它也很難解釋語(yǔ)言內(nèi)部的規(guī)則和邏輯。
(三)多模態(tài)數(shù)據(jù)處理技術(shù)整合的可解釋分析
基于語(yǔ)言文化差異性導(dǎo)致的評(píng)分標(biāo)準(zhǔn)不明確問(wèn)題,上述口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)主要通過(guò)整合多模態(tài)數(shù)據(jù)處理技術(shù),對(duì)口譯學(xué)習(xí)者的口譯表現(xiàn)進(jìn)行全面評(píng)估,同時(shí)提升系統(tǒng)的透明度。事實(shí)上,可解釋的多模態(tài)處理技術(shù)法已在多個(gè)領(lǐng)域的研究和應(yīng)用中得到了佐證。諸如,學(xué)者朱富坤等探討了關(guān)鍵數(shù)據(jù)路由路徑(Critical Data Routing Path,CDRP)這一面向網(wǎng)絡(luò)路徑的可解釋方法,實(shí)驗(yàn)結(jié)果從路徑熱力圖可視化以及相應(yīng)的預(yù)測(cè)與定位精度等角度驗(yàn)證了Score-CDRP方法相較于CDRP的合理性、有效性和魯棒性[12]。盧宇等研究梳理和提出了可解釋人工智能在微觀、中觀和宏觀三個(gè)層面的教育應(yīng)用模式,即檢驗(yàn)教育模型、輔助理解系統(tǒng)與支持教育決策[13]。王文杰等提出了一種基于理性情感的評(píng)論情感分析算法及可解釋性研究[14]。該方法利用情感理性分析和多標(biāo)簽學(xué)習(xí)的思想,構(gòu)建了一個(gè)基于規(guī)則的理性情感分析模型,從多種角度解釋了該方法分析情感的過(guò)程,提高了情感分析模型的可解釋性。學(xué)者吳文梅以釋意派的口譯三角模式為基礎(chǔ),以“口譯過(guò)程兩階段解讀”為參照,借鑒認(rèn)知心理學(xué)與心理語(yǔ)言學(xué)關(guān)于語(yǔ)言與語(yǔ)言表達(dá)過(guò)程的研究成果,分析口譯過(guò)程的各階段及其關(guān)系,以及其間運(yùn)用的信息加工方法,構(gòu)建并闡釋了口譯三角模型(細(xì)化版)(Interpreting Triangle Model,即IT Model[15],幫助口譯教學(xué)和測(cè)評(píng)的可解釋性。
總之,該可解釋口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)基于新文科翻譯學(xué)的視角,形成了多學(xué)科融合、符號(hào)主義與連接主義結(jié)合、多模態(tài)技術(shù)融合的理論依據(jù),關(guān)注模型可解釋性、透明度和可追溯性、反饋機(jī)制、教學(xué)與評(píng)估融合等方面的要求,便于實(shí)現(xiàn)對(duì)口譯教學(xué)的有效支持和促進(jìn)。據(jù)此,通過(guò)不斷的技術(shù)創(chuàng)新和方法改進(jìn),可以期待未來(lái)的可解釋口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)能夠不斷優(yōu)化升級(jí),不僅能夠提供準(zhǔn)確的評(píng)分,還能夠向用戶提供清晰的評(píng)分依據(jù),從而在口譯教學(xué)領(lǐng)域發(fā)揮更大的作用,不斷拓展新文科翻譯學(xué)的研究邊界。
新文科翻譯學(xué)視域下口譯中的多樣性和主觀性則是自動(dòng)測(cè)評(píng)系統(tǒng)的挑戰(zhàn)。可解釋性指的是系統(tǒng)的決策過(guò)程能夠被用戶理解和信任的程度。這意味著要增強(qiáng)系統(tǒng)的透明度、可信度及準(zhǔn)確度,需要具備持續(xù)改進(jìn)的機(jī)制,根據(jù)用戶反饋和實(shí)際應(yīng)用情況,不斷優(yōu)化和更新系統(tǒng)的評(píng)估模型、算法和界面設(shè)計(jì),發(fā)掘相應(yīng)的優(yōu)化路徑。
(一)基于增強(qiáng)系統(tǒng)透明度的可解釋模型嵌入路徑
構(gòu)建一個(gè)可解釋的自動(dòng)測(cè)評(píng)系統(tǒng)是一個(gè)多方面的工程,它需要技術(shù)的創(chuàng)新、教育專家的深入?yún)⑴c以及用戶的積極反饋。尤其在訓(xùn)練口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)進(jìn)行深度學(xué)習(xí)環(huán)節(jié),需要嵌入相應(yīng)的可解釋模型,便于自動(dòng)測(cè)評(píng)系統(tǒng)不僅能夠提供準(zhǔn)確的評(píng)分,還能夠向用戶提供清晰的評(píng)分依據(jù),使測(cè)評(píng)系統(tǒng)由黑盒化轉(zhuǎn)向白盒化。
1.詞向量構(gòu)建的可解釋性模型
在基于深度學(xué)習(xí)的機(jī)器翻譯技術(shù)中,詞向量是一種用于表示自然語(yǔ)言文本中單詞的一種向量化表達(dá)方法。機(jī)器翻譯模型通常會(huì)將源語(yǔ)言和目標(biāo)語(yǔ)言中的單詞映射到一個(gè)高維空間中的向量表示。這些向量可以被看作是單詞的詞向量,每個(gè)維度代表著某種語(yǔ)義特征。詞向量在機(jī)器翻譯中起到非常關(guān)鍵的作用,它可以幫助模型更好地理解和表達(dá)單詞之間的語(yǔ)義關(guān)系,從而提高翻譯質(zhì)量。詞向量的構(gòu)建通常采用詞嵌入技術(shù),它將每個(gè)單詞映射到一個(gè)固定長(zhǎng)度的實(shí)數(shù)向量中。唐明等提出,Word2vec是一種通過(guò)預(yù)測(cè)單詞出現(xiàn)上下文來(lái)學(xué)習(xí)單詞向量的工具,它是一種用于實(shí)現(xiàn)分布式詞向量學(xué)習(xí)的一種算法。它的目的就是將訓(xùn)練數(shù)據(jù)中的每個(gè)單詞表示為向量,然后對(duì)這些單詞向量進(jìn)行聚類,并在聚類之間定義單詞之間的相似度[16]。

2.編碼與解碼網(wǎng)絡(luò)構(gòu)建的可解釋性模型
基于編碼解碼機(jī)器翻譯思想:在編碼網(wǎng)絡(luò)將源語(yǔ)言句子進(jìn)行編碼,獲得分布式語(yǔ)義表示,解碼網(wǎng)絡(luò)從源語(yǔ)言分布式語(yǔ)義表示出發(fā)解碼出目標(biāo)語(yǔ)言句子。如圖5所示,實(shí)現(xiàn)的是一種端到端的網(wǎng)絡(luò)模型結(jié)構(gòu)。
在輸入層,把源語(yǔ)言中的語(yǔ)句轉(zhuǎn)換成詞向量序列輸入到編碼網(wǎng)絡(luò)中。在編碼網(wǎng)絡(luò)中把輸入的詞向量序列轉(zhuǎn)換一個(gè)特定的向量值,這個(gè)向量包含了源語(yǔ)言句子中的信息,包括語(yǔ)義、詞序等所有的特征。為能夠同時(shí)提取到從左向右的語(yǔ)句上下文信息,需要使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)進(jìn)行計(jì)算,RNN能夠很好地將語(yǔ)義信息在網(wǎng)絡(luò)層之間進(jìn)行傳遞和積累,在處理語(yǔ)句序列的任務(wù)中表現(xiàn)出較好的效果。在解碼網(wǎng)絡(luò)中,通過(guò)包含多個(gè)RNN隱層和一個(gè)全連接層,在RNN隱層中,以編碼網(wǎng)絡(luò)中傳遞的值為起點(diǎn),進(jìn)行計(jì)算目標(biāo)語(yǔ)句生成所需的信息,經(jīng)過(guò)多輪計(jì)算后,使用全連接層預(yù)測(cè)出目標(biāo)語(yǔ)言詞語(yǔ)的可能出現(xiàn)概率。選出最大概率的詞語(yǔ)來(lái)組成語(yǔ)句,進(jìn)而完成翻譯任務(wù)。
3.注意力機(jī)制構(gòu)建的可解釋性模型
在機(jī)器翻譯技術(shù)中,最大的難點(diǎn)是如何解決自然語(yǔ)言的多義性。一句話往往有不同的解釋和含義,而且同一個(gè)單詞在不同的上下文中也可能有不同的詞義,這給機(jī)器翻譯帶來(lái)了巨大的挑戰(zhàn)。注意力機(jī)制可以很好地解決一詞多義性問(wèn)題。通過(guò)引入對(duì)齊權(quán)重,注意力機(jī)制使得模型可以根據(jù)源語(yǔ)言和目標(biāo)語(yǔ)言之間的對(duì)齊關(guān)系,選擇性地聚焦于源語(yǔ)言和目標(biāo)語(yǔ)言之間的特定區(qū)域,從而能夠更好地識(shí)別句子中的重要信息。注意力機(jī)制還可以實(shí)現(xiàn)動(dòng)態(tài)選擇性關(guān)注,即讓模型根據(jù)輸入的源語(yǔ)言和目標(biāo)語(yǔ)言,動(dòng)態(tài)地調(diào)整對(duì)不同詞匯的關(guān)注程度。比如,使用Transformer注意力機(jī)制編碼與解碼網(wǎng)絡(luò)結(jié)構(gòu)模型,在WMT2014英語(yǔ)到德語(yǔ)的翻譯任務(wù)上,取得明顯的性能提升[17]。
(二)基于增強(qiáng)系統(tǒng)可信度的用戶全過(guò)程追蹤路徑
在實(shí)踐口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)過(guò)程中,針對(duì)系統(tǒng)評(píng)分結(jié)果的不透明性問(wèn)題,主要通過(guò)提供用戶友好的反饋和解釋以及強(qiáng)化參與反饋機(jī)制等方法進(jìn)行精準(zhǔn)施策。
1.提供用戶友好的反饋和解釋
為提高用戶對(duì)口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的理解和接受度,主要從如下幾個(gè)方面找到解決問(wèn)題的突破口:一是引入多樣化的反饋形式,如語(yǔ)音、圖像、視頻等,以滿足不同用戶的學(xué)習(xí)偏好和需求。二是利用機(jī)器學(xué)習(xí)和個(gè)性化推薦技術(shù),為用戶提供智能化的個(gè)性化建議。系統(tǒng)根據(jù)用戶的口譯表現(xiàn)和學(xué)習(xí)歷史,針對(duì)性地給出改進(jìn)建議,幫助用戶更加有效地提升口譯能力。三是采用實(shí)例引導(dǎo)式解釋,在解釋評(píng)價(jià)和建議時(shí),采用實(shí)例引導(dǎo)式的方法,通過(guò)具體案例和示范,幫助用戶理解評(píng)價(jià)標(biāo)準(zhǔn)和改進(jìn)方向。例如,提供優(yōu)秀口譯案例的分析和比較,指導(dǎo)用戶如何改進(jìn)自己的口譯表現(xiàn)。四是針對(duì)不同用戶群體,主要進(jìn)行語(yǔ)言普及和文化適應(yīng),確保反饋信息易于理解和接收。例如,針對(duì)非母語(yǔ)用戶,提供簡(jiǎn)明易懂的解釋,避免使用復(fù)雜的語(yǔ)言結(jié)構(gòu)和專業(yè)術(shù)語(yǔ)。五是建立反饋循環(huán)閉環(huán)機(jī)制,鼓勵(lì)用戶根據(jù)系統(tǒng)反饋進(jìn)行自我調(diào)整和改進(jìn),并及時(shí)反饋使用體驗(yàn)和需求。主要通過(guò)建立用戶參與的反饋循環(huán),不斷優(yōu)化系統(tǒng)的反饋機(jī)制和內(nèi)容,提高用戶的滿意度和學(xué)習(xí)效果。
2.強(qiáng)化用戶參與和反饋機(jī)制
強(qiáng)化口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的用戶參與和反饋機(jī)制是提升系統(tǒng)質(zhì)量和用戶體驗(yàn)的重要途徑。在提升口譯自動(dòng)測(cè)評(píng)系統(tǒng)可解釋性實(shí)踐中,主要采用如下方法開(kāi)展:一是定期向用戶發(fā)送調(diào)查問(wèn)卷或反饋表,了解他們的意見(jiàn)和建議。主要涵蓋系統(tǒng)的易用性、功能改進(jìn)、內(nèi)容更新等內(nèi)容。二是創(chuàng)建一個(gè)在線論壇或社區(qū),讓用戶分享他們的體驗(yàn)、提出問(wèn)題并與其他用戶交流,便于鼓勵(lì)用戶參與討論,并提供及時(shí)的反饋。三是定期更新和溝通,及時(shí)向用戶通報(bào)系統(tǒng)的更新內(nèi)容和改進(jìn)計(jì)劃,讓他們了解系統(tǒng)的發(fā)展方向,并鼓勵(lì)他們繼續(xù)參與反饋。四是不僅關(guān)注用戶提出的建議,還要密切關(guān)注他們的實(shí)際體驗(yàn)。通過(guò)分析用戶行為和使用數(shù)據(jù),發(fā)現(xiàn)潛在問(wèn)題并及時(shí)改進(jìn),并將用戶反饋?zhàn)鳛槌掷m(xù)改進(jìn)的動(dòng)力,不斷優(yōu)化系統(tǒng)功能和性能,以滿足用戶的需求和期待。
(三)基于增強(qiáng)系統(tǒng)準(zhǔn)確性的多源信息融合路徑
口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的準(zhǔn)確性是其核心競(jìng)爭(zhēng)力之一。為了持續(xù)解決系統(tǒng)評(píng)分標(biāo)準(zhǔn)的不明確問(wèn)題,主要采用多源信息融合策略,綜合利用不同的信息源,提高系統(tǒng)評(píng)估的準(zhǔn)確性。主要涵蓋語(yǔ)音識(shí)別技術(shù)、文本語(yǔ)義分析、語(yǔ)境理解、專家評(píng)估與反饋、實(shí)時(shí)反饋與調(diào)整、持續(xù)學(xué)習(xí)與優(yōu)化的多源信息融合。其中,語(yǔ)音識(shí)別技術(shù)將口譯員的口語(yǔ)輸入轉(zhuǎn)換為圖片形式,可以作為系統(tǒng)評(píng)估的基礎(chǔ)。通過(guò)文本語(yǔ)義分析技術(shù),理解口譯員的表達(dá)含義和意圖,便于系統(tǒng)更準(zhǔn)確地評(píng)估口譯員的表達(dá)是否準(zhǔn)確、清晰。通過(guò)模擬口譯不同語(yǔ)境的場(chǎng)景來(lái)提高口譯準(zhǔn)確性的評(píng)估。通過(guò)邀請(qǐng)口譯領(lǐng)域的專家參與評(píng)估,提供專業(yè)意見(jiàn)和反饋,幫助系統(tǒng)發(fā)現(xiàn)并糾正可能存在的錯(cuò)誤。通過(guò)提供實(shí)時(shí)的反饋,告知口譯員在表達(dá)或翻譯中可能存在的問(wèn)題,并提供改進(jìn)建議。通過(guò)深度學(xué)習(xí)技術(shù)不斷學(xué)習(xí)和優(yōu)化口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng),結(jié)合歷史數(shù)據(jù)和用戶反饋,進(jìn)行模型更新和參數(shù)調(diào)整,以適應(yīng)不斷變化的口譯環(huán)境和需求。
口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的可解釋性問(wèn)題是當(dāng)前研究和實(shí)踐中的重要挑戰(zhàn)之一。在新文科視域下,構(gòu)建一個(gè)具有可解釋性的口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)對(duì)于提高口譯教學(xué)效率和質(zhì)量具有重要意義。本文該研究以新文科翻譯學(xué)視角,通過(guò)對(duì)口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)建構(gòu)的各個(gè)方面以及可解釋性問(wèn)題的深入探討,提出了一系列解決方案和實(shí)現(xiàn)優(yōu)化路徑。首先,口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的建構(gòu)需要充分考慮數(shù)據(jù)采集、特征提取、模型訓(xùn)練和評(píng)估指標(biāo)設(shè)計(jì)等方面,以確保系統(tǒng)的基礎(chǔ)和功能完備。其次,口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的可解釋性問(wèn)題主要表現(xiàn)為模型黑箱化、評(píng)估結(jié)果不透明和評(píng)估標(biāo)準(zhǔn)不明確等方面,需要通過(guò)透明數(shù)據(jù)處理、特征解釋性、模型可解釋性、評(píng)估標(biāo)準(zhǔn)明確化、結(jié)果反饋機(jī)制以及用戶參與設(shè)計(jì)等途徑來(lái)解決。通過(guò)對(duì)口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的可解釋性問(wèn)題進(jìn)行深入分析和探討,可以為口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的設(shè)計(jì)、開(kāi)發(fā)和應(yīng)用提供重要參考,促進(jìn)口譯教學(xué)的現(xiàn)代化和智能化進(jìn)程系統(tǒng)的透明度、可信度和準(zhǔn)確度。未來(lái),我們需要將繼續(xù)關(guān)注口譯教學(xué)自動(dòng)測(cè)評(píng)系統(tǒng)的研究和實(shí)踐,不斷探索更加有效和可解釋的方法,為口譯教學(xué)的發(fā)展貢獻(xiàn)更多的思想和力量。
參考文獻(xiàn):
[1] Paul Humphreys.The Philosophical Novelty of Computer Simulation Methods [J].Synthese,2009,169(3):615-626.
[2] William R.Swartout.XPLAIN:A System for Creating and Explaining Expert Consulting Programs [J].Artificial intelligence,1993,21(3):285-325.
[3] Tim Miller.Explanation in artificial intelligence:Insights from the social sciences [J].Artificial Intelligence,2018,267:1-38.
[4] Plumb G,Al-Shedivat M,et al.Regularizing black-box models for improved in terpretability [J].Advances in Neural Information Processing Systems,2020,33:10526-10536.
[5] Zhang Q,Wang X,et al.Interpretable cnns for object classification [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2021,43(10): 3416-3431.
[6] Li O,Liu H,et al.Deep learning for case-based reasoning through prototypes:A neural network that explains its predictions [C]. New Orleans:Proceedings of the AAAI Conference on Artificial Intelligence,2018.
[7] Huang Z,Li Y.Interpretable and accurate fine-grained recognition via region grouping [C].Paris:Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition,2020.8662-8672.
[8] Zeiler M D,F(xiàn)ergus R.Visualizing and understanding convolutional networks [C].Beijing:European Conference on Computer Vision,2014.818-833.
[9] 王均松,肖維青等.人工智能時(shí)代技術(shù)驅(qū)動(dòng)的翻譯模式:嬗變、動(dòng)因及啟示[J].上海翻譯,2023,(4):14-19.
[10] 王立非,栗潔歆.主動(dòng)服務(wù)高質(zhì)量發(fā)展,加快建設(shè)中國(guó)特色“新文科語(yǔ)言學(xué)”[J].北京第二外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2022,44(1):3-10.
[11] 韓彩虹,許文勝.新文科語(yǔ)言學(xué)視域下的外貿(mào)口譯職業(yè)能力調(diào)查及智能對(duì)策——基于中國(guó)邊境區(qū)域外貿(mào)從業(yè)人員的調(diào)研分析[J].外語(yǔ)電化教學(xué),2023,(5):25-31+105.
[12] 朱富坤,滕臻等.一種語(yǔ)義引導(dǎo)的神經(jīng)網(wǎng)絡(luò)關(guān)鍵數(shù)據(jù)路由路徑算法[J].計(jì)算機(jī)科學(xué),2024,(4):1-11.
[13] 盧宇,章志等.可解釋人工智能在教育中的應(yīng)用模式研究[J].中國(guó)電化教育,2022,(8):9-15+23.
[14] 王文杰,張柯等.基于理性情感的評(píng)論情感分析算法及可解釋性研究[J].計(jì)算機(jī)應(yīng)用研究,2021,38(2):358-362+367.
[15] 吳文梅.口譯三角模型(細(xì)化版)IT Model:構(gòu)建與闡釋[J].上海翻譯,2023,(1):66-72.
[16] 唐明,朱磊等.基于Word2Vec的一種文檔向量表示[J].計(jì)算機(jī)科學(xué),2016,43(6):214-217+269.
[17] 馮洋,邵晨澤.神經(jīng)機(jī)器翻譯前沿綜述[J].中文信息學(xué)報(bào),2020,34(7):1-18.
作者簡(jiǎn)介:
韓彩虹:教授,在讀博士,研究方向?yàn)榭谧g理論與實(shí)踐。
許文勝:教授,博士,博士生導(dǎo)師,研究方向?yàn)榭谧g理論與實(shí)踐。
Interpretability Research on the Construction of an Automatic Evaluation System for Interpreting Teaching from the Perspective of New Liberal Arts
Han Caihong1,2, Xu Wensheng1
1.School of Foreign Languages, Tongji University, Shanghai 200092 2.Zhengzhou University of Science and Technology, Zhengzhou 450064, Henan
Abstract: With the continuous advancement of globalization, interpretation teaching is playing an increasingly important role in the field of new humanities. In order to improve the efficiency and quality of interpreting teaching, an automatic evaluation system has been introduced into interpreting teaching. However, currently most automated evaluation systems have encountered issues such as black box modeling, opaque evaluation results, and unclear scoring criteria in their working principles and interpretation of results. This study, from the perspective of new liberal arts translation studies, analyzes the elements of interpreting tasks and designs an interpretable automatic evaluation system for interpreting teaching. Based on the interpretable theory of artificial intelligence, corresponding optimization strategies are proposed to improve the transparency, credibility, and accuracy of the system.
Keywords: explainable Artificial Intelligence; new liberal arts translation studies; interpretation teaching; automatic evaluation system
責(zé)任編輯:李雅瑄