西南交通大學(xué)希望學(xué)院 王 建 益陽(yáng)廣播電視大學(xué) 方 舟
國(guó)內(nèi)英語(yǔ)水平測(cè)試(如公共英語(yǔ)四、六級(jí)及英語(yǔ)專(zhuān)業(yè)八級(jí)考試)大多包括翻譯與寫(xiě)作兩種題型。然而,翻譯和寫(xiě)作測(cè)試最棘手的問(wèn)題就是分?jǐn)?shù)的評(píng)定,往往需要招募大批的人工評(píng)閱者參與評(píng)卷工作,而人工評(píng)閱往往費(fèi)時(shí)費(fèi)力,效率低下,成本偏高,且因其主觀性因素,人工評(píng)閱者無(wú)法嚴(yán)格地運(yùn)用同一把“尺子”衡量作文或譯文的質(zhì)量。(白麗芳、王建 2019)面對(duì)此類(lèi)問(wèn)題,自動(dòng)評(píng)閱工具應(yīng)運(yùn)而生。隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,主觀題的自動(dòng)評(píng)價(jià)在語(yǔ)言測(cè)試領(lǐng)域的運(yùn)用被越來(lái)越多的測(cè)評(píng)機(jī)構(gòu)及研究機(jī)構(gòu)所關(guān)注,成為近年來(lái)測(cè)試領(lǐng)域較為熱門(mén)的話題。(江進(jìn)林、文秋芳 2012;郭蕾 2019)
目前,針對(duì)寫(xiě)作的評(píng)分系統(tǒng)日趨成熟且運(yùn)用較廣。自動(dòng)作文評(píng)分系統(tǒng)的研究可追溯到20世紀(jì)60年代,最初旨在解決大規(guī)模考試的作文評(píng)分問(wèn)題,因此被稱(chēng)為AES(Automated Essay Scoring)系統(tǒng),后來(lái)發(fā)展為AWE(Automated Writing Evaluation system)系統(tǒng),被應(yīng)用到寫(xiě)作課堂。這些系統(tǒng)依托自然語(yǔ)言處理、人工智能及潛勢(shì)語(yǔ)義分析(latent semantic analysis)等技術(shù)的發(fā)展,模擬人工從量(分?jǐn)?shù))和質(zhì)(反饋)兩方面評(píng)閱作文,較之人工評(píng)閱者在及時(shí)性、高效性和客觀性等方面更有優(yōu)勢(shì)。(白麗芳、王建 2018)國(guó)外著名的評(píng)閱系統(tǒng)包括Criterion、My Access!及WritingRoad-map等(Dikli 2006),國(guó)內(nèi)自主研發(fā)的句酷批改網(wǎng)、iWrite和冰果作文智能評(píng)閱系統(tǒng)等也已廣泛應(yīng)用于高校英語(yǔ)寫(xiě)作教學(xué)中。
國(guó)內(nèi)針對(duì)AWE或AES系統(tǒng)的相關(guān)研究較為全面,包括對(duì)系統(tǒng)原理的介紹(如陳瀟瀟、葛詩(shī)利 2008)、AWE模型的建立(如梁茂成 2005)、機(jī)器評(píng)分的效度研究(如白麗芳、王建 2018)及使用者對(duì)系統(tǒng)的認(rèn)知和自動(dòng)反饋研究(如Bai & Hu 2017),這些研究對(duì)翻譯機(jī)器評(píng)分的研究具有借鑒意義。……