劉 冰, 陳建生
(天津科技大學(xué) 外國(guó)語(yǔ)學(xué)院,天津 300222)
大學(xué)英語(yǔ)四、六級(jí)考試是全國(guó)大學(xué)英語(yǔ)四、六級(jí)考試委員會(huì)設(shè)計(jì)和開發(fā),與教育部考試中心共同實(shí)施的一項(xiàng)大規(guī)模標(biāo)準(zhǔn)化考試,其目的是準(zhǔn)確衡量我國(guó)在校大學(xué)生的英語(yǔ)綜合應(yīng)用能力,為實(shí)現(xiàn)大學(xué)英語(yǔ)課程教學(xué)目標(biāo)發(fā)揮積極作用。在大學(xué)英語(yǔ)四、六級(jí)考試各項(xiàng)技能的考核中,閱讀理解部分占有很大比重(均為35%)。閱讀部分短文詞匯豐富,語(yǔ)法覆蓋全面,是檢測(cè)學(xué)生詞匯、語(yǔ)法及語(yǔ)篇理解能力的重要手段。近年來,國(guó)內(nèi)學(xué)者針對(duì)閱讀理解部分的研究涉及諸多方面,主要包括閱讀感知、理解過程、閱讀教學(xué)、閱讀模式等,但閱讀測(cè)試難度方面的研究較少。判定閱讀測(cè)試難度涉及諸多因素,包括閱讀篇章的題材、體裁、語(yǔ)言難度(包括生詞量大小、詞匯與結(jié)構(gòu)的復(fù)雜程度等)以及測(cè)試問題的形式、數(shù)量,甚至包括閱讀部分的測(cè)試時(shí)間等。
目前,國(guó)內(nèi)針對(duì)閱讀測(cè)試的語(yǔ)言難度研究剛剛起步,研究方法和標(biāo)準(zhǔn)不一。唐美華從文本結(jié)構(gòu)、語(yǔ)義復(fù)雜性(語(yǔ)法隱喻視角)和可讀性三個(gè)層面對(duì)2004年英語(yǔ)專業(yè)四、八級(jí)新考試大綱施行后TEM 4和TEM 8中閱讀理解部分的難度進(jìn)行了對(duì)比研究[1]。該研究使用的兩個(gè)語(yǔ)料庫(kù)——英語(yǔ)專業(yè)四級(jí)和專業(yè)八級(jí)英語(yǔ)語(yǔ)料庫(kù)分別由12篇短文構(gòu)成,語(yǔ)料明顯不足,研究結(jié)論有一定的局限性。
本研究基于語(yǔ)料庫(kù)語(yǔ)言學(xué)的方法,對(duì)大學(xué)英語(yǔ)四級(jí)和六級(jí)考試中閱讀部分理解部分篇章的語(yǔ)言難度從不同層面進(jìn)行對(duì)比分析。采用的語(yǔ)料來自1990—2011年間全國(guó)大學(xué)英語(yǔ)四六級(jí)考試閱讀理解部分的語(yǔ)篇。通過語(yǔ)料庫(kù)語(yǔ)言學(xué)方法,對(duì)四六級(jí)考試閱讀理解部分語(yǔ)篇的語(yǔ)言難度進(jìn)行分析,為大學(xué)英語(yǔ)四級(jí)和六級(jí)考試中閱讀部分語(yǔ)言難度差異的研究提供了一個(gè)全新的角度,對(duì)今后四六級(jí)測(cè)試檢測(cè)及英語(yǔ)教學(xué)工作提出建議。
本研究通過定性和定量相結(jié)合的統(tǒng)計(jì)方法,以語(yǔ)料庫(kù)語(yǔ)言學(xué)手段對(duì)大學(xué)英語(yǔ)四六級(jí)閱讀部分的語(yǔ)言難度進(jìn)行整體對(duì)比。
詞匯特征和語(yǔ)法特征是語(yǔ)料庫(kù)語(yǔ)言學(xué)用來衡量語(yǔ)言難度的主要手段。以詞匯層面為界,本研究分為兩部分:一是詞匯層面的研究,包括詞匯密度和詞匯難度;二是詞匯以上層面的研究,包括平均句長(zhǎng)和語(yǔ)法隱喻(被動(dòng)語(yǔ)態(tài)和名詞化)。
本研究的數(shù)據(jù)來自兩個(gè)語(yǔ)料庫(kù):大學(xué)英語(yǔ)四級(jí)考試閱讀語(yǔ)料庫(kù)(以下簡(jiǎn)稱四級(jí)庫(kù))和大學(xué)英語(yǔ)六級(jí)考試閱讀語(yǔ)料庫(kù)(以下簡(jiǎn)稱六級(jí)庫(kù)),兩個(gè)語(yǔ)料庫(kù)分別包含1990—2011年大學(xué)英語(yǔ)四級(jí)和六級(jí)考試閱讀理解部分的短文。四級(jí)庫(kù)有168篇短文(50052詞),六級(jí)庫(kù)有157篇短文(58389詞)。為了便于研究,刪除了兩個(gè)語(yǔ)料庫(kù)中所有短文內(nèi)超綱詞的中文注釋。此外,還對(duì)這兩個(gè)語(yǔ)料庫(kù)分別做了自動(dòng)詞性附碼,采用的是分類詳細(xì)的CLAWS7詞性附碼集①。
使用的研究工具包括 WordSmith Tools 4.0,UltraEdit 32,AntConc和 Range32等軟件。
1.詞匯密度
詞匯密度(lexical density)是區(qū)別語(yǔ)體正式程度的一個(gè)標(biāo)準(zhǔn),語(yǔ)體越正式,詞匯密度越高;反之,語(yǔ)體越接近自然口語(yǔ),詞匯密度越低。詞匯密度的一般計(jì)算方法是統(tǒng)計(jì)語(yǔ)篇中實(shí)詞和總詞數(shù)的百分比[2]。
根據(jù)胡壯麟對(duì)實(shí)詞和虛詞的分類,實(shí)詞包括名詞、動(dòng)詞、形容詞和副詞[3]。通過對(duì)四級(jí)庫(kù)和六級(jí)庫(kù)的檢索統(tǒng)計(jì)得出,四級(jí)庫(kù)中實(shí)詞總數(shù)為29350個(gè),其中名詞12833個(gè),動(dòng)詞9365個(gè),形容詞4044個(gè),副詞3108個(gè);六級(jí)庫(kù)實(shí)詞總數(shù)為35174個(gè),其中名詞15747個(gè),動(dòng)詞10397個(gè),形容詞5345個(gè),副詞3685個(gè)。四級(jí)庫(kù)的實(shí)詞和總詞數(shù)的百分比為58.6%;六級(jí)庫(kù)的實(shí)詞和總詞數(shù)的百分比為60.2%。相比之下,六級(jí)庫(kù)的詞匯密度明顯高于四級(jí)庫(kù)。卡方檢驗(yàn)的結(jié)果也驗(yàn)證了兩個(gè)庫(kù)中實(shí)詞的分布具有顯著性差異(見表1)。

表1 四、六級(jí)庫(kù)詞匯密度的對(duì)比
2.詞匯難度
對(duì)于大學(xué)英語(yǔ)四六級(jí)考試閱讀部分詞匯的難度,本文通過語(yǔ)料庫(kù)工具Range32(Nation et al.1995)進(jìn)行分析。Range32的基本原理是將某一文本中的詞匯與某一詞匯表相比較,觀察哪些詞出現(xiàn)在該詞匯表中及其出現(xiàn)的比率,找出該文本的用詞情況。Range32自帶三個(gè)基礎(chǔ)詞表,表一是高頻詞,難度最低;表三是相對(duì)的非高頻詞,難度較表一大。在處理輸入的目的文本時(shí),該軟件會(huì)自動(dòng)以這三個(gè)詞頻表為參照,輸出目的文本的詞頻等信息。表2和表3分別是四級(jí)庫(kù)和六級(jí)庫(kù)詞匯的分布情況。

表2 四級(jí)庫(kù)詞匯分布
表2的數(shù)據(jù)表明,四級(jí)庫(kù)中共出現(xiàn)49255個(gè)形符,其中有38880個(gè)形符屬于基礎(chǔ)詞表一,3339個(gè)形符屬于基礎(chǔ)詞表二,2920個(gè)形符屬于基礎(chǔ)詞表三,剩下4116個(gè)形符不在三個(gè)詞表內(nèi)。四級(jí)庫(kù)詞匯在三個(gè)基礎(chǔ)詞表中所占的比例分別為78.94%、6.78%和5.93%,基礎(chǔ)詞匯以外的詞占8.36%,說明四級(jí)庫(kù)的詞匯以基礎(chǔ)詞表一中的詞匯為主。

表3 六級(jí)庫(kù)詞匯分布
表3的數(shù)據(jù)表明,六級(jí)庫(kù)中共出現(xiàn)58722個(gè)形符,其中有45367個(gè)形符屬于基礎(chǔ)詞表一,3529個(gè)形符屬于基礎(chǔ)詞表二,4317個(gè)形符屬于基礎(chǔ)詞表三,剩下5509個(gè)形符不在三個(gè)詞表內(nèi)。六級(jí)庫(kù)詞匯在三個(gè)基礎(chǔ)詞表中所占的比例分別為77.26%、6.01%和7.35%,基礎(chǔ)詞匯以外的詞占9.38%,說明六級(jí)閱讀庫(kù)的詞匯也是以基礎(chǔ)詞表一的詞匯為主。
雖然四級(jí)庫(kù)和六級(jí)庫(kù)的詞匯都是以基礎(chǔ)詞匯表一中的詞匯居多,但從表2和表3數(shù)據(jù)對(duì)比的結(jié)果可以看出,四級(jí)庫(kù)詞匯在基礎(chǔ)詞表三和未列入基礎(chǔ)詞匯表中的詞所占的百分比比六級(jí)庫(kù)低。由此可見,四級(jí)庫(kù)詞匯的難度低于六級(jí)庫(kù)詞匯。
用語(yǔ)料庫(kù)方法衡量詞匯難度的另一個(gè)手段是詞長(zhǎng)(word length)的統(tǒng)計(jì)。詞長(zhǎng)是指一個(gè)單詞所包含的字母的數(shù)量,單位為字母,如great一詞的詞長(zhǎng)為5個(gè)字母。英語(yǔ)中的常用詞多為詞長(zhǎng)較短的詞,往往為1—7個(gè)字母,8個(gè)或8個(gè)以上字母的詞可以算作長(zhǎng)詞。長(zhǎng)詞除了包括一些本身就很長(zhǎng)的詞,如 etiquette、exaggerate、fertilize等以外,絕大多數(shù)是通過不同構(gòu)詞法構(gòu)成的合成詞或派生詞,如aluminum-coated、irresponsible、philosophically、unaffordable 等,因此,長(zhǎng)詞無論從記憶還是從理解角度看都是具有一定難度的詞。
使用WordSmith Tools對(duì)四級(jí)庫(kù)和六級(jí)庫(kù)的平均詞長(zhǎng)進(jìn)行統(tǒng)計(jì),結(jié)果四級(jí)庫(kù)為4.76,六級(jí)庫(kù)為4.88,表明兩者的平均詞長(zhǎng)差別不大。但是我們不能因此得出結(jié)論,認(rèn)為兩個(gè)庫(kù)中詞匯的難度相當(dāng)。WordSmith Tools在詞長(zhǎng)的統(tǒng)計(jì)結(jié)果中詳細(xì)列出了各詞長(zhǎng)單詞的數(shù)量,我們可以據(jù)此來對(duì)比兩個(gè)庫(kù)在詞匯難度方面的差異。表4是兩個(gè)庫(kù)中8個(gè)字母及以上的長(zhǎng)詞在總詞數(shù)中所占的百分比和卡方檢驗(yàn)的結(jié)果。

表4 四、六級(jí)庫(kù)詞長(zhǎng)詞分布的對(duì)比
表4的數(shù)據(jù)表明,兩個(gè)庫(kù)在長(zhǎng)詞的數(shù)量上具有非常顯著的差異,說明六級(jí)庫(kù)的詞匯比四級(jí)庫(kù)難度大。
1.平均句長(zhǎng)
平均句長(zhǎng)是指一個(gè)語(yǔ)篇中句子的平均長(zhǎng)度,以詞數(shù)為統(tǒng)計(jì)單位。一般來說,簡(jiǎn)單句的句長(zhǎng)較短,容易理解;并列句、復(fù)合句或并列復(fù)合句的句子較長(zhǎng),較難理解。因此,通過對(duì)平均句長(zhǎng)的統(tǒng)計(jì)和對(duì)比可以從一個(gè)側(cè)面了解語(yǔ)篇的難度。通過對(duì)兩個(gè)語(yǔ)料庫(kù)的總句子數(shù)和平均句長(zhǎng)統(tǒng)計(jì),四級(jí)庫(kù)共有2623個(gè)句子,平均句長(zhǎng)為19.18詞(標(biāo)準(zhǔn)差是10.00);六級(jí)庫(kù)共有2915個(gè)句子,平均句長(zhǎng)為20.31詞(標(biāo)準(zhǔn)差11.19)。獨(dú)立樣本 t檢驗(yàn)的結(jié)果(t=3.95,df=5536,p<0.0001)表明兩個(gè)語(yǔ)料庫(kù)的平均句長(zhǎng)存在非常顯著的差異,六級(jí)庫(kù)的平均句長(zhǎng)比四級(jí)庫(kù)長(zhǎng)。
2.語(yǔ)法隱喻
語(yǔ)法隱喻是影響語(yǔ)言材料難度的重要因素。Halliday區(qū)分了兩種語(yǔ)法結(jié)構(gòu)對(duì)語(yǔ)義的體現(xiàn)關(guān)系,一種是一致式,即語(yǔ)言結(jié)構(gòu)直接反映現(xiàn)實(shí)世界;另一種是隱喻式,即語(yǔ)言結(jié)構(gòu)不是直接反映現(xiàn)實(shí)世界,體現(xiàn)出了不同的語(yǔ)言單位之間的轉(zhuǎn)換過程[4]。這種語(yǔ)法結(jié)構(gòu)對(duì)語(yǔ)義的不一致體現(xiàn)就是語(yǔ)法隱喻。
語(yǔ)法隱喻阻礙了學(xué)生閱讀理解的過程。范文芳分析了決定語(yǔ)篇難易度的因素,認(rèn)為在其它因素相同的情況下,語(yǔ)篇中語(yǔ)法隱喻的含量越高,語(yǔ)篇的難度就越大[5]。Ravelli指出,外國(guó)學(xué)生在掌握英語(yǔ)語(yǔ)法隱喻時(shí)會(huì)比較困難。造成這些問題的根本原因就是語(yǔ)法隱喻的復(fù)雜性[6]。Lassen在研究專業(yè)技術(shù)手冊(cè)時(shí),曾提到語(yǔ)法隱喻的五種體現(xiàn)形式:名詞短語(yǔ)、被動(dòng)語(yǔ)態(tài)、定冠詞省略、非限定動(dòng)詞V-ing形式和省略句[7]。通過韓禮德對(duì)語(yǔ)法隱喻的定義,語(yǔ)義的不一致表達(dá)形式都屬于語(yǔ)法隱喻的范疇。以下針對(duì)語(yǔ)法隱喻的幾個(gè)主要形式(被動(dòng)態(tài)和名詞化),分別對(duì)四級(jí)庫(kù)和六級(jí)庫(kù)做統(tǒng)計(jì)分析和對(duì)比。
被動(dòng)語(yǔ)態(tài)通過設(shè)計(jì)完善的正則表達(dá)式檢索項(xiàng),在經(jīng)過詞性附碼的兩個(gè)語(yǔ)料庫(kù)中檢索被動(dòng)語(yǔ)態(tài)謂語(yǔ)的使用情況。表5是兩個(gè)語(yǔ)料庫(kù)中被動(dòng)語(yǔ)態(tài)謂語(yǔ)使用情況的對(duì)比。

表5 四、六級(jí)庫(kù)被動(dòng)語(yǔ)態(tài)謂語(yǔ)的對(duì)比
表5的數(shù)據(jù)表明,兩個(gè)庫(kù)在被動(dòng)語(yǔ)態(tài)謂語(yǔ)的使用上沒有顯著性差異(p=0.9)。
名詞化是指把別的詞類加上-tion、-ment、-ness、-ity(包括其復(fù)數(shù))等后綴轉(zhuǎn)化成名詞的語(yǔ)言現(xiàn)象。Halliday認(rèn)為名詞化是語(yǔ)法隱喻的主要體現(xiàn),指出“名詞化是創(chuàng)建語(yǔ)法隱喻的唯一最強(qiáng)大的手段”[4]。名詞化表達(dá)抽象的概念和過程。名詞化程度越高,語(yǔ)言越抽象,語(yǔ)言難度越大。由于統(tǒng)計(jì)兩個(gè)語(yǔ)料庫(kù)中全部名詞化現(xiàn)象有一定困難,本文只對(duì)幾個(gè)高頻名詞后綴進(jìn)行統(tǒng)計(jì)和比較。表6是四級(jí)庫(kù)和六級(jí)庫(kù)名詞化情況的對(duì)比。

表6 兩個(gè)語(yǔ)料庫(kù)中名詞化使用情況的對(duì)比
表6的數(shù)據(jù)表明,在對(duì)所選的幾個(gè)常用名詞后綴的統(tǒng)計(jì)中,六級(jí)庫(kù)的名詞化現(xiàn)象與四級(jí)庫(kù)有非常顯著的差異。因此從名詞化的角度分析,六級(jí)庫(kù)語(yǔ)言難度高于四級(jí)閱讀。在名詞化統(tǒng)計(jì)的過程中,檢索結(jié)果中存在噪音(noise),如nation是以-tion結(jié)尾的名詞,但不屬于名詞化。考慮到對(duì)四級(jí)庫(kù)和六級(jí)庫(kù)均采用未排除噪音的方法統(tǒng)計(jì),因此結(jié)果仍有效,且具有可比性。
本研究基于語(yǔ)料庫(kù)語(yǔ)言學(xué)的方法,通過詞匯和詞匯以上兩個(gè)層面對(duì)大學(xué)英語(yǔ)四級(jí)和六級(jí)閱讀的語(yǔ)言難度進(jìn)行比較。
詞匯層面上主要從詞匯密度和詞匯難度兩方面進(jìn)行分析比較。在詞匯密度方面,六級(jí)庫(kù)的詞匯密度明顯高于四級(jí)庫(kù)。卡方檢驗(yàn)的結(jié)果也驗(yàn)證了兩個(gè)庫(kù)中實(shí)詞的分布具有顯著性差異;在詞匯難度方面,通過語(yǔ)料庫(kù)工具Range32進(jìn)行分析,得出四級(jí)閱讀的詞匯主要集中在Range32的基礎(chǔ)詞表一和基礎(chǔ)詞表二,而六級(jí)閱讀的詞匯主要集中在Range32的基礎(chǔ)詞表三和基礎(chǔ)詞以外的詞。總而言之,在詞匯層面上,六級(jí)閱讀部分語(yǔ)言難度高于四級(jí)。由此可見,四級(jí)庫(kù)詞匯的難度低于六級(jí)庫(kù)詞匯。在平均詞長(zhǎng)方面,本研究使用WordSmith Tools對(duì)四級(jí)庫(kù)和六級(jí)庫(kù)做了統(tǒng)計(jì),結(jié)果表明,兩者的平均詞長(zhǎng)差別不大。但是,兩個(gè)庫(kù)中8個(gè)字母及以上的長(zhǎng)詞在總詞數(shù)中所占的百分比和卡方檢驗(yàn)的結(jié)果表明,兩個(gè)庫(kù)在長(zhǎng)詞的數(shù)量上具有非常顯著的差異,再次說明了六級(jí)庫(kù)的詞匯比四級(jí)庫(kù)的難度大。由此可以看出,四六級(jí)庫(kù)的語(yǔ)言難度在詞匯層面上有著顯著的差異,六級(jí)庫(kù)語(yǔ)言難度明顯大于四級(jí)庫(kù)。
詞匯以上層面主要從平均句長(zhǎng)和語(yǔ)法隱喻兩方面進(jìn)行分析比較。在平均句長(zhǎng)方面,結(jié)果表明兩個(gè)語(yǔ)料庫(kù)的平均句長(zhǎng)存在非常顯著的差異,六級(jí)庫(kù)的平均句長(zhǎng)比四級(jí)庫(kù)長(zhǎng);在語(yǔ)法隱喻方面,六級(jí)庫(kù)語(yǔ)言的名詞化現(xiàn)象大于四級(jí)庫(kù),說明六級(jí)庫(kù)語(yǔ)言難度明顯大于四級(jí)庫(kù)。然而,四六級(jí)庫(kù)的被動(dòng)語(yǔ)態(tài)現(xiàn)象沒有顯著區(qū)別。出現(xiàn)這種結(jié)果的原因,可能是因?yàn)樗牧?jí)庫(kù)篇章的體裁沒有固定的比例,在不同體裁下被動(dòng)語(yǔ)態(tài)的使用率不同。綜合以上結(jié)果,在詞匯以上層面,六級(jí)庫(kù)語(yǔ)言難度遠(yuǎn)遠(yuǎn)大于四級(jí)庫(kù)。
綜合上述兩個(gè)層面,大學(xué)英語(yǔ)四六級(jí)閱讀部分的語(yǔ)言難度具有顯著差別,六級(jí)閱讀部分語(yǔ)言詞匯使用更廣,語(yǔ)言的客觀抽象程度更高(本文主要從語(yǔ)法隱喻角度出發(fā)),句子的復(fù)雜程度也更高。由于篇幅所限,本研究除了從詞匯及詞匯以上兩個(gè)層面對(duì)四六級(jí)閱讀語(yǔ)篇的語(yǔ)言難度進(jìn)行研究外,并未涉及到語(yǔ)篇體裁和語(yǔ)言難度的關(guān)系,這一點(diǎn)有待繼續(xù)研究。
本研究通過語(yǔ)料庫(kù)語(yǔ)言學(xué)的研究方法對(duì)大學(xué)英語(yǔ)四級(jí)和六級(jí)閱讀部分的語(yǔ)言難度進(jìn)行了分析比較,從詞匯和詞匯以上層面證明六級(jí)閱讀語(yǔ)篇的語(yǔ)言難度大于四級(jí),對(duì)今后的大學(xué)英語(yǔ)教學(xué)有一定的指導(dǎo)意義。在今后的大學(xué)英語(yǔ)教學(xué)中,教師應(yīng)針對(duì)不同學(xué)習(xí)階段,讓學(xué)生集中掌握本階段范圍的詞匯。此外,教師應(yīng)該意識(shí)到語(yǔ)法隱喻在語(yǔ)篇中的大量存在增加了語(yǔ)篇自身的難度,同時(shí)降低了學(xué)習(xí)者的閱讀速度,進(jìn)而引發(fā)了學(xué)習(xí)者情感上的焦慮,最終阻礙了學(xué)習(xí)者對(duì)閱讀材料的理解,極大地制約了學(xué)習(xí)者語(yǔ)言能力的發(fā)展。在教學(xué)過程中,教師應(yīng)重視句子的復(fù)雜性和語(yǔ)言的抽象性,學(xué)生應(yīng)逐漸掌握復(fù)雜的句子,重視語(yǔ)言之間的邏輯關(guān)系。除教學(xué)啟發(fā)外,本文研究大學(xué)英語(yǔ)四六級(jí)閱讀語(yǔ)言難度的方法也可以作為一種全新的、檢驗(yàn)測(cè)試難度的方法。
注釋:
①有關(guān)自動(dòng)詞性附碼和附碼集的詳細(xì)情況請(qǐng)參見http://ucrel.lancs.ac.uk/claws7tags.html。
[1]唐美華.英語(yǔ)專業(yè)等級(jí)考試中閱讀理解對(duì)比分析[J].吉林省教育學(xué)院學(xué)報(bào),2009(1):75 -77.
[2]Ure J.Lexical density and register differentiation[M]//Perren G,Trim J L M(eds).Applications of Linguistics.London:Cambridge University Press,1971:443 -452.
[3]Hu Zhuanglin.Linguistics:An Advanced Course Book[M].Beijing:Beijing University Press,2002.
[4]Halliday M A K.An Introduction to Functional Grammar[M].Beijing:Foreign Language Teaching and Research Press,2000.
[5]范文芳.語(yǔ)法隱喻對(duì)語(yǔ)篇閱讀難易度的影響[J].北京大學(xué)學(xué)報(bào):外國(guó)語(yǔ)言文學(xué)專刊,1996(3).
[6]Ravelli L J.Grammatical metaphor:An initial analysis[M]//Steiner E,Veltman R(eds).Pragmatics,Discourse and Text.London:Frances Pinter,1988.
[7]Lassen Inger.Accessibility and acceptability in Technical Manuals[M].Philadelphia:John Benjaminis B.V.,2003.