摘 要: 語料庫語言學(xué)作為一門新興學(xué)科,可以應(yīng)用于文學(xué)批評領(lǐng)域來分析文學(xué)文本。本文用語料庫方法分析簡·奧斯汀的《理智與情感》,揭示小說情節(jié)、人物塑造,以及作者的寫作技巧。
關(guān)鍵詞: 《理智與情感》 語料庫檢索 分析
一、引言
最近幾年來語料庫語言學(xué)正以其獨(dú)特的優(yōu)勢得以迅猛發(fā)展,語料庫已經(jīng)被廣泛應(yīng)用于與語言學(xué)相關(guān)的各個領(lǐng)域。語料庫檢索軟件在語言學(xué)領(lǐng)域,尤其是在文本分析中已被廣泛使用。語料庫檢索結(jié)果就是從一個語料庫中抽取一個文本的一個檢索詞及其出現(xiàn)的語境按字母順序羅列出來,語料庫檢索軟件是提供這些詞的羅列結(jié)果的系統(tǒng),使用既簡單又省時,因?yàn)樗梢钥焖儆行У仫@示出檢索詞的搭配詞頻。作為一種建立在龐大的數(shù)據(jù)基礎(chǔ)上的極有威力的假設(shè)檢驗(yàn)設(shè)置,語料庫索引可以使文本隱含的結(jié)構(gòu)顯現(xiàn)出來,同時還激發(fā)人的想象力,并檢驗(yàn)文本對讀者的感染力,具有很強(qiáng)的客觀檢驗(yàn)性。語料庫語言學(xué)不僅僅用于語言學(xué),更能用于文學(xué)批評領(lǐng)域來分析文學(xué)文本。我旨在探討語料庫檢索軟件在分析文學(xué)文本中的應(yīng)用,選用英國著名小說家簡·奧斯汀的小說《理智與情感》,對其情節(jié)、人物和寫作風(fēng)格用語料庫檢索軟件進(jìn)行分析,希望讀者能領(lǐng)略語料庫檢索軟件在文學(xué)批評分析中的魅力。使用的語料庫檢索軟件是Wordsmith。
二、用Wordsmithl軟件對《理智與情感》文本進(jìn)行統(tǒng)計(jì),通過得出的數(shù)據(jù),從三個方面對該文進(jìn)行分析。
1.運(yùn)用Wordsmith分析小說的語言特色。
通過該軟件,我們可以發(fā)現(xiàn)小說共有112359個詞,其中有11966個不同的詞。表1為出現(xiàn)頻率前50的詞。不難發(fā)現(xiàn),同一個詞的某些形式出現(xiàn)的頻率較多。比如,過去式“was”出現(xiàn)了1629次,而原形“is”出現(xiàn)了680次;“were”排在48位,而“are”根本就不在前50個詞當(dāng)中。這表明,作家在創(chuàng)作小說時,經(jīng)常使用過去時態(tài)來講述故事發(fā)展情節(jié)。而且列表當(dāng)中某些詞類出現(xiàn)得比較多,如“that”、“which”、“what”這些指示代詞,這可以說明小說的語言中有很多從句,而且句子的結(jié)構(gòu)也遠(yuǎn)比口語中句子結(jié)構(gòu)要復(fù)雜。這是英語書面語的另一特征。我們還可以從這張表中獲得一些信息。比如“her”和“she”這兩詞排名都比較靠前,一個排在第5,一個排在第11。“her”的使用次數(shù)比“she”多出很多,可以推測“her”有時候是作賓格使用,有時候是作物主代詞使用。再如“I”排在第7,而賓格的“me”排在第44。這些代詞在小說中頻繁出現(xiàn),必然跟小說的內(nèi)容息息相關(guān)。我們可以推斷,故事中會有很多女性,否則作者不會如此頻繁使用女性代詞主格、賓格和物主代詞。再根據(jù)詞語列表中的第30位的詞,即“Elinor”,這很明顯是個女性名字,因此,在這些女性當(dāng)中,Elinor必定是一個主要的角色。我們還可以作出一個推斷,即小說中必然有很多人物對話因?yàn)樵趯υ捴校藗儠?jīng)常使用第一人稱,現(xiàn)在第一人稱的I和me都出現(xiàn)得比較多,所以小說中人物對話也不會少。語料庫軟件可以印證這個事實(shí)。在concordance中搜索“I”就會列出“I”出現(xiàn)的所有的上下文。如果我們利用軟件中的“concordance plot”功能,我們還可以得到每一章中“I”出現(xiàn)的位置和數(shù)量。這樣我們就可以知道哪一章的對話較多,同時這一章中,哪一塊的對話比較集中。根據(jù)詞頻列表,我們可以分析推斷得出小說上述的時態(tài)、句式、語體等方面的特色,其它更為詳盡的內(nèi)容還需要進(jìn)一步的閱讀與分析。
通過分析,還能得出以下一些簡略的統(tǒng)計(jì)數(shù)字:
標(biāo)準(zhǔn)句長:25.01
在這個文本中,從其字節(jié)數(shù),形符數(shù)和句子數(shù)可以斷言這是個較短的文本,把其類符形符比10.65與標(biāo)準(zhǔn)類符形符比數(shù)45.05想比較,可以推斷此文本的詞匯變化量大。單純的形符數(shù)和類符數(shù)不能反映語篇的本質(zhì)特征,但兩者的比率卻在一定程度上反映了語篇的某種本質(zhì)特征,即用詞的變化性。它的句長為26.32,與標(biāo)準(zhǔn)句長25.01相比,它比一些簡易文本句子要長.它段落長為1742.82,比平均段落長730.96要長些。如果我們把一個字母的詞,兩個字母的詞,三個字母的詞和四個字母的詞加起來,就可以知道少于四個字母的詞為67932,而這個文本的形符數(shù)是112359個,這樣整個詞匯的60.5%都是多于四個字母的詞。因而可以推斷這個文本屬中等難度水平,句子較長,段落較長。
2.通過語料庫語言學(xué)統(tǒng)計(jì)工具分析小說的情節(jié)發(fā)展。
要理解一部小說的精髓,必須掌握其行文的脈絡(luò)和貫穿始終的情節(jié)。這種對情節(jié)發(fā)展的把握可以通過對原著的通讀來完成。本文要使用的方法是通過使用Word Smith語料庫檢索軟件中的Wordlist和Plotting功能對小說文本的情節(jié)進(jìn)行統(tǒng)計(jì)分析。
通過對全篇小說keyword的總結(jié),可以得出小說的主人公之一為Elinor的結(jié)論。Elinor出現(xiàn)的頻率最高,為582次。
3.運(yùn)用Word Smith加工整合小說的人物描寫,分析作者筆下的人物特色。
通過語料庫檢索軟件中的Concord功能,我們可以窮舉出所有人物出現(xiàn)時的上下文,就如同制作一幅幅的人物特寫。通過這種方法,可以搜羅有關(guān)所分析的人物的所有描摹,對于研究人物性格,作者對人物的寫作手法,都有不可或缺的重要性。 我將結(jié)合語料庫Concordance軟件統(tǒng)計(jì)出的分析結(jié)果,就小說中主人公進(jìn)行語料庫分析。
首先,先進(jìn)入對主人公Elinor(埃莉諾)的分析,Concordance統(tǒng)計(jì)出了全小說共582處。接下來是對Marianne(瑪麗安)的分析,Concordance統(tǒng)計(jì)出了全小說共459處。小說主要描寫埃莉諾和瑪麗安的愛情故事。她們的愛情經(jīng)歷了很多曲折,但是經(jīng)過理智與情感的掙扎,這對姐妹終于獲得了幸福。
三、結(jié)語
以上運(yùn)用語料庫檢索對小說《理智與情感》進(jìn)行了分析,準(zhǔn)確清晰地把握了小說結(jié)構(gòu),并對其語言特色、情節(jié)發(fā)展和人物塑造特點(diǎn)等方面進(jìn)行了統(tǒng)計(jì)分析。當(dāng)然用語料庫作為工具對文本的分析不能代替文學(xué)本身出發(fā)的鑒賞,但畢竟為我們認(rèn)識作品提供了佐證。因此,將自然科學(xué)中的計(jì)算機(jī)技術(shù)與文學(xué)中的文本進(jìn)行結(jié)合,可以為文學(xué)研究另辟蹊徑,即以圖形、列表、統(tǒng)計(jì)等量化的方法分析文本,從而得到對文本更加理性的詮釋。
參考文獻(xiàn):
[1]Douglas Biber,Susan Conrad,Randi Reppen.Corpus Linguistic[M].北京:外語教學(xué)與研究出版社,2000.
[2]Jenny Thomas,Mick Short.Using Corpora for Language Research[M].北京:外語教學(xué)與研究出版社,2001.
[3]Sinclair,John.Corpus Concordance Collocation[M].Shanghai:Shanghai Foreign Language Education Press. 2001.
[4]郭放.《快樂王子》的語料庫檢索分析[J].樂山師范學(xué)院學(xué)報(bào),2004,(6).
[5]Rowling,J.K.Harry Potter and the Half-Blood Prince[M].Bloomsbury Press,2005.
[6]王雁.《傲慢與偏見》的語料庫檢索分析[J].江蘇教育學(xué)院學(xué)報(bào)(社會科學(xué)版),2007.3.