摘要 語料庫語言學是致力于檢索、分析以及統計文本的一門新型語言學科。本文將依據語料庫語言學的研究方法,借用主要的兩種工具WordSmith和AntConc,對馬克·吐溫小說《百萬英鎊》的文本信息、情節發展、人物塑造與語言特征等幾個方面進行分析。從而對文學作品進行更加理性化的分析研究另辟一條新途徑。
關鍵詞:《百萬英鎊》 語料庫檢索 文學分析
中圖分類號:H059 文獻標識碼:A
一 引言
近年來,隨著計算機技術的日新月異,大型語料庫發展漸漸滲透到了語言類人文學科的范疇。國內外不少學者將語料庫研究方法應用于文學領域,利用語料庫檢索工具分析文本詞語的頻率、詞語與詞語之間的搭配情況,以及整部作品中各個章節的關鍵詞如人物、事物等出現的頻率等。與傳統方法相比,語料庫檢索方法能更好地從客觀視角對文本進行分析和加工,為研究作家語言特點或作品的主題表達提供可靠的量化依據,從而提供更加令人信服的鑒賞成果,避免了傳統文學品評論中只注重概念研究或生搬硬套各種文學領域以外的理論對文學作品進行牽強附會的弊端,這是語料庫方法較傳統手工研究方法最顯著的優點。
本文將從語料庫這個新穎的角度對美國作家馬克·吐溫小說《百萬英鎊》(以下簡稱《百》)進行分析和研究,主要使用Wordsmith及AntConc等工具對文學文本進行量化分析,從新的角度分析《百》在語言運用、情節發展、人物刻畫等方面的特點,不僅提供更加令人信服的研究數據,更是探討語料庫檢索軟件在揭示文學作品方面的應用,為傳統的文學鑒賞開辟一條新的研究路徑。
二 運用語料庫軟件分析《百萬英鎊》
1 作品文本特征分析
本文主要使用的語料庫是《百》英文原文構成的語料庫,借助Wordsmith軟件中的Wordlist工具自動生成詞表,通過詞表可以得出該作品的一些基本的文本信息,我們發現,該作品的總形符數為8,564,即全文含有8,564個詞匯,類符數有1,721,即全文有1,721個不同的詞匯。僅僅了解單純的形符和類符數并不能直接反映語篇的語言特征,但形符與類符的比率則能更全面地反映本文用詞的變化形式。而語料庫檢索工具也提供了這樣的數據,在文本信息詞表中統計出這部作品的類符和形符的比率是21,這個數字遠遠低于標準化類符形符比41.08,由此數據可推斷出,《百》這部作品的詞匯變化量不大,作品中的詞匯基本屬于較簡單詞,有較多常用詞匯;語篇用詞淺顯,整體難度不大,比較容易理解。但是僅僅掌握這些數據,還是不能對作品進行深入的鑒賞,我們還需要對原文進行深入地閱讀和分析,才能進一步把握作品的語言特點和語體風格。
2 作品情節發展分析
通常我們賞析一部小說都是通過掌握行文的脈絡和貫穿始終的情節來把握原文。但本文將要使用的方法是通過使用語料庫檢索軟件中的詞表和關鍵詞詞圖功能對小說的情節進行統計分析,從而得到對小說情節一個直觀和具體的剖析。通過提取和分析語篇中具有超常頻率的詞以及具有共現關系的詞語或詞群,可以確定語篇的主題和表達該主題的詞集,進而研究作者對某一主題的表述。檢索發現,《百》這部作品中全篇分布密度高的詞匯是“I”,“I”排在第1位,“I”在作品中即是指主人公“亨利(Henry)”。顯而易見,作者高頻率使用第一人稱,說明小說的整個故事情節是以第一人稱寫的,圍繞“我”發生的種種事件展開小說,“我”既是作品中的人物又是事件敘述者,這樣既增強了小說的真實感和藝術魅力,同時也便于通過心理描寫來描述“我”從一個身無分文的流浪漢變成一個百萬富翁并娶了百萬富翁女兒的幽默而諷刺過程。這種第一人稱寫法與通常使用敘事學分析傳統文學作品結論大相徑庭,從敘事學的角度來看,敘述者與作品敘述故事的距離越近,越能提升該作品中故事的可信度。
借助Antconc軟件中的詞表功能對語篇的基本信息進行統計,我們可得到詞匯在作品中的先后出現順序和分布密度,可直觀地分析文本的主題發展,從而透視整個作品情節推進與詞語的關系,并把握整個作品的脈搏。進一步通過關鍵詞的詞圖表對第一人稱I,my,me進行分析,查看他們詞圖,可發現這個故事發生的場景主要有大街、公爵家、銀行、飯店、旅館、裁縫店、公使館等地,故事發生的主要人物有亨利、兩個富翁、哈里斯家的小吃店老板、服裝店的伙計與老板、公使館里的官員們及波蒂娜等重要人物,這說明這些人物也是推動故事情節發展和揭示主題內容的重要人物。筆者以“I,my,me”這三個詞匯為主題詞,分析作品情節如下,作品伊始,即:When I was twenty-seven years old,I was a mining-broker's clerk,…I was alone in the world,…and I….這段開篇以四個“I”的句型介紹了“我”的職業,流落異國他鄉的緣由及生活現狀;緊接著描述了在異國他鄉的“我”生活慘淡,衣食窘迫;就在“我”衣衫襤褸、流浪街頭時刻,“我”的命運發生了翻天覆地的變化。“我”被請進了一個豪華的房間,得到了改變命運的信封,當“我”拿著信封沖進小餐館飽餐一頓之后,發現信封里面不是一點點金錢,而是無法承受的百萬英鈔,很快作者對“我”的心理進行了刻畫:
“I can't,indeed.I've no idea where they've gone,…Then I must see some member of the family.”
當然,在“我”徹底明白情況后,“我”的思想也開始變化。這開場的一系列描寫,通過使用語料庫檢索工具對第一人稱進行檢索分析,能使讀者線條鮮明地掌握作品發展的脈動,也讓讀者身臨其境。接下來,故事情節進入“我”帶著百萬英鎊透視資本主義的社會過程,“我”因為一對兄弟的一個賭,得到了無法使用的百萬英鈔,雖然這張鈔票無法使用,但是“我”卻充分利用了資本金錢至上的觀點,在三十天的賭期里,使人們對“我”這位突然暴富的罕見富翁,拼命地阿諛奉承:“我”到餐館里免費吃飯,到服裝店里買免費衣服,到賓館免費住宿,那些小吃店老板、服裝店的伙計與老板、公使館里的官員們等一個個像叫花子一樣討好“我”,“我”的社會地位不斷提升。直到最后,“我”還得到了一位好妻子和三萬英鎊的銀行利息,并從此過著非常幸福的生活。在作者運用第一人稱描述過程中,讀者似乎跟隨作品中的“我”一同出入飯店、服裝店,一同參加上層社會宴會,一同隨著“我”變得富裕,這讓讀者真真切切體會到馬克·吐溫巧妙的構思,充滿喜劇的情節,這給讀者帶來了巨大的藝術感染力。以上是通過對“I,my,me”三個詞匯的情節分析所得的作品主題。
同時,通過某些關鍵動詞出現的頻率也可分析作品有關的故事情節發展。比如在Antconc中搜索發現,過去式“was”出現了130次,而原形“is”出現了32次;而“are”排到74位。這些關鍵動詞表明作者在創作小說時更多使用過去時態來講述故事發展情節。同時還可發現,列表當中某些詞類出現頻率較高,比如“that”出現111次,排名第11位;“what”、“which”等這些代詞頻率也很高,這則可以說明小說的語言中有一定的從句,而且句子的結構有一定的復雜性。綜述可見,通過總結對全篇小說制成的詞表總結,即以詞的頻率大小排列圖表,可以幫助我們了解文本的大意。
3 作品人物特色分析
在傳統小說中,人物是作品形象體系的核心,通過語料庫檢索軟件中的KWIC(keywords in context)即“語境中的關鍵詞”功能幫助我們分析作品中的人物。文本中的主要人物一般會出現在主題詞表較前的位置。如果輸入人物關鍵詞,如表示姓名的名詞和其人稱代詞等,利用檢索軟件檢索全文,即可把該詞及其共現的語境按照字母順序羅列出來。搜索到的相關詞和短語就構成了搜索詞的微型語境,或共現語篇(co-text)。這種微型語境可以為我們進行搜索詞的搭配分析和文章的主題分析提供可靠的依據。我們可以列舉出所有人物出現時的上下文,就好像制作出一幅幅相關人物的活動畫面。將所收集到的詞和短語進行歸納和分析,就能夠描述人物的外貌、活動、性格、心理活動等。運用這種方法我們可以收集到有關分析人物的所有描述,這對于研究人物性格特征以及作家塑造人物個性的藝術手法,都具有重要的意義。
通過檢索作品主要人物“I”及與之發生關系的人物,我們可以感受到一幅幅惟妙惟肖的世態諷刺畫。在餐館里,作者對餐館老板形象進行了栩栩如生的勾勒,如飯店老板見到百萬英鎊這張大鈔票時,“定睛望著鈔票,嚇呆了”,“好像是手腳都不能動彈似的”,“他很愿意看看它,把它一直看下去,他好像是無論看多久也不過癮似的,可是他卻避開它,不敢碰它一下,就像是這張鈔票神圣不可侵犯,可憐的凡人連摸也不敢摸似的”。當然,這給“我”以后上餐館帶了的后期效益就是,“我”在餐館里:“只要高興,無論要吃什么東西,盡管隨時來吃,繼續賒賬,無論多久都行。”
在服裝店里,作者生動地刻畫了裁縫店老板的形象,當亨利沒有拿出大鈔票出來,只說沒有帶零錢時,裁縫店的店員就“擺出一副非常刻薄的嘴臉”說到:“啊,是嗎?哼,當然我也料到你沒有帶零錢,我看,像你這樣的闊人是只帶大票子的。”可是隨后當亨利將那種無法使用的百萬英鎊拿出來,老板看到那張罕見的大鈔后,態度發生了急轉彎,他馬上批評自己的店員。裁縫店老板陡然發生的態度轉變,讓讀者爆笑的同時,更是讓讀者體會到馬克·吐溫作品的喜劇情節、智慧的語言。如裁縫店老板數落店員:“他總是沒有眼光,常常把闊佬都從這兒攆跑了,因為他分不清一個富翁和流浪漢。”這些人物特點通過使用語料庫工具AntConc中的Concordance的功能,其統計結果一目了然。
4 作品語言特色分析
馬克·吐溫的作品大多以幽默譏諷的語言、合理巧妙的情節構建寓意深刻的主題,此作品也不例外。在文本特色分析中,我們已獲知作品的基本文本信息,利用AntConc中的Concordance Plot功能,進一步通過詞表發現,“said”是排名第一的實意動詞,以動詞“said”為關鍵字得出“said”的詞圖,發現“said”在全文分布非常緊密。這說明該作品的對話非常多。大量對話表明,這部作品的口語化語言的使用能通過人物的直接對話把各種滋味全交給讀者去品嘗體會。對話的使用避免了許多解釋和一些重復、繁雜的背景交待,而且讀者可從對話中體會出許多不是人物直接講述出來的東西。位于詞頻表的第二位的是“and”一詞,出現了343次,這表明作品的語言和句子結構簡單,通常是短句或并列句,用最常見的連接詞聯系起來。這種樸實的口語,清新有力的文字,賦予作品濃郁的生活氣息和強烈的感染力,再次印證了作品語言簡潔明了,通俗易懂。
三 結語
馬克·吐溫的作品生動有趣,人物描寫栩栩如生,語言簡潔幽默詼諧。其作品堪稱文學藝術中的瑰寶,閃爍著永不磨滅的光輝。而本文則是筆者運用語料庫檢索軟件對《百》進行的分析,即從數據上量化地分析了作品的文本特征,并對其文本信息、情節發展、人物塑造和語言特點等方面進行了統計分析。當然,我們從這些數字化的分析中發現,用語料庫作為工具對文本的分析不能代替文學本身的鑒賞,而只是從一條新的路徑對其進行了一些量化分析。因此,如何將量化分析與文本賞析結合,對作品進行更加理性的分析將是進一步研究的方向。
注:本文系江西九江學院2008年度青年教師“建功立業”成果之一,項目編號:08JGLY09。
參考文獻:
[1] 楊惠中:《語料庫語言學導論》,上海外語教育出版社,2002年版。
[2] 何安平:《語料庫語言學與英語教學》,外語教學與研究出版社,2004年版。
[3] 張仁霞、戴桂玉:《語料庫檢索分析在文學批評領域中的應用——以海明威〈永別了,武器〉為例》,《廣東外語外貿大學學報》,2010年第9期。
[4] Edger V R,Henry E.Jacobs.Fiction:An introduction to reading and writing(2nd ed.)[M]NewJersey:Prentice-Hall,Inc,1989.
作者簡介:劉洋,女,1978—,江西九江人,碩士,講師,研究方向:英美文化、英語教學,工作單位:九江學院外國語學院。