李 秦
上海大學
20世紀中后期,一種新的語言研究方法--語料庫語言學出現了。語料庫語言學的特點是:它以大批量的真實的語言數據為研究對象,進行多層次、全方位的研究,揭示其中隱含的普遍規律。語料庫語言學是以文本語料庫作為基礎繼續發展起來的一種研究(Sinclair2004)。發展到如今這個階段,基于語料庫的研究方法已經開始擴展到各個領域,如翻譯研究、自然語言處理、話語分析、語言教學和詞典學等。(何中清2011)。
筆者認為有必要先簡單介紹一下語料庫技術的大概發展時間線,再去了解其在國內話語分析研究中的應用。如果把“前電子時代”研究人員手工收集的語料庫稱為第一代語料庫,那么利用早期計算機建立的語料庫則稱為第二代語料庫。隨著計算機計算能力的提高,研究人員能夠利用計算機進行大規模的數據收集和處理,大型計算機語料庫被建立起來,語料庫的性質也不僅僅局限于文本,比如還會出現音頻類的語料庫,那么這一類語料庫就被稱為第三代語料庫。隨著多媒體技術的發展和對語言認識的提高,第四代語料庫也開始出現在了大眾視野—多模態語料庫(Knight2009)。
語料庫語言學與以往的語言結構研究的主要區別在于,通過研究相關的“關聯模式”來研究語言使用有什么特點。關聯模式在數量上和質量上都得到了表達。定量分析顯示了語言特征與不同語境之間的關聯程度,而定性分析則對這種關聯進行了功能性解釋。(Biber2000)。要研究的關聯主要有四種類型:搭配、類別關聯、語義域和語義韻律。搭配是“兩個或更多的詞在文本中短距離內的共同出現”(Sinclair1991)。在語料庫研究的中,搭配是一個有效的分析工具:一方面,它為分析索引行提供了一個額外的分析方向,另一方面,它可以揭示與特定主題有關的主要詞匯模式。類別關聯指的是語法類別、語法結構和詞語搭配出現的框架之間的聯系。通過進行類別聯想,可以發現詞匯的語法模式。語義域表達了現實世界的概念,并被實現為不同的詞匯區域。而每個詞匯區域都是由一組特定的詞或短語組成。(衛乃興2005)。語義韻不是指詞語的內涵,而是指詞語和語境之間的關系,重點在于研究詞語與說話人和聽話人之間是一種什么互動關系。根據說話人的態度,語義韻可分為正面、中性和負面。(Stubbs1996)。而在國內的話語分析領域,已經有越來越多的學者開始借助語料庫這一強大的研究手段進行相關研究。本文將列舉若干具有代表性的文獻來闡釋語料庫是如何與話語分析相結合的。
劉寧通過自建小型語料庫,劉寧從批判性話語分析的角度,比較和分析中國和美國媒體在報道中國霧霾時的不同觀點和態度,并探討是什么意識形態導致了這樣的差異。首先,借助于語料庫技術,研究者能夠收集大量真實的語言材料,從而保證語料的有效性。其次,綜合運用各種分析方法,語料庫技術可以為研究者呈現出一些憑借肉眼難以發現的語言現象和規律,以有效減少研究者的主觀性對研究本身產生的影響。再次,語料庫技術的應用也滿足了大數據時代下對科學研究提出的迫切要求。例如,在研究過程中,研究者經常關注語料庫統計數據中的顯著性,而顯著性和頻率密切相關,因而批評話語分析可以將研究焦點集中在高頻信息上。借助語料庫的批評話語分析可以從語料庫工具中的詞頻統計、詞匯搭配強度、索引呈現等方面展開,這在很大程度上保證了在進行意識形態分析時有據可依。通過輸入查找關鍵詞“haze”和“smog”,作者從《中國日報》(China Daily)官網上選取了33篇近年來關于中國霧霾的報道,從《紐約時報》(New York Times)官網上選取了20篇關于中國霧霾的報道,發表時間跨度為2013年至2016年。由于《中國日報》上的每篇報道篇幅相對較短,為了使兩個語料庫庫容相近,故在篇章數量的選取上作了相應調整,減少了因庫容相差太大可能對分析結果造成的影響。《中國日報》語料庫總形符數為18853,《紐約時報》為18816。之所以選取這兩家媒體的報道,是因為這兩家媒體的覆蓋面廣、影響力大,能夠分別代表中、美兩國的政治立場和意識形態,也能夠很好地開展對比分析。劉寧認為,與傳統的批評話語分析相比,語料庫語言學與之結合起來有著強大的優越性。郭松認為,利用語料庫進行批評性話語分析,可以使用語料庫工具的詞頻統計、詞匯搭配能力和索引表示法,為分析提供很大程度的意識形態基礎。使用語料庫的目的不是為了使批評性話語分析完全客觀,而是為了盡量減少偏見,提高分析結果的可靠性(郭松2011)。該文章基于自建的關于中國霧霾報道的小型語料庫,從詞頻、索引行分析、搭配詞表、搭配短語4個層面對中美媒體報道進行對比分析,發現《紐約時報》在報道時著力渲染中國負面國家形象,《中國日報》的報道則力圖展現出一個承認環境污染、客觀分析現狀、積極履行職責的負責任的大國形象。
唐青葉綜合運用五層次話語政治分析框架以及三角測量法、語義韻分析法和批評話語分析法對三個不同國家報刊媒體的“一帶一路”話語表征進行歷時和共時考察,旨在發現其報道傾向性及變化規律。通過對美國、印度和歐盟三家媒體“一帶一路”的報道分析,作者從語料庫中獲得了翔實可靠的語言證據。從符號意義(語義韻)看,《紐約時報》通過報道其他國家的評價來側面表達某種程度上的反對立場,再現了美國媒體的傳統傳播戰略。而在《印度時報》的報道中,其他國家都對“一帶一路”倡議表示支持和擁護,但是印度官方層面則顯得態度頗為冷淡,懷有猜疑和警惕之心,但有可能基于利益考慮跨越“觀望”。《歐盟報》認知態度經歷了總體支持、歐盟各成員國爭相加入,到行動逐漸具體化的轉變。這種認知態度的差異及其變化折射在“一帶一路”倡議實施過程中,反映了美國、印度和歐盟三大地緣政治的戰略選擇及其與中國的外交關系。
林元彪和徐嘉晨通過研究英語國際媒體對于新中國成立70周年的報道,將谷歌新聞作為中華人民共和國國慶70周年的新聞報道來源。同時,他們還建立了一個“國慶65周年”的語料庫作為對比語料庫。該篇文獻的作者認為,語料庫方法通過對話題、索引行、搭配等文本信息的話語分析,為批評性話語分析提供了更客觀的視角,并揭示了研究者沒有想到的隱含觀點。研究表明,在話語策略上,一方面,英國媒體和美國媒體會肯定中國所取得的一系列成就,另一方面,他們卻會傾向于將各種沒有可比性的話題“等同化”,并將這些話題置于信息的主導地位,從而達到強化相應話題和抹黑中國形象的目的。同時,在傳達中國的國家形象時,世界上的英語媒體有兩種不同的聲音。該研究還發現,國外媒體對中國目前發展情況的誤解很普遍,其中一些外國媒體甚至會將建國和建黨混為一談。最后,他們的分析表明,國際社會對中國的意識形態壓力主要來自美國,而美國也是對中國優秀的經濟表現最漠不關心的國家。
胡開寶和盛丹丹以華為公司《報告》語料庫的應用為基礎,依據Fairclough的三維話語分析框架,分析了華為公司《報告》英譯文本所具有的語言層面的特征,并與Telstra公司《報告》和BT公司的《報告》進行了對比研究,從而指出了華為公司《報告》英譯文本所構建的華為公司形象及其背后的意識形態因素。該篇文獻的作者認為,華為公司《報告》英譯文本所塑造的華為公司形象主要表現為以下特征:{1)務實、進取,具有反省意識、擔當意識和實干精神;(2)重視管理、環保和可持續發展;(3)低調、親民,積極參與公益活動和慈善事業;(4)以人為本,注重員工發展,顧客至上。
由于篇幅限制,本文僅僅選用了四篇代表性的相關文獻,雖然這只是冰山一角,但是也足夠具有代表性,因為這四篇文章均發表于核心期刊,而且,這四篇文章的研究對象涵蓋了社會問題、國家形象、企業形象和對外傳播等多個方面。我們可以從中看出語料庫對于話語分析領域的積極的推動作用。但是,我們也應該清醒地認識到,語料庫的研究方法并不是萬能的,不管是通過語料庫還是別的方法,我們的最終目的是研究語言。那些忽視語料庫方法的人在進行語言研究時后果堪慮;而那些只運用語料庫方法進行語言研究的人也會是同樣的結果。從本質上講,語料庫的研究方法是描述性的,它不可能窮盡某種語言使用的全貌,只能回答“有什么”和“有多少”的問題,并不能回答“為什么是這樣”,也不能直接判斷“就是這樣”。基于上述原因,越來越多的語言學家們認識到語料庫研究應當結合其它研究方法。只有這樣,語料庫的研究方法才能發揮更大作用,才能推動語言研究的進一步發展。