朱蒙



摘要:語(yǔ)料庫(kù)語(yǔ)言學(xué)的快速、持續(xù)發(fā)展產(chǎn)生了巨大的語(yǔ)言數(shù)據(jù)資源。語(yǔ)料庫(kù)索引又為處理語(yǔ)言數(shù)據(jù)資源提供了新的研究方法和技術(shù)手段。泰國(guó)語(yǔ)料庫(kù)語(yǔ)言學(xué)和語(yǔ)料庫(kù)索引雖然還不十分發(fā)達(dá),但已經(jīng)能為泰語(yǔ)教學(xué)所用,為傳統(tǒng)的教學(xué)模式提供新的視角,注入新的活力。
關(guān)鍵詞:語(yǔ)料庫(kù);語(yǔ)料庫(kù)索引;泰語(yǔ)教學(xué)
中圖分類號(hào):G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2016)09-0269-03
一、語(yǔ)料庫(kù)和語(yǔ)料庫(kù)索引
語(yǔ)料庫(kù)語(yǔ)言學(xué)是20世紀(jì)中后期開始發(fā)展的一門新興學(xué)科,研究對(duì)象為真實(shí)的語(yǔ)言數(shù)據(jù),嚴(yán)格設(shè)計(jì)并創(chuàng)建的語(yǔ)料庫(kù)所包含的應(yīng)該是真實(shí)文本和真實(shí)話語(yǔ),用統(tǒng)計(jì)學(xué)方法對(duì)語(yǔ)料進(jìn)行定量分析,并同時(shí)加以用歸納法進(jìn)行定性分析,從一個(gè)新的角度揭示自然語(yǔ)言的復(fù)雜性,所反映的是最典型和最真實(shí)的語(yǔ)言特征,即語(yǔ)言實(shí)例在出現(xiàn)頻率上的優(yōu)勢(shì)即是對(duì)其背后語(yǔ)法體系的概率體現(xiàn)。
在語(yǔ)料庫(kù)研究中,對(duì)某一搜索詞的語(yǔ)法關(guān)系、用法、以及搭配的分析是通過(guò)語(yǔ)境(context)進(jìn)行的。語(yǔ)料庫(kù)索引利用計(jì)算機(jī)技術(shù)和專用軟件,通過(guò)在語(yǔ)料庫(kù)電子文本中進(jìn)行關(guān)鍵詞搜索,把檢索結(jié)果以關(guān)鍵詞為中心、以該詞所在行為語(yǔ)境,按預(yù)定跨距(word span)在屏幕上顯示出來(lái)。作為語(yǔ)言學(xué)研究的一種新方法,語(yǔ)料庫(kù)及語(yǔ)料庫(kù)索引在18世紀(jì)的歐洲就已經(jīng)得到了應(yīng)用,隨著語(yǔ)言學(xué)的研究中,利用語(yǔ)料庫(kù)對(duì)語(yǔ)言進(jìn)行研究的成果不斷出現(xiàn),語(yǔ)料庫(kù)語(yǔ)言學(xué)和語(yǔ)料庫(kù)索引的應(yīng)用范圍也越來(lái)越廣泛。
二、泰國(guó)泰語(yǔ)語(yǔ)料庫(kù)和語(yǔ)料庫(kù)索引建設(shè)
泰國(guó)的語(yǔ)料庫(kù)建設(shè)起步較晚,由于大部分的語(yǔ)言學(xué)研究人員計(jì)算機(jī)知識(shí)的缺乏,造成大部分語(yǔ)言研究和教學(xué)人員對(duì)語(yǔ)料庫(kù)研究和語(yǔ)料庫(kù)索引運(yùn)用的忽略。筆者在2011年赴泰國(guó)留學(xué)期間,曾就語(yǔ)料庫(kù)研究這一問(wèn)題詢問(wèn)泰國(guó)的學(xué)者,一般鮮有人聽說(shuō)此領(lǐng)域,更無(wú)從談起用于泰語(yǔ)教學(xué)。就筆者所掌握的資料,目前已經(jīng)完成和能夠供公眾和相關(guān)研究人員進(jìn)行索引使用的泰語(yǔ)語(yǔ)料庫(kù)主要有以下三個(gè):
(一)泰國(guó)國(guó)家電子計(jì)算機(jī)技術(shù)中心(NECTEC)開發(fā)建設(shè)的ORCHID語(yǔ)料庫(kù)
由于該語(yǔ)料庫(kù)沒有對(duì)公眾開放,而且容量較小,只有40萬(wàn)泰語(yǔ)詞匯數(shù)量,并且在所搜集的語(yǔ)料來(lái)源類型上也比較單一,只有學(xué)術(shù)文獻(xiàn)一種語(yǔ)料來(lái)源,所以應(yīng)用范圍有限;
(二)朱拉隆功大學(xué)語(yǔ)言學(xué)系開發(fā)建設(shè)的泰語(yǔ)語(yǔ)料庫(kù)
該語(yǔ)料庫(kù)主要用于教學(xué)和研究,語(yǔ)料來(lái)源類型包括報(bào)紙、雜志、文學(xué)作品、學(xué)術(shù)文獻(xiàn)、法律文獻(xiàn)、演講文稿等,并對(duì)公眾提供檢索服務(wù);
(三)泰國(guó)國(guó)家電子計(jì)算機(jī)技術(shù)中心和朱拉隆功大學(xué)語(yǔ)言學(xué)系共同開發(fā)的泰國(guó)國(guó)家語(yǔ)料庫(kù)(TNC)
該語(yǔ)料庫(kù)目標(biāo)語(yǔ)料容量為8000萬(wàn)泰語(yǔ)詞匯數(shù)量,截止到2013年6月,已收錄語(yǔ)料3190萬(wàn)泰語(yǔ)詞匯數(shù)量。在詞語(yǔ)類型的劃分?jǐn)?shù)據(jù)的基本處理規(guī)則上是遵循TEI(Text Encoding Initiatives)和CES(Corpus Encoding Standard),語(yǔ)料來(lái)源類型和比例參照英國(guó)國(guó)家語(yǔ)料庫(kù)BNC(British National Corpus),選取原則為語(yǔ)料的內(nèi)容、建立時(shí)間和媒介類型,以保證所選取語(yǔ)料的多樣性原則。
以泰國(guó)國(guó)家語(yǔ)料庫(kù)為例,在線可提供的檢索服務(wù)包括關(guān)鍵詞、關(guān)鍵詞與搭配文本的檢索,檢索結(jié)果為:1)關(guān)鍵詞在所有文本中的詞頻,以及在不同文本類型中的分配比例,文本類型包括:小說(shuō)、報(bào)紙、半學(xué)術(shù)文本、學(xué)術(shù)文本、法律文本和其他;2)在規(guī)定的跨距內(nèi)呈現(xiàn)關(guān)鍵詞所在語(yǔ)境文本,還可以對(duì)語(yǔ)境文本根據(jù)文本時(shí)間、性別、年齡段的條件對(duì)呈現(xiàn)內(nèi)容進(jìn)行約束。
三、泰語(yǔ)語(yǔ)料庫(kù)索引在泰語(yǔ)教學(xué)上的運(yùn)用
Hunston認(rèn)為語(yǔ)料庫(kù)對(duì)語(yǔ)言教師的職業(yè)生涯影響體現(xiàn)在兩大方面:一是語(yǔ)料庫(kù)會(huì)導(dǎo)致對(duì)一種語(yǔ)言的新的描寫,從而使教師對(duì)教什么的看法產(chǎn)生根本性的轉(zhuǎn)變;二是語(yǔ)料庫(kù)本身能被用來(lái)開發(fā)新的教學(xué)材料,并為新的大綱設(shè)計(jì)、教學(xué)方法奠定基礎(chǔ)。
(一)從學(xué)習(xí)者的角度來(lái)看,運(yùn)用泰語(yǔ)語(yǔ)料庫(kù)檢索督促學(xué)生自學(xué)能力的培養(yǎng),完成教師角色的轉(zhuǎn)換
在信息時(shí)代,教師不再是全能的課堂控制者,也不再是唯一的信息源。教師的角色開始從信息源(source of knowledge)轉(zhuǎn)換為學(xué)習(xí)過(guò)程的組織者(organizer of tasks or opportunities for learning)在外語(yǔ)學(xué)習(xí)的過(guò)程中,學(xué)習(xí)者通過(guò)語(yǔ)言接觸自己發(fā)現(xiàn)規(guī)則、做出假設(shè),并在語(yǔ)言運(yùn)用中不斷檢驗(yàn)和修正自己的假設(shè),這種學(xué)習(xí)方式又稱為數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)(Data-driven learning)同傳統(tǒng)外語(yǔ)教學(xué)相比,數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)具有以下主要特征:1)以學(xué)生的自主學(xué)習(xí)為主要的過(guò)程特征;2)以真實(shí)語(yǔ)言為主要語(yǔ)言輸入;3)強(qiáng)調(diào)探索和發(fā)現(xiàn)的學(xué)習(xí)過(guò)程。
泰語(yǔ)語(yǔ)料庫(kù)的出現(xiàn)使學(xué)習(xí)泰語(yǔ)的學(xué)生能夠得到大量真實(shí)、針對(duì)性強(qiáng)的泰語(yǔ)語(yǔ)料資源,同時(shí)這些語(yǔ)料資源通過(guò)在線檢索已經(jīng)被整理排序,并根據(jù)所要求的跨距呈現(xiàn)語(yǔ)料所在的上下文語(yǔ)境,對(duì)學(xué)習(xí)者理解語(yǔ)料的前后搭配詞和在真實(shí)語(yǔ)料中出現(xiàn)頻率最高的搭配方式有直觀的認(rèn)識(shí)。這和以往泰語(yǔ)學(xué)習(xí)者只通過(guò)查詢字典和利用網(wǎng)絡(luò)搜索引擎的方式獲得例句的方式相比更加有利于對(duì)關(guān)鍵詞的理解。因?yàn)樽值渲谐霈F(xiàn)的例句帶有很強(qiáng)的字典編寫人員的主觀性,而利用搜索引擎搜索出的例句重復(fù)度很高,常常一個(gè)頁(yè)面的例句其實(shí)都是同一句話,利用語(yǔ)料庫(kù)索引搜索可以避免以上情況的發(fā)生。下面以名詞 后是跟表示對(duì)象的介詞 還是 為例來(lái)說(shuō)明泰語(yǔ)語(yǔ)料庫(kù)索引在泰語(yǔ)教學(xué)中的運(yùn)用:
介詞 和 都可以在名詞 后連接表示對(duì)象的名詞性結(jié)構(gòu),學(xué)習(xí)泰語(yǔ)的學(xué)生也常常不知道到底是 正確還是 正確。當(dāng)有這樣的疑問(wèn)時(shí),教師就可以讓學(xué)生自己利用泰語(yǔ)語(yǔ)料庫(kù)來(lái)尋找問(wèn)題的答案。
首先在索引關(guān)鍵詞里輸入 以及搭配詞
,得到表(一):
再在索引關(guān)鍵詞里輸入 以及搭配詞 ,得到表(二):
首先我們想從表一、表二中判斷文體是否對(duì)這兩個(gè)介詞的選擇具有影響,所以可以采用統(tǒng)計(jì)學(xué)中的列聯(lián)分析的方法,看分類型變量“文體”和分類型變量“介詞”是否獨(dú)立。因此我們給出原假設(shè)H0:在置信度為95%的情況下,行變量“文體”和列變量“介詞”是獨(dú)立的。并將上述三個(gè)變量“頻數(shù)”、“文體”、“介詞”及相應(yīng)數(shù)據(jù)代入SPSS軟件中,得到如下結(jié)果(表(三)):
從表(三)中學(xué)生可以很清楚地看到p=0.000<0.05,所以拒絕原假設(shè),得出結(jié)論:在置信度為95%的情況下,文體和介詞的選擇是不獨(dú)立的,即:文體對(duì) 后選擇介詞“ ”還是“ ”是有影響的。
另外,還可以利用表(一)和表(二)的數(shù)據(jù)得到反映具體每種文體中使用詞頻的對(duì)比柱形圖—表(四)(見上頁(yè))。
從表(四)中可以得出以下結(jié)論:名詞
后既可以用 ,也可以用 ;并且兩個(gè)介詞的使用詞頻差別不大;但在文本的有些文體上出現(xiàn)差異較大,在報(bào)紙文本中 的使用頻率較高,而在法律文本中 的使用頻率較高。
(二)從教學(xué)者的角度來(lái)看,運(yùn)用泰語(yǔ)語(yǔ)料庫(kù)檢索對(duì)泰語(yǔ)教學(xué)的影響
1.語(yǔ)料庫(kù)和語(yǔ)料庫(kù)索引本身就是真實(shí)的、容量巨大的語(yǔ)言數(shù)據(jù)源,可以為泰語(yǔ)教學(xué)大綱的設(shè)定、具體課程的備課提供素材。語(yǔ)言是有生命的,是在不斷變化的。以泰國(guó)國(guó)家語(yǔ)料庫(kù)為例,它是動(dòng)態(tài)的,并不是封閉的,所囊括的語(yǔ)料在持續(xù)擴(kuò)充中,多類型的文本來(lái)源保證了大量的新詞匯被及時(shí)吸收進(jìn)來(lái)。這和傳統(tǒng)的從字典和詞典中找例句和素材的方式相比有著時(shí)效性的優(yōu)勢(shì)。
2.通過(guò)泰語(yǔ)語(yǔ)料庫(kù)索引所提供的詞頻信息,可以確定泰語(yǔ)中的基本詞匯,即使用頻率最高的詞匯,這些高頻詞匯反映了泰語(yǔ)的典型特征。在制訂教學(xué)大綱中就應(yīng)該以這些高頻詞作為教學(xué)的重點(diǎn)內(nèi)容。除了制訂教學(xué)大綱,在教學(xué)、測(cè)試和練習(xí)中也應(yīng)得到相應(yīng)的體現(xiàn)。
3.泰語(yǔ)語(yǔ)料庫(kù)不僅含有大量的詞匯信息,還通過(guò)關(guān)聯(lián)詞的搜索功能可以得到大量的詞法和句法資料,對(duì)研究泰語(yǔ)語(yǔ)法中的詞匯搭配,詞匯的語(yǔ)義選擇趨向都能提供相應(yīng)的素材支持。
結(jié)語(yǔ)
目前,有很多學(xué)者在研究外語(yǔ)教學(xué)中語(yǔ)料庫(kù)所能夠發(fā)揮的作用,而語(yǔ)料庫(kù)語(yǔ)言學(xué)和計(jì)算機(jī)技術(shù)的發(fā)展又給這一研究注入了新鮮的內(nèi)容。學(xué)生在教師的引導(dǎo)下以語(yǔ)料庫(kù)索引為工具,對(duì)語(yǔ)言進(jìn)行觀察、分析和歸納,與學(xué)習(xí)的實(shí)質(zhì)“探索知識(shí)的真諦”相契合。但同時(shí)語(yǔ)料庫(kù)索引技術(shù)的使用又給教學(xué)的實(shí)施者教師提出了更高的要求。尤其是在計(jì)算機(jī)知識(shí)方面的要求。在外語(yǔ)教學(xué)中,任何新思想、新方法和新技術(shù)的應(yīng)用和實(shí)踐,教師發(fā)展始終是主要的瓶頸。泰語(yǔ)教師應(yīng)該消除所謂的“技術(shù)恐懼”,積極利用可供使用的泰語(yǔ)語(yǔ)料庫(kù)和語(yǔ)料庫(kù)索引資源,從而使泰語(yǔ)教學(xué)更富有成效。
參考文獻(xiàn):
[1]Graeme Kennedy,An Introduction to Corpus Linguistics,1998.
[2]衛(wèi)乃興,李文中,濮建忠.語(yǔ)料庫(kù)應(yīng)用研究[J].上海外語(yǔ)教育出版社,2005.
[3]許家金.語(yǔ)料庫(kù)語(yǔ)言學(xué)的理論解析[J].外語(yǔ)教學(xué),2003.
[4]李文中,濮建忠.語(yǔ)料庫(kù)索引在外語(yǔ)教學(xué)中的應(yīng)用[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2001,(2).
[5]楊貝.語(yǔ)料庫(kù)在外語(yǔ)教學(xué)中的應(yīng)用及應(yīng)注意的問(wèn)題[J].洛陽(yáng)師范學(xué)院學(xué)報(bào),2006,(1).