哈爾濱師范大學(xué)西語(yǔ)學(xué)院 欒 曦
語(yǔ)料庫(kù)的創(chuàng)建對(duì)語(yǔ)言學(xué)的研究具有十分重要的作用。不管是語(yǔ)言的基本規(guī)則還是多樣性的個(gè)體語(yǔ)言,不管是語(yǔ)言的使用還是學(xué)習(xí)過程,都離不開實(shí)際的語(yǔ)言資料,也就是本文研究的主題——語(yǔ)料庫(kù)。本為主要研究了小型法語(yǔ)語(yǔ)料庫(kù)的創(chuàng)建以及應(yīng)用。
目前我國(guó)對(duì)語(yǔ)料庫(kù)的研究大都集中在英語(yǔ)學(xué)科,而法語(yǔ)語(yǔ)料庫(kù)的相關(guān)研究非常稀少,更沒有大型法語(yǔ)語(yǔ)料庫(kù)的建立。英語(yǔ)語(yǔ)料庫(kù)在我國(guó)的研究和發(fā)展已經(jīng)比較成熟,而短期內(nèi)創(chuàng)建大型法語(yǔ)語(yǔ)料庫(kù)的條件還不完善。因此,可以首先創(chuàng)建小型的法語(yǔ)語(yǔ)料庫(kù),其創(chuàng)建可以借鑒英語(yǔ)語(yǔ)料庫(kù)的一些經(jīng)驗(yàn)。
語(yǔ)料的選擇是創(chuàng)建語(yǔ)料庫(kù)的第一步,也是最為重要的一步,它包括語(yǔ)料的搜集和篩選,其中搜集的范圍和質(zhì)量直接決定了所創(chuàng)建的語(yǔ)料庫(kù)的類型和質(zhì)量。因此,在選擇語(yǔ)料時(shí)要與研究的目的相匹配。這就是說,在創(chuàng)建語(yǔ)料庫(kù)之前就需要決定創(chuàng)建的類型,如英語(yǔ)、法語(yǔ)還是日語(yǔ)等,這是要決定的基本范圍,詳細(xì)的還要決定創(chuàng)建的是醫(yī)學(xué)方面的、教育方面的還是日常生活方面的等,只有把這些確定了,才能在搜集和篩選時(shí)有所取舍。此外,選取的語(yǔ)料自身要有代表性,語(yǔ)料庫(kù)中選取的內(nèi)容要能夠最大限度地反映這一語(yǔ)料庫(kù)的特點(diǎn)和使用范圍。
原始語(yǔ)料很大一部分是從網(wǎng)絡(luò)上下載的,這些文本可能存在不規(guī)范的符號(hào)、格式等,也可能會(huì)帶有多余的空格或空行,是不能直接放進(jìn)語(yǔ)料庫(kù)的,必須對(duì)這些原始的語(yǔ)料進(jìn)行處理,刪除多余的數(shù)據(jù),糾正不規(guī)范的地方,以防影響今后語(yǔ)料庫(kù)調(diào)用的準(zhǔn)確度。對(duì)搜集和篩選到的法語(yǔ)語(yǔ)料進(jìn)行預(yù)處理后,以txt 的格式保存,然后利用專門的軟件對(duì)保存到語(yǔ)料庫(kù)的內(nèi)容進(jìn)行詞性和意思的解釋、標(biāo)注。對(duì)每篇語(yǔ)料都加上文本頭,顯示這篇語(yǔ)料的主題內(nèi)容、文字來源等信息。
將搜集到的語(yǔ)料進(jìn)行處理后,要把這些處理完的語(yǔ)料錄入所創(chuàng)建的庫(kù)中。在錄入前需要提前創(chuàng)建一套錄入規(guī)則,保證語(yǔ)料在錄入時(shí)具有規(guī)范性。同時(shí)還應(yīng)該使用能夠批量錄入語(yǔ)料庫(kù)的軟件,提高效率。將語(yǔ)料全部錄入后,還可以進(jìn)一步統(tǒng)計(jì)分析語(yǔ)料庫(kù)中的語(yǔ)料,通過檢索,可以知道高頻詞匯,將所有含有這些詞匯的句子檢索出來,在這些句子里可以總結(jié)出該法語(yǔ)詞匯的使用方法和常見搭配。
語(yǔ)言是一個(gè)非常復(fù)雜的系統(tǒng),對(duì)語(yǔ)言的實(shí)際應(yīng)用比語(yǔ)法系統(tǒng)描述的規(guī)則要難很多,因此,只通過學(xué)習(xí)一門語(yǔ)言的語(yǔ)法規(guī)則是很難掌握這門語(yǔ)言的。語(yǔ)料庫(kù)中搜集的都是人們實(shí)際使用的語(yǔ)言,所以小型法語(yǔ)語(yǔ)料庫(kù)創(chuàng)建后,可以對(duì)語(yǔ)料庫(kù)中的詞匯、語(yǔ)法和話語(yǔ)分析等進(jìn)行研究,為深入研究法語(yǔ)提供基礎(chǔ)。小型法語(yǔ)語(yǔ)料庫(kù)也可以應(yīng)用到很多方面。
在法語(yǔ)教學(xué)中,通過對(duì)創(chuàng)建的語(yǔ)料庫(kù)進(jìn)行檢索可得到一些高頻詞匯以及常用搭配,可通過這些常用的詞匯學(xué)習(xí)近義詞匯的辨析、基本的語(yǔ)法知識(shí)等。法語(yǔ)在我國(guó)高校中的存在相當(dāng)于小語(yǔ)種,學(xué)習(xí)人數(shù)相對(duì)較少,因此,法語(yǔ)教學(xué)還存在很多的問題,教學(xué)經(jīng)驗(yàn)也很欠缺。語(yǔ)料庫(kù)中的索引信息可以幫助教師確定教學(xué)的難點(diǎn)和重點(diǎn),針對(duì)學(xué)生展開針對(duì)性的練習(xí),對(duì)于構(gòu)建多層次的法語(yǔ)互動(dòng)教學(xué)模式有很大的推動(dòng)作用。
利用小型法語(yǔ)語(yǔ)料庫(kù)還可以加強(qiáng)日常生活中與人交流的能力。通常情況下,學(xué)習(xí)到的法語(yǔ)知識(shí)或句子都是比較書面化的,而這些書面化的用語(yǔ)在與人交流時(shí)給人一種文縐縐的感覺,讓人產(chǎn)生距離感,不夠親切。而語(yǔ)料庫(kù)中收錄的都是使用過的,還有一些本身就是在日常交流中用到的,通過語(yǔ)料庫(kù)學(xué)習(xí)到的日常用語(yǔ)會(huì)更加地道,更加適合交流與溝通。
技術(shù)的發(fā)展和社會(huì)的進(jìn)步對(duì)語(yǔ)料庫(kù)的創(chuàng)建和發(fā)展起到了很大的推動(dòng)作用,進(jìn)而推動(dòng)了語(yǔ)言學(xué)的發(fā)展和進(jìn)步。早在20 世紀(jì),語(yǔ)料庫(kù)就已經(jīng)是研究語(yǔ)言的重要工具。近年來,語(yǔ)料庫(kù)在外語(yǔ)教學(xué)、科研活動(dòng)和交流溝通中都起到了很大的作用。但是,相較于英語(yǔ),我國(guó)對(duì)于法語(yǔ)的研究還很少,而法語(yǔ)語(yǔ)料庫(kù)更少,創(chuàng)建小型的法語(yǔ)語(yǔ)料庫(kù)對(duì)于法語(yǔ)在我國(guó)的發(fā)展有很大的幫助。