文/陳戴丹
語料庫的發展歷史將近60年,它是以真實語言使用中的語言事實為依據,借助現代化計算機技術,采用數據式驅動實證研究方法,對語言以及語言學習和運用進行全面的研究,從而獲得更多成果的語言數據庫。它的開發建設和應用得到了全世界的重視。語料庫已經成為當代語言學理論研究、應用研究等領域中不可或缺的基礎資源。我國也在借鑒國外經驗的基礎上結合我國國情以及外語學習者實際所需,在漢語、英語、日語等語料庫的建設開發、語料庫語言學、語料庫翻譯學等方面開展了廣泛的研究并取得了豐碩的成果。
17世紀,語言研究開始重視研究自然發生的語料,研究者們開始大量收集真實語言數據,在客觀的分析這些語言使用現象的基礎上進行一系列的實證研究。這種研究方式在19世紀得到了認可并迅速發展,語料庫成為了語言學研究的基礎資源,也成為了經驗主義語言研究方法的主要資源。20世紀60年代以來以全世界尤其是西方發達國家的語言學界為首,英語和法語語料庫的建立給語言應用與研究提供了極大的便利。語料庫也從原始手工階段發展至第一代電子語料庫階段、第二代電子語料庫階段及現在的第三代電子語料庫階段。語料庫的種類也開始變得多樣化,根據特點被分為各種類型。從時效性來說可以分為共時語料庫與歷時語料庫;從選材來說可以分為抽樣語料庫和全文語料庫;從應用方式來說可以分為書面語料庫和口語語料庫;文體上來說還可以分為書面語語料庫和口語語料庫等。
與西方英語、法語語料庫的發展相比,日語語料庫的建設與發展顯得相對遲緩。上世紀50年代,日本使用計算機收集了報刊用語調查,但遺憾的是并未能夠發展成為語料庫。一直到90年代受BNC英國國家語料庫公開的影響,日本才開始逐漸踏入語料庫階段。步入21世紀后,日本前后開發了CSJ(日語口語語料庫)、太陽語料庫以及現在利用者最多的BCCWJ(現代日語書面語均衡語料庫)。
我國到目前為止建立起來的大多也都是英語語料庫,并且都是英語學習者語料庫。學習者語料庫與一般語料庫的不同點在于,它是通過計算機處理學習者的語言后產出的文本數據庫。因此學習者語料庫的建立可以幫助深入研究語音、語法、語用、教材編寫、測試、課程授課等學習以及教學研究。其中較具有代表性的就是JDEST(交通大學科技英語語料庫)、CEEC(中國英語教育語料庫)、COLSEC(中國學習者英語口語語料庫)等。日語方面,北京日本學研究中心在2002年開發完成了中日平行雙語語料庫,該語料庫收錄了2013萬多字的中日文本語料。值得一提的是,這也是目前中日兩國間公開的、具有檢索功能的近20個語料庫中唯一一個由國內日語研究中心開發的語料庫。除此以外,國內的很多高校都在利用科研項目基金嘗試性的建設各種不同類型的日語語料庫,但眾所周知,語料庫的開發建立需要龐大的財力與精力,并非個人或者小團體能夠快速完成的,因此日語語料庫的開發建立工程遲緩不前。
日語語料庫的應用有著其極高的價值所在。在日語的教學、研究、學習中,語料庫能夠給予的幫助是多方面的。
在學生的句子使用中,有時候語法上看起來沒有任何錯誤,但會感到不自然。事實上這跟詞匯的選擇是否正確有著很大的關系。按照場合選擇詞匯是直接決定所產出的語言是否自然的關鍵所在。語料庫的應用可以改善學生的詞匯選擇問題。另外,大多數的教材都是經過加工處理的,很多詞匯已經喪失了語言的真實性而變得枯燥無味,通過語料庫采集的詞匯更加真實直觀,利于學生的理解和應用。
以往的翻譯,一般都是簡單的雙語對譯,這種方式對學生的翻譯效果甚微,句子看起來死板無趣,通過語料庫的運用,能夠讓學生感受到最本土化、最真實的語言運用,能夠有效培養學生的翻譯能力,提高其翻譯水平。另外還可以加強學生語感的訓練,對今后更高水準的口譯和筆譯起到非常積極的作用。
任何兩種語言,在語法上都不可能完美的替換與契合,這中間需要語言產出者對語法進行熟悉和靈活的運用轉換。然而,由于受到母語的影響,很多學生的作文顯得非常的“中文化”,表達方式差強人意,語言運用很不自然。而我們的寫作或者語法教學很容易就進入到給學生灌輸“死規律”的模式,教師課堂上提供的例句也僅僅是教師自省式的內容或者書本教參上的例句。
與其他課程相比,視聽說課程不會受到太大的局限,教師可以按照日語研究與教學發展的方向,將語料庫導入課堂。根據學生的實際情況,調動內容新穎、題材有趣的視聽材料,改變以往“聽錄音、做練習、對答案”這種單一的教學方式,從而有效提高視聽說課的教學效果。也可以通過語料庫,截取與課堂相關內容的視頻,讓學生在觀看真實語境下的語言使用后再結合課堂講解,從而更好的進行表達方式的訓練,同時還能加深對異國文化的理解。
在編撰教材的過程中,可以通過語料庫的分析對比,準確的判斷并篩選出常用且有用的語言知識,從而設計出更合適的語言教材,能夠讓學生在有限的時間內通過該教材得到最好的學習效果。
可以幫助學生的自主學習、自我探索、自主選擇學習內容。學習者運用檢索手段來解決學習中遇到的問題。這種學習模式不但能讓學生牢記通過努力所得到的語言知識,還可以激發其學習動機,形成良性循環。
課本上的內容往往脫離現實,帶給學生距離感,有研究者建議可以通過輸入大學入學考試、日語專業四級及八級考試、學生自由寫作等內容,或將學期末學生的口語考試內容進行錄音上傳等方式,形成新的校本語料。這些產生于身邊的語言資料不但可以讓學習者引起共鳴,還能夠實現資源共享,更好的為教師的教學、語言使用分析研究、學生的學習提供便利。
高校畢業設計階段,學生在選題過程中存在選題過大、觀點陳舊、內容空洞等問題。畢業論文的撰寫往往就會變成語言知識的總結、參考文獻的羅列。通過利用語料庫撰寫畢業論文,能夠幫助學生尋找到較小的切入點,發現語言知識的本質,快速查詢所需要的數據,詳細的了解其內容及應用,最后深入的分析語言現象和使用規律,從而有效提高畢業論文的質量。
盡管語料庫的發展已經初具規模,其應用也十分廣泛,但我國高校在日語語料庫的使用頻率上卻并不算高。其主要原因是我國高校缺乏對日語語料庫的認識與全面的認知,影響了日語語料庫作用的發揮。
隨著語言學研究的發展與高校教研成果的積累,日語語料庫的發展逐漸跟上英語語料庫的腳步,呈現壯大趨勢。越來越多的語言研究者和高校教學工作者發現,大數據研究已經成為主流。因此日語語料庫的發展也勢必會提高要求,產生新的變化,變化特點主要有:
隨著計算機技術的提高,數據處理已經變得不再困難。語料庫的詞匯量不斷擴大,處理龐大的詞匯量已經不再成為問題。不斷擴大的語料庫容量可以為我們提供源源不斷的語言研究資源。
隨著語料庫使用者的增多,語料庫的數量也在不斷的增加。勢必會對語料庫的性能、正確率、便利程度提出更高的要求。今后的日語語料庫必將實現規范化,這是語料庫繼續發展的重要前提之一。規范的語料庫能夠更好的實現資源共享,也為語料庫之間的比較研究及融合提供了很好的準備條件。
語料庫的種類繁多,根據社會各領域的需求不同,必然會產生新的專業語料庫模態,比如科技日語語料庫、醫用日語語料庫等,日語語料庫在各專業的應用和建設范圍將進一步擴大。
隨著人們對語料庫的逐漸認識,語料庫的使用將會更加的頻繁。在網絡軟件的幫助下,語料庫的建設和使用變得不再困難,使用便捷、費用低廉、操作簡單這些特點會在今后日語語料庫的使用上得到呈現。
語料是需要及時更新和發現的,時代在進步,新的知識、新的詞匯不斷在增加,及時添入新信息、淘汰舊信息,發現術語和專有名詞在各個階段的意義、發現語言在各個國家和各個時代代表的意義、發現語言變化的趨勢等,是語料庫逐漸智能化的體現。
大型語料庫的資源雖然龐大,但未必適合小規模的、小范圍研究的需要。越來越多的專用語料庫會逐漸產生。比如:應用型高校不斷增加,為了迎合社會所需,培養復合型人才,許多高校開設了復合型人才培養的相關課程,而這些課程的學習需要語料庫的幫助。如何開發供某一課程使用的小型語料庫,同時能夠與跨學科課程結合使用,是日語語料庫發展的又一趨勢特點。
正確認識日語語料庫現狀,了解日語語料庫在教學及研究中的應用,對今后日語語料庫的建設至關重要。尤其是高校外語類教學研究工作,更需要熟練掌握外語語料庫的應用方法,洞察當前所需,為今后更好的建設外語語料庫奠定基礎。
[1]施建軍,徐一平.語料庫與日語研究[J].日語學習與研究,2003(4)總第115期.
[2]閻萍.語料庫在日語視聽課中的應用探索[J].佳木斯職業學院學報,2016(4)總第161期.
[3]葉章勇.英語語料庫建設及應用研究:現狀與趨勢[J].寧波廣播電視大學學報,2014(1)第12卷.