摘要:語(yǔ)料庫(kù)基于實(shí)例收集語(yǔ)言數(shù)據(jù),可以作為一種方便的研究方法用于各種語(yǔ)言研究,并具有機(jī)器可讀的優(yōu)點(diǎn)。此外,在日語(yǔ)教育中,由于日語(yǔ)學(xué)習(xí)者人數(shù)的增加和需求的多樣化,可以通過(guò)語(yǔ)料庫(kù)制作學(xué)習(xí)者需要的教學(xué)大綱、教材開(kāi)發(fā)、詞典編纂等。本文從詞典編纂的角度描述了語(yǔ)料庫(kù)在面向日語(yǔ)學(xué)習(xí)者的詞典中的應(yīng)用。在此基礎(chǔ)上,基于對(duì)使用語(yǔ)料庫(kù)的專(zhuān)業(yè)術(shù)語(yǔ)的研究成果,我們將考慮如何使用語(yǔ)料庫(kù)來(lái)編寫(xiě)學(xué)術(shù)術(shù)語(yǔ)詞典。
關(guān)鍵詞:語(yǔ)料庫(kù);日語(yǔ)學(xué)習(xí)詞典匯編;專(zhuān)業(yè)術(shù)語(yǔ);學(xué)術(shù)專(zhuān)業(yè)術(shù)語(yǔ)詞典
一、研究動(dòng)機(jī)
語(yǔ)料庫(kù)語(yǔ)言學(xué)記載描述了語(yǔ)言運(yùn)用中大量的個(gè)別語(yǔ)言。此外,強(qiáng)調(diào)經(jīng)驗(yàn)和習(xí)慣,并使用定量語(yǔ)言模型方法。換句話(huà)說(shuō),就是將某個(gè)語(yǔ)言社區(qū)的數(shù)據(jù)作為樣本進(jìn)行定量收集。
近年來(lái),日本已經(jīng)發(fā)布了各類(lèi)各式的語(yǔ)料庫(kù),但仍然存在各種問(wèn)題。日本國(guó)立國(guó)語(yǔ)研究所設(shè)計(jì)了“現(xiàn)代日本語(yǔ)書(shū)き言葉均衡コーパス(BCCWJ)”(正在建設(shè)中),以解決之前無(wú)法均衡整體地反映日語(yǔ)本身的問(wèn)題。以BCCWJ為代表,可以說(shuō)日本的語(yǔ)料庫(kù)研究已經(jīng)發(fā)展到世界一流水平。
使用這些語(yǔ)料庫(kù),可以進(jìn)行例如習(xí)得研究、詞匯研究和語(yǔ)法研究等范圍廣泛的研究。使用語(yǔ)料庫(kù)來(lái)搜索語(yǔ)法研究所必需的例句等雖然不能說(shuō)是語(yǔ)料庫(kù)語(yǔ)言學(xué),但對(duì)于發(fā)現(xiàn)新的語(yǔ)言現(xiàn)象,或者做出某種發(fā)現(xiàn),開(kāi)發(fā)語(yǔ)料庫(kù)分析工具也是相當(dāng)重要的。
2. 使用語(yǔ)料庫(kù)編譯詞典的背景和類(lèi)型
實(shí)際上,語(yǔ)料庫(kù)的使用研究早已應(yīng)用于詞典編纂。從例句卡的使用時(shí)期到現(xiàn)在,詞典編纂的歷史相當(dāng)悠久。隨著科學(xué)的發(fā)展和計(jì)算機(jī)處理能力的提高,語(yǔ)料庫(kù)的使用與詞典編纂的關(guān)系更加密切。
當(dāng)前的詞典編纂不同于以前的詞典編纂,使用通過(guò)語(yǔ)料庫(kù)來(lái)收集詞匯句子,并分析其含義和用法的方法。此外,發(fā)現(xiàn)目前的詞典編纂在材料質(zhì)量、收集材料的效率、新發(fā)現(xiàn)的可能性和客觀性方面更具優(yōu)勢(shì)。
基于以往的研究,研究人員正在嘗試使用語(yǔ)料庫(kù)創(chuàng)建各種類(lèi)型的詞典。田野 (2010) 描述了使用語(yǔ)料庫(kù)和編譯搭配詞典的可能性。奧村等 (2003) 提出了一種使用語(yǔ)料庫(kù)自動(dòng)構(gòu)建擬聲詞概念詞典的方法。除此之外,還有許多使用語(yǔ)料庫(kù)選取專(zhuān)業(yè)術(shù)語(yǔ)的建議。
3. 專(zhuān)業(yè)術(shù)語(yǔ)詞典的應(yīng)用及學(xué)術(shù)專(zhuān)業(yè)術(shù)語(yǔ)詞典的構(gòu)想
杉本等(2010) 在女性研究領(lǐng)域進(jìn)行了一項(xiàng)專(zhuān)業(yè)用詞提取實(shí)驗(yàn)。具體而言,他們提出了一種新的專(zhuān)業(yè)術(shù)語(yǔ)提取方法,該方法考慮了目標(biāo)領(lǐng)域語(yǔ)料庫(kù)和其他領(lǐng)域語(yǔ)料庫(kù)之間候選術(shù)語(yǔ)出現(xiàn)率的差異。通過(guò)比較MDP提議方法和三種現(xiàn)有方法的各前25個(gè)詞提取結(jié)果,發(fā)現(xiàn)兩種類(lèi)型的提取錯(cuò)誤。(1)提取了學(xué)術(shù)論文特有的術(shù)語(yǔ)。 (2)提取了一些常用詞語(yǔ)。從實(shí)驗(yàn)結(jié)果來(lái)看,與常規(guī)專(zhuān)業(yè)術(shù)語(yǔ)提取方法相比較,顯示了所提方法的有效性。
本文采用杉本等人提出的MDP方法,將前10位的術(shù)語(yǔ)按照專(zhuān)業(yè)術(shù)語(yǔ)提取量表的值降序排列。得出以下10個(gè), “woman,feminist,gender,feminism,self,movement,article,feminist theory,way,lesbian”。正如杉本等人所指出的,傳統(tǒng)術(shù)語(yǔ)詞典的創(chuàng)建和更新是由專(zhuān)家手動(dòng)完成的,需要大量成本比如時(shí)間。使用計(jì)算機(jī)自動(dòng)提取專(zhuān)業(yè)術(shù)語(yǔ)是一種有助于快速創(chuàng)建和更新專(zhuān)業(yè)術(shù)語(yǔ)詞典的技術(shù)。語(yǔ)料庫(kù)的使用提供了快速創(chuàng)建專(zhuān)業(yè)詞典的潛力,對(duì)于有利于平衡減少詞典編譯的數(shù)據(jù)偏向方面的缺點(diǎn)。
從日語(yǔ)教育的角度來(lái)看,日語(yǔ)學(xué)習(xí)者的人數(shù)逐年增加(砂川 2009),根據(jù)學(xué)習(xí)者的需要高效地制作必要的詞典與語(yǔ)料庫(kù)的使用密切相關(guān)。此外,在日本實(shí)施30萬(wàn)留學(xué)生計(jì)劃的現(xiàn)在,對(duì)于在日本大學(xué)和研究生院就讀的國(guó)際留學(xué)生而言,學(xué)習(xí),理解和掌握學(xué)術(shù)專(zhuān)業(yè)術(shù)語(yǔ)是非常有必要的。
4、在學(xué)術(shù)術(shù)語(yǔ)詞典編纂中的應(yīng)用
石澤(2013)中提到,“學(xué)術(shù)通用基本詞匯”在大學(xué)的各種講座中被普遍使用。因此,紙質(zhì)教材「語(yǔ)彙ドン!―講義理解のために學(xué)んでおきたい語(yǔ)彙―」的試用版已經(jīng)完成。石澤通過(guò)詞性分類(lèi)進(jìn)行了整理,本文僅展示其中的一部分。名詞有「共同,共有,効果,交換,向上,構(gòu)造,公平,効率,試み」,動(dòng)詞有「関する,加える,超える,生み出す,導(dǎo)く」等。
此類(lèi)教材的創(chuàng)作被認(rèn)為對(duì)在日學(xué)習(xí)的日語(yǔ)學(xué)習(xí)者非常有用。然而,在課堂上學(xué)習(xí)教材以外的時(shí)間里,或者課堂上沒(méi)有時(shí)間學(xué)習(xí)這些教材的情況下,有必要編纂一本學(xué)術(shù)術(shù)語(yǔ)詞典以便日語(yǔ)學(xué)習(xí)者自學(xué)。
在本文中,我們使用語(yǔ)料庫(kù),參考杉本等人提出的專(zhuān)業(yè)術(shù)語(yǔ)提取方法,基于教材、論文、書(shū)籍等研究,提取了與石澤定義相同的學(xué)術(shù)術(shù)語(yǔ),可以認(rèn)為對(duì)于在日留學(xué)生而言,學(xué)術(shù)專(zhuān)業(yè)術(shù)語(yǔ)詞典的編纂具有一定的意義。
參考文獻(xiàn)
[1].石澤澈(2013)《利用日本語(yǔ)學(xué)術(shù)共同詞匯數(shù)據(jù)庫(kù)進(jìn)行的詞匯教材開(kāi)發(fā)-針對(duì)在大學(xué)學(xué)習(xí)的詞匯習(xí)得-》 漢字日本語(yǔ)教育研究第3號(hào)
[2].奧村敦史,齋藤豪,奧村學(xué)(2003)《基于Web文本語(yǔ)料庫(kù)自動(dòng)構(gòu)建擬聲概念詞典》自然語(yǔ)言處理154?10
[3].砂川百合子(2009)《利用語(yǔ)料庫(kù)的日語(yǔ)教育與研究》日本人工智能學(xué)會(huì)會(huì)刊 24
[4].田野村(2010)《日本語(yǔ)語(yǔ)料庫(kù)和常見(jiàn)搭配——關(guān)于詞典應(yīng)用的可能性》 日本語(yǔ)言學(xué)會(huì)語(yǔ)言研究(138),1-23.
[5].久保順,辻慶太,杉本重雄(2010)《使用不同學(xué)術(shù)領(lǐng)域的語(yǔ)料庫(kù)提取專(zhuān)業(yè)術(shù)語(yǔ)方法的提案》 日本信息和知識(shí)學(xué)會(huì)雜志第20卷,第1期
作者簡(jiǎn)介:魏達(dá)因,1995年3月出生,女,漢族,河南省開(kāi)封市人,碩士研究生,助教,日語(yǔ)教育學(xué)專(zhuān)業(yè),現(xiàn)任廣東外語(yǔ)外貿(mào)大學(xué)南國(guó)商學(xué)院東方語(yǔ)言學(xué)院日語(yǔ)系日語(yǔ)教師。
廣東省哲學(xué)社會(huì)科學(xué)“十三五”規(guī)劃2020年度學(xué)科共建項(xiàng)目“日源外來(lái)詞的回流研究”,批準(zhǔn)號(hào):GD20XWY09。7DD25BAC-E525-4444-BDDE-59A637356A41