□ 徐碩 喬曉東 朱禮軍 張運(yùn)良/中國(guó)科學(xué)技術(shù)信息研究所 北京 100038
薛春香/南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院 南京 210094
廣義后綴樹(shù)及其在漢語(yǔ)科技詞系統(tǒng)中的應(yīng)用研究
□ 徐碩 喬曉東 朱禮軍 張運(yùn)良/中國(guó)科學(xué)技術(shù)信息研究所 北京 100038
薛春香/南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院 南京 210094
科技詞匯知識(shí)是科技信息智能處理的基石,如何加速漢語(yǔ)科技詞系統(tǒng)的構(gòu)建是目前研究的熱點(diǎn)問(wèn)題之一。考慮到中文術(shù)語(yǔ)構(gòu)詞的特點(diǎn),文章引入了一種靈活的數(shù)據(jù)結(jié)構(gòu)——廣義后綴樹(shù),從字面的角度提出了關(guān)系輔助構(gòu)建、任務(wù)分配以及輸入提示等輔助工具,使得知識(shí)工程師的工作更加高效。
廣義后綴樹(shù),漢語(yǔ)科技詞系統(tǒng),關(guān)系構(gòu)建,任務(wù)分配,輸入提示
科技詞匯知識(shí)是科技信息智能處理的基石,長(zhǎng)期以來(lái),以科技類主題詞表為代表的科技詞匯知識(shí)體系存在著編制過(guò)程中知識(shí)丟失、維護(hù)機(jī)制落后、詞更新周期長(zhǎng)、開(kāi)放程度不夠、非面向機(jī)器使用等突出問(wèn)題,難以滿足信息加工和軟件開(kāi)發(fā)需求。為應(yīng)對(duì)這一問(wèn)題,07年在國(guó)家“十一五”科技支撐計(jì)劃課題資助下,中國(guó)科學(xué)技術(shù)信息研究所組織開(kāi)展了漢語(yǔ)科技詞系統(tǒng)的研究和開(kāi)發(fā)工作,并以新能源汽車領(lǐng)域?yàn)樵圏c(diǎn),進(jìn)行了新能源汽車詞系統(tǒng)建設(shè)實(shí)踐,詳見(jiàn)文獻(xiàn)[1,2]或直接訪問(wèn)詞系統(tǒng)管理加工平臺(tái):http:// www.vocgrid.org/。
與英文不同,中文構(gòu)詞有其自身的特點(diǎn),陸汝占教授認(rèn)為漢語(yǔ)是義符文字,詞語(yǔ)結(jié)構(gòu)與意義以名詞為中心,構(gòu)造方式為毗連組合,直接對(duì)應(yīng)概念耦合,實(shí)體類分類由實(shí)體本質(zhì)屬性標(biāo)識(shí)[3]?!?br>