摘 要:介紹了一個中文術(shù)語自動抽取系統(tǒng),該系統(tǒng)首先基于互信息計算字串的內(nèi)部結(jié)合強度,從而得到術(shù)語候選集;接著從術(shù)語候選集中去除基本詞,并利用普通詞語搭配前綴、后綴信息進一步過濾;最后對術(shù)語候選進行詞法分析,利用術(shù)語的詞性構(gòu)成規(guī)則進行判別,得到最終的術(shù)語抽取結(jié)果。實驗結(jié)果表明,術(shù)語抽取正確率為72.19%,召回率為77.98%,F(xiàn)—測量為74.97%。
關(guān)鍵詞:術(shù)語抽取;互信息;語料
中圖法分類號:TP391
文獻標(biāo)識碼:A
文章編號:1001—3695(2005)05—0072—02