摘 要:提出了一種對(duì)專有名詞字串進(jìn)行自動(dòng)切分的方法,該方法對(duì)大量通用形式的專有名詞進(jìn)行統(tǒng)計(jì)分析,根據(jù)專有名詞用字的出現(xiàn)位置和出現(xiàn)次數(shù)來(lái)分析,并把出現(xiàn)概率轉(zhuǎn)換為估價(jià)值。則根據(jù)中丈專有名詞的特點(diǎn),將中文專有名詞的切分問(wèn)題轉(zhuǎn)換為決策樹(shù)求最優(yōu)解問(wèn)題。采用動(dòng)態(tài)規(guī)劃法選取最優(yōu)路徑,從而確保結(jié)果的整體估價(jià)值最優(yōu)。以中文姓名為例,實(shí)驗(yàn)表明該方法具有很快的速度和很高的正確率,用10個(gè)名字的字符串進(jìn)行測(cè)試正確率為99.66%以上。
關(guān)鍵詞:人工智能; 自然語(yǔ)言處理;專有名詞識(shí)別;動(dòng)態(tài)規(guī)劃
中圖法分類號(hào):TP301
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1001—3695(2005)07—0078—03