摘 要:中文分詞系統(tǒng)性能的好壞直接影響到后續(xù)的工作,而歧義字段的處理更是衡量一個分詞系統(tǒng)好壞的重要標志。解決歧義問題前首先就要找到歧義字段,本文在之前的增字最大匹配算法基礎上,提出了一種結(jié)合逐字掃描算法和逆向最大匹配算法的歧義字段識別方法。實驗結(jié)果表明,這里提出的算法執(zhí)行效率要比增字最大匹配算法效率高,速度更快。
關鍵詞:中文分詞; 逆向最大匹配算法; 歧義識別; 算法優(yōu)化
中圖分類號:TN91134 文獻標識碼:A 文章編號:1004373X(2012)08