0 引言
主題詞是從文章中選取出來(lái)用于反映全文主題內(nèi)容的單詞或術(shù)語(yǔ)。主題詞提取在文獻(xiàn)檢索、自動(dòng)文摘、文本分類、文本聚類等方面具有十分重要的作用。中文網(wǎng)頁(yè)主題詞提取可以幫助人們快速了解網(wǎng)頁(yè)的主要內(nèi)容,但實(shí)際應(yīng)用中由于中文網(wǎng)頁(yè)信息量大且更新速度快,很少擁有作者標(biāo)注的主題詞,手工添加主題詞又是一項(xiàng)繁瑣且主觀性較強(qiáng)的工作。因此,研究中文網(wǎng)頁(yè)主題詞提取技術(shù)具有重要的理論意義和應(yīng)用價(jià)值。