摘要:隨著計算機網絡的發展,各種文本資源以驚人的速度增長,導致信息搜尋困難和信息利用率低下。而快速高質量的Web文本聚類技術可以滿足用戶方便快捷地從互聯網獲得所需要的信息資源。文章對Web文本聚類如網頁采集、去噪、分詞、特征表示等關鍵技術進行研究,對常用的Web文本聚類算法進行了分析比較,所給出的分析比較結果對文本聚類算法的應用有現實意義。
關鍵詞:文本挖掘;文本挖掘;web文本聚類;web文本預處理;聚類算法
計算機時代2010年10期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現代工業經濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業管理與科技》2024年6期
9《現代食品》2024年4期
10《衛生職業教育》2024年10期
關于參考網