摘要:web數(shù)據(jù)挖掘技術(shù)是近年來數(shù)據(jù)挖掘領(lǐng)域的研究重點之一。由于web文檔具有半結(jié)構(gòu)化的特點,在執(zhí)行具體的挖掘操作之前,對web文檔進行預(yù)處理是必不可少的。文章針對web內(nèi)容挖掘的預(yù)處理過程,提出一種以XML作為中介語言進行數(shù)據(jù)預(yù)處理的方法。
關(guān)鍵詞:web內(nèi)容挖掘;XML;預(yù)處理;web文檔
計算機時代2011年6期
1《師道·教研》2024年10期
2《思維與智慧·上半月》2024年11期
3《現(xiàn)代工業(yè)經(jīng)濟和信息化》2024年2期
4《微型小說月報》2024年10期
5《工業(yè)微生物》2024年1期
6《雪蓮》2024年9期
7《世界博覽》2024年21期
8《中小企業(yè)管理與科技》2024年6期
9《現(xiàn)代食品》2024年4期
10《衛(wèi)生職業(yè)教育》2024年10期
關(guān)于參考網(wǎng)