王靜 辛玉明 高鴻雁
〔摘 要〕數據挖掘技術可以幫助人們在海量的信息資源中提取隱含的、潛在的、有價值的信息,因此已經被引入到了處理爆炸式增長的檔案信息資源中。而待挖掘的信息是否完整、規范直接關系到之后的挖掘質量。本文根據檔案信息資源的現狀以及檔案數據的特性,在給出執行具體挖掘操作前的數據采集和數據預處理各個環節的概念描述的基礎上,探討各個環節的注意事項及具體實現方法。
〔關鍵詞〕數字檔案館;數據挖掘;數據采集;數據預處理
DOI:10.3969/j.issn.1008-0821.2012.06.018
〔中圖分類號〕G270保罰 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)06-0072-03