摘 要:數據挖掘是一種新型信息分析技術,其在傳統圖書館及數字圖書館中的應用是多方面、多層次的。文章分析了數據挖掘在引文數據庫中的挖掘結構,說明了其實現過程流程,論述了從引文數據庫中能挖掘到的可能結果,最后論證了基于引文數據庫的數據挖掘在圖書館中的應用。
關鍵詞:數據挖掘;引文數據庫;研究
科學研究蓬勃發展,導致文獻數量激增,出現了“信息爆炸但知識貧乏”的現象。人們迫切需要一種能夠集便于檢索、利用和有效收集、評價為一體的現代化檢索工具,如同國外的SCI、SSCI、AHCI等那樣,成為評價科學文獻的重要依據。而同時人們的知識需求不斷向更加深層化和個性化發展,僅僅數據庫和數據倉庫中自動查詢到的表面信息遠遠不能滿足需求,如何發現數據中存在的關系和內在規則,根據現有的數據預測未來的發展趨勢成為人們利用數據庫的主要目的,數據挖掘技術正是在這樣的應用需求環境下應運而生并迅速發展起來的。
1 數據挖掘和知識發現技術
1.1 數據挖掘的定義
數據挖掘技術是為解決信息海量劇增而產生的先進技術,知識發現技術的定義為一個從數據中識別有效的、新穎的、具有潛在效用的并能最終被人理解的模式的非平凡過程。從數據庫中獲取知識,它代表一個從低層次數據中提取高層次知識的全過程,包括對數據信息的收集,數據原型的確定,相關函數的分析,知識的抽取和數據模式分析等一系列過程。……