阮景雯
摘要:檔案管理工作是許多機構的基礎管理工作之一,而隨著數字化進程的加速,許多機構依據自身的需要已建立起了相對完善的數字檔案信息管理平臺,為自身的檔案管理和利用提供了方便。作為信息技術發展的重要成果,數據挖掘技術在數字檔案信息管理中也得到了廣泛的普及,對推動檔案信息管理的進步起著重要的作用。本文從數據挖掘的定義和技術方法出發,總結了其于數字檔案信息管理中的應用模式和重要意義。
關鍵詞:數據挖掘 數字檔案 信息管理
中圖分類號:TP3 文獻標識碼:A 文章編號:1007-9416(2016)05-0000-00
隨著科技的發展和計算機技術的日漸成熟,人類已經進入了信息化時代,這使得人們生活和工作的方方面面都結束了傳統的重復性的工作模式,變得更加便捷。在檔案信息管理工作中,由于其工作內容相對繁雜,數據量相對較大,因此,計算機技術的應用大大改進了以往的工作模式,滿足了信息的共享性、時效性和便捷性等多種特征。數據挖掘作為檔案信息管理工作的重要信息技術之一,具有其自身獨特的功能和地位。
1數據挖掘的定義
隨著數據學科的興起,越來越多的科學家針對數據挖掘等技術進行了深入的研究,現在,數據挖掘已經成為一個專門的學術領域,橫跨多個學科,涵蓋了統計學、數學、機器學習和數據庫等多方面內容。從普遍意義上而言,數據挖掘就是從包含大量模糊、隨機、有噪聲的數據中通過一定的技術手段進行識別,將有效的、新穎的、或者潛在有用的數據進行集中處理,進而形成可以理解的知識。在實際應用中,數據挖掘往往通過各種分析工具的利用,從海量的數據中發掘模型和數據之間的關系,并可以據此作出一定的預測。
2數據挖掘技術方法
數據挖掘技術的方法有很多,主要包括:
(1)分析方法:主要包括統計分析方法,諸如回歸分析和時間序列分析、多元分析等。其中,回歸分析針對自變量和因變量及其之間的變化關系進行分析;時間序列分析利用時間序列模型進行相應的分析。
(2)決策樹:在信息理論的基礎上對數據進行分類,在建立決策樹的同時,也生成了相應的規則,并可以據此預測數據。主要包括分類及回歸樹法,卡方自動交互探測法等等。
(3)神經網絡:即通過模擬人腦的思考結構進行一定的數據分析,具有一定的自我學習功能,并以此調整對應的參數,借以得到有關的資料。該方法可以對大量復雜的數據進行分析。
(4)相關規則:主要進行關聯分析,按照“如果——則”的邏輯進行有關數據資料的細分。
(5)數據可視化:通過一定的、合適的圖形等進行數據的展現和表示,同時,該方法還支持多維數據的可視化,有利于從不同的層次進行有關的分析。
除了上述方法之外,數據挖掘技術的主要方法還包括遺傳算法、近鄰算法、粗糙集、聯機分析處理等等,不同的方法都有其適用的不同數據庫或者數據資源,為有關數據的信息化處理提供了更多的方便。
3數據挖掘技術在檔案信息管理中的應用模式
3.1檔案信息的收集
檔案信息的收集是數據挖掘技術應用于檔案信息管理的重要內容之一。其主要內容是概念模型的建立,也就是通過一定基礎的數據分析,對有關的數據或者集合按照一定的方法進行描述,即建立起有關的模型,并據此對比測試相應的樣本對象等,在能夠獲得較高準確性的基礎上,以此作為標準,繼而將不同種類的對象進行劃分。例如,在檔案管理者針對某一信息進行錄入后,則數據庫會自動生成相應項目的屬性描述,即形成了一個標準模型。當同類的信息再次輸入時,數據庫則會按照該標準模型對信息中的不同項目按照屬性進行分類,大大節約了工作時間。
3.2進行檔案分類
在檔案管理中,其工作任務相對繁重,主要是因為數據量較大,而對檔案進行分類整理往往需要耗費大量的精力。但是,通過數據挖掘技術的施行,可以自動對大量不同的檔案依照屬性的不同進行不同級別的分類,可以輔助有關的檔案管理員進行更高效率的檢索。該功能的主要過程為:依照某些數據的不同特征對其進行分類,使之形成相應的訓練集;在此基礎上,建立對應的分類模型,對數據庫中的其他數據進行分類。
3.3檔案信息的分析與整合
檔案的建立以及檔案信息化管理的重要用途之一,就是為了在特定時期,有關的管理者可以對數據庫中的龐大數據進行迅速的信息提取、分析、整合,繼而使其發揮應用價值。利用數據挖掘技術,有關的管理者可以針對某種現象發生的原因進行深入的分析,并挖掘背后的原因繼而采取一定的措施,杜絕此類現象的出現。另外,數據挖掘技術還可以針對有關的檔案查閱等,提供相應的信息便于管理者做好充足的準備。例如,在某個檔案的管理網站中,數據挖掘可以自動統計使用者大量查閱檔案的高峰期,有關的管理人員可以據此做好充足的準備,并采取一定的措施預防網站癱瘓等問題的發生。
4數據挖掘技術應用于檔案信息管理的意義
數據挖掘技術的應用為檔案信息的科學高效管理提供了更加便利的條件,使得繁重冗雜的檔案管理工作擺脫了傳統的模式,使得其上升到了新的管理層面。智能化、信息化的檔案數據管理提升了有關數據處理的速度,這不僅節約了有關管理人員的工作時間,同時,也降低了其工作難度,提升了管理者的工作效率和工作水平。
另一方面,數據挖掘技術的應用對檔案信息管理的保密性和保存時間等多方面也具有十分重要的意義。一般而言,檔案信息的保存往往具有較高的保密性,有關信息的泄露很可能引發一系列嚴重的問題。而對于某些特殊機構等,其保管的檔案往往在具有一定機密性的同時,也需要進行長期的保存,借以保存或者提升其價值,但是在使用過程中,很可能出現檔案信息的丟失等現象。而采用數據挖掘技術,這些問題和不良現象可以得到相應的改善。
5結語
綜上所述,數據挖掘技術在檔案管理工作中具有十分重要的意義,它不僅提升了檔案管理的效率,還增強了檔案的使用效率,這對當前的檔案管理工作而言是一個重大的進步。
參考文獻
[1]高燕飛,陳俊杰.試析計算機數據挖掘技術在檔案信息管理系統中的運用[J].內蒙古師范大學學報(哲學社會科學版),2012,04:44-46.
[2]欒志福.探討檔案信息管理系統中數據挖掘技術的應用[J].吉林省教育學院學報(下旬),2015,11:149-150.