王益平
(哈爾濱市水利機械工程公司)
摘 要:隨著計算機技術和互聯網的不斷發展和普及,大數據時代正在到來。檔案資源作為記錄重大事件的有效數據信息,對人類社會發展有著重要作用。在這樣的時代背景下,檔案資源的相關管理工作也就更加復雜。目前,我國的檔案管理工作中,存在著一定的數據安全問題,可用的管理人員也相對較少。檔案的數字化資源的有效管理工作非常具有難度。本文將主要針對大數據時代檔案數字資源的整合問題作出分析,希望能夠通過討論得出有效的解決措施。
關鍵詞:大數據時代;檔案數字資源;整合;難點;對策
現代化社會中,管理工作者普遍認為數據才是管理工作中最重要的元素。隨著大數據時代的到來,數字化資源已經逐漸成為主導人類生活的基礎性資源。檔案資源作為記錄人類社會發展的重要資料,對人類社會有著重要的意義。在大數據時代發展背景下,檔案工作的難度也相應增大。為了使檔案管理工作更加高效、有序的進行,檔案管理相關部門應改進和完善原有的數據資源處理方式,這樣才能是檔案管理工作的進行更加科學,從而促進我國檔案事業的發展。
1 大數據時代背景下檔案資源的特征
大數據的構成相對較為復雜,所呈現出的狀態也相對多樣,但其作用本質是為了使人類社會向著簡單化發展。大數據的主要思想,就是其“預測”思想。在這種思想的指導下,人類可以找到解決某一問題的新視角與新方法。因此,大數據也在社會發展中得到了廣泛的應用和普及。這樣的發展趨勢,也會幫助大數據在無意間逐漸的改變人們的社會生活的方方面面。在這之中,人類社會的各種資源也整隨著時代特征出現變化,檔案就是其中的一個具體表現。
1.1 數據量大,增長迅速
在大數據時代,我國檔案數字資源建設可分為“增量檔案電子化,存量檔案數字化”兩大部分二據國家檔案局的統計資料顯示,我國檔案館館藏檔案資源豐富,僅國家檔案館在}l}ll年的館藏已達3.3億卷,預計到2020年將達到6億多卷州引隨著館藏檔案數字化工作的推進,它們將匯聚成巨大的檔案數字資源庫二另一方面,在大數據時代,電子檔案的數量成倍增長二它不僅包含電子文件、圖表、聲像、數據庫等,更會包括那些在紙質保管時代,因單位信息價值低經鑒定沒有歸檔價值的原始記錄,如訪間日志、瀏覽軌跡等二因為大數據技術能挖掘出以前無法為人們所發現的數據的潛在價值,因此有必要對數據的檔案屬性進行重新鑒定,自然會有海量數據新增到檔案領域。
1.2 檔案資源分布廣泛
在大數據時代,信息資源的分布更加廣泛。隨著人類對數字資源逐漸增加的使用與探索,數字資源的發展速度整逐漸加快。加之移動終端的飛速發展更導致了數據產生方式呈現出多樣性的特征二可見,大數據時代的檔案數字資源將廣泛存在于不同的信息系統中,會帶有明顯的時空特性,呈現出結構化信息、半結構化信息和非結構化信息相融合的態勢,形成分布廣泛的大量異構數據。
1.3 數據資源的高度可靠性
在資源的利用過程中,人們最為注重的是資源是否真實、可靠。大數據時代背景下,資源本身數量十分巨大,這就導致了人們獲取信息的價值密度正在相應的減小。現實生活中,對于不了解的事實,人們更加傾向于通過查閱資料來增進自己對其的認識,進而在根據所了解到的事實作出判斷。作為記錄人類社會的事件的重要信息,檔案具有其他資料所不具備的真實性。它是人們普遍相信的最可靠的信息來源。在大數據的背景中,工作人員應利用大數據的基本知識,完成對檔案資源的進一步開發和管理,以實現檔案資源的存在價值。
2 數字化檔案資源的整合
隨著大數據運用的逐漸深入,繁多的檔案資源在整合的過程中存在著很多重要的問題。其中,檔案數據的存儲安全問題和隱私保護問題,是必須得到高效保障的。另外,隨著檔案數據的增多,管理人員的數量問題也是一個必須要解決的難點問題。
2.1 數據存儲間題
在大數據時代,檔案數字資源整合的首要挑戰來自數據存儲。一是檔案管理系統在面對海量數據時需要高可擴展性的支撐二而目前集中式的數據存儲和管理模式非但資金投入較大,更無法適應檔案數字資源體量激增的新情況,在檔案數字資源的高效存儲和快捷訪間方面面臨嚴峻挑戰。二是目前基于關系型數據庫研發的檔案管理系統無法適應大數據時代占數據總量80%以下的非結構化數據存儲和處理的需要。
2.2 數據分析間題
大數據時代是一個泛在信息、泛在知識的時代,隨著信息化程度的加深,檔案數字資源的來源結構將發生巨大變化,傳統的基于封閉的結構化數據進行的數據挖掘算法在分析處理非結構化數據時存在局限。而且,要獲得大數據分析的價值,就應關注檔案數字資源中的數據關系和語義表征,實現信息整合與知識整合。但目前檔案數字資源整合還處于數據整合階段,偏重于實現異質異構數據在物理或邏輯上的集中和互聯互通,僅能為用戶提供信息檢索服務,這與大數據時代的要求相去甚遠。
2.3 安全隱私間題
檔案數字資源不同于其它信息資源,它是國家和社會精心挑選并保存下來的真實的歷史記錄,其中包含著大量國家秘密、工作秘密、個人隱私等重要信啟、,事關國計民生。在大數據時代,如何對檔案數字資源中敏感數據的所有權和使用權做出明確界定?如何選擇合適的安全防護策略以適應數據非線性增長的需求,杜絕安全隱患?如何應對大數據分布式處理帶來的數據、隱私等的泄露風險?這些都是擺在我們面前不可回避的重要課題。
3 解決問題的對策
想要解決資源整合問題,就需要對檔案數字資源的管理工作進行相關改進。工作人員需要靈活應用云技術和數字處理技術,來提高檔案部門的工作效率。
大數據時代賦予了檔案數字資源新的特征,因此要實現其整合在很大程度上考驗著檔案基礎數據的質與量。這就要求檔案工作者突破固有狹義的檔案資源觀的局限,在大數據技術和理念的指引下,積極構建適應大數據時代的“大檔案觀”。即要從“社會記憶”的高度重新審視檔案數字資源的構成范圍和收集視角,改變過去以黨政機關文書檔案為主體的收集模式,加大對社會民生、對個人等復雜化、碎片化信息的關注,使檔案能真正反映政治、經濟、科技、文化、社會生活等的全貌,反映國家和社會的實時變遷。
從技術上來說,實現大數據時代檔案數字資源整合的關鍵是要建立適應大數據要求的檔案數字資源分析生態系統,這就需要云計算技術與大數據處理工具的協調配合。云計算(Cloud Computing)技術具有虛擬資源池化、高可擴展性、高可靠性、按需付費、泛在接入等顯著的特征。它適應了大數據時代分布式存儲與海量數據并行處理的需要,實現了計算機資源的服務化,是大數據時代擋案數字資源整合的基礎平臺和支撐技術。
結束語
為適應大數據時代的發展趨勢,檔案數字資源整合工作必須得到有效的保障。相關工作人員應該對目前工作中存在的難點問題進行深入的研究和解決,以推動我國檔案數字資源的發展,進而使整個檔案管理工作能夠適應大數據時代的發展趨勢。
參考文獻
[1]周峰林大數據時代的數字檔案館(室)建設——專訪國家檔案局檔案館(室)業務指導司司長孫鋼[J]浙江檔案,2013.(8).
[2]楊冬權關于隨館藏數量增加而相應增加各級國家檔案館人員編制的提案[N].中國檔案報,2013-03-07.
[3]馮惠玲,張輯哲檔案學概論隊[N].北京:中國人民大學出版社,2006.endprint