【摘要】:大數據時代沖擊了世界,改變了生活。同時也對檔案管理產生了影響,對檔案部門的管理人員發起了新的挑戰。這種背景下的對管理模式變化的研究,不僅能夠有效的保護資源,而且能夠加強職能建設,從而促進檔案事業發展。本文通過對相關文獻研究總結,深入研究分析大數據時代下應該對檔案管理研究的內容,提出管理大數據時代下檔案的有效路徑。
【關鍵詞】:大數據時代;檔案管理;數據資源;檔案
1大數據時代
1.1大數據來源與發展
大數據來源于Apache Org的開源項目Nutch,主要用于描述更新網絡所需的數據集合。1980年,在《第三次浪潮》中描述的大數據含義與現在意義相差很大。在2008年,Nature雜志系統的介紹了大數據的價值。同時Science雜志也從互聯網、經濟等方面對大數據進行了深入分析來闡述大數據的重要作用。近年來,大數據的重要作用逐漸凸顯,美國更是提出“大數據研究計劃”,旨在通過科學化的利用大數據使各重要領域都能有進一步的突破。自此,各歐美國家和我國也開始加入對大數據研究的隊伍中。
1.2 大數據定義
大數據的概念比較抽象,各領域對此的界定也沒有達到一個共識,并沒有確切的定義。一般來說將涉及到的大量資料大到無法通過軟件整理,在一定時間內通過管理對經營者有促進作用的訊息稱為大數據。
1.3 大數據類型
大數據類型多,根據特征可以主要分為三種:結構化、半結構化和非結構化數據。其中,通過表結構可以實現的數據稱為結構數據,不能實現的視為非結構數據,介于二者之間的稱為半結構數據。大數據時代的數據類型和過去的相比,非結構數據增多,處理也越來越麻煩。
2檔案管理體系的變化
因為科技的發展,使得大數據時代對于檔案數據的數量,管理水平以及軟件的開發要求越來越高,和以往的管理模式完全不同。檔案的信息化衍生了很多新的理念和觀點,不斷豐富完善了檔案管理理論。
2.1大數據觀
大數據時代數據量的劇增對技術提出了新的挑戰,這個時代的數據不再是樣本,而是所有數據的集合。從而產生了一種新生的理念,即一切數據皆有用。
現在很多人仍然對大數據的認識并不全面,甚至還存在很多疑惑。這是因為大數據是非常大的。這個“大”并不是對數據量大小的描述,而是對其價值的描述。同時大數據必須是越多越好的。在進行問題分析時,應該主要對數據科學而系統的分類和整合。雖然大數據目前并無同一定義,但所有的說法都是對現有技術而言的,隨著科技的發展,其定義也必然會一次次發生改變。過去因為一些主客觀的原因,在數據處理時并沒有遵循數據處理原則,但是現在,技術相當發達,應該盡快建立起大數據觀,將單個沒有意義的數據放進集體數據庫中發揮它應該有的作用。
2.2大檔案觀
大數據既然認為一切數據皆有用,就必然對所有數據都很重視,因此要建立檔案觀。檔案能夠真實地反映人們的各種活動。
我們可以從兩個方面理解大檔案觀的理念。一是降低了檔案的門檻,使能夠歸檔的范圍更寬了。社會產生的有利用價值的信息也都可以歸檔,能夠及時的掌握最新信息,不至于被遺忘。更加親民化的服務信息對管理也產生了很大的作用。二是檔案的存放地更加廣闊。檔案不僅僅存放在檔案館里,也可以無處不在,只要能夠被檢索利用,就說明它是潛在檔案。
2.3大服務觀
大數據存在的目的是為了更好的為人類服務。雖然大數據是技術變革的產物,但大數據又不僅僅只是技術的變革,更體現了計算機行業的來臨。通過計算機更好的利用大數據,改變人類的生產和生活,服務大眾。同時,檔案用戶也不僅僅只滿足于單純的對于文件的利用了,而是希望獲得蘊藏的知識能量。多元化方向的發展使得檔案管理必須有所改變,更加重視服務方向。
3檔案資源體系的變化
檔案資源的巨大便于部門開展工作,而越來越多的數據資源也更好的服務了大眾。在信息化的時代,各種信息不斷涌現,呈爆發式增長。
3.1數據來源更廣
與傳統精挑細選的信息不同,現在的信息來源更加廣泛,網絡化和社會化?;ヂ摼W時代更是大大的激發了信息的產生,通過統計,來源于網絡的數據最多。中國擁有大量的網絡用戶,網站的建立,互聯網的普及等使網上信息數量劇增,成為檔案數據的主要來源。其次,更加數據化的數據來源也使得相關部門更關注民生。
3.2數據內容更豐富
大數據時代,數據數量的增多必然也使得數據內容更加豐富。主要表現在以下幾個方面:
一是數據數量增大,檔案資源迅猛增長。數據的迅猛增長在很大程度上豐富了數據的內容。更加規?;臄祿Y源能夠更好地發揮其自身價值。
二是數據類型增多。傳統的檔案資源多為紙質版和實物,而如今,時代的變幻使得大數據時代的檔案除了傳統的紙質,實物等常見種類,又增加了電子檔案等。這些種類各異的、特征多樣的檔案被用不同方式保管,表達不同的信息內容,共同組成了檔案數據大集群。
三是價值密度降低。和一般的信檔案相比,檔案是最真實的歷史記錄,價值非常高。
很多檔案進館后就基本失去作用了。而利用率高且大的檔案在館藏中幾乎不存在,重要的檔案所占比重非常低。
四是數據更新速度加快。大數據時代,對于檔案的管理工作更加講究的是方便快捷。不僅能夠對于有用的信息能夠快速的攫取,還要求檔案管理員能夠迅速的在大量的信息中找到找到所需的信息。因此必須運用新技術快速處理檔案資源。
3.3數據的收集方式多樣化
數據最重要的就是收集,傳統的管理主要是人工移交,但是這樣會對資源造成損毀和丟失。大數據時代,對數據的收集要求更嚴,方式也更多。
第一,強制收集。因為檔案管理工作的復雜,使得很多單位都不愿意主動移交檔案,并以各種借口拖延,而且加上法規的不健全,很難及時對檔案收集完整。因此必須制定相關制度,對檔案強制收集。
第二,實時捕捉。信息化時代各種信息更新速度很快,如果不能及時捕捉很可能就永遠丟失。怎樣將有價值的信息快速準確地捕捉歸檔,對管理員也是一個大的挑戰。因此必須借助網絡技術,實時把握動態資源,進行科學捕捉。
4檔案安全保障體系的變化
檔案管理必須要求安全,因為檔案安全了,才有可能保障國家和人民安全。大數據時代的到來帶來了各種沖擊,當然對安全工作也造成了一定的影響。數量的增大、種類的增多以及更新的速度加快,都對檔案的安全造成了一定的隱患。要確保檔案的安全,必須從保管條件、應急管理等方面著手,對于紙質檔案,一定注意防潮防火,音像檔案要遠離磁場,光盤要防磨損,硬盤要防震,電腦要保持電源穩定等等。
總結
大數據時代帶來的各方面的影響是顯而易見的,對規章制度,管理人員等也都提出了新的要求。除了使檔案管理體系發生變化外,對數據資源體系、利用服務體系以及安全保密體系等也都造成了一定的變化。使數據資源來源更廣、內容更豐富等??茖W的應對各種沖擊,尋找有效的管理途徑,更好地完成大數據時代下檔案管理的工作,才能更好的利用資源服務大眾,發揮檔案資源的價值。
參考文獻:
[1]《中國電子科學研究院學報》編輯部.大數據時代[J].中國電子科學研究院學報,2013 (2):27-30
[2}張心源,李白楊.大數據概念、技術及應用[J].創新科技,2013 (9):43-44
[3]陳明潔.大數據時代對檔案現代化影響和要求[J].檔案管理,2013 (6):48-49