文?毛雯
大數據時代檔案管理思路創新
文?毛雯
隨著云計算、物聯網、社交網絡等新興媒介的服務大眾化,人類社會的數據種類和規模正以前所未有的速度在提升,大數據(Big Data)時代正式到來。大數據是指傳統的數據庫軟件工具所不能夠獲得、存儲、管理和分析的數據,比較有代表性的大數據的定義是3V定義,即認為大數據需要滿足三個特點,規模性(volume)、多樣性(variety)和高速性(velocity)。檔案作為國家機構、社會團體組織以及個人從事政治、軍事、經濟、科學、技術、文化、宗教等活動直接形成的具有保存價值的各種文字、圖表、聲像,應遵循“統一領導,分級管理;維護檔案文件的完整與安全;便于社會或組織的利用”三個原則進行管理。
表面上看大數據的思路和檔案管理的基本原則似乎截然不同。檔案要求統一管理,要有精確細致的分類,要保證其完整性與安全性。而大數據思想則強調數據的多樣化,通過多樣化、廣渠道的數據分析避免單一數據源帶來的誤差。所以大數據相關技術的應用要基于一個開放式的系統,而檔案則要建立起一個相對封閉的管理系統。然而,盡管大數據的一些理念初看上去似乎與檔案管理的要求格格不入,但是從社會發展的整體趨勢上看,我們會發現正是由于大數據的產生,才有可能對延續至今的檔案管理工作傳統模式帶來創新和改變,促使檔案管理工作日趨完善、便捷。
透過檔案工作的發展歷史,可以發現檔案管理工作的思路幾乎沒有多少創新改變,所承擔的責任也一直都很具體明確,所謂的變化也只是技術進步以后發生的信息載體的變化。而在大數據的思路下,檔案管理發生改變的將不僅僅是信息載體,還有檔案管理工作的業務重點和業務流程。
(一)大數據化檔案管理是信息社會的必然
自從計算機和信息技術蓬勃發展至今,人類所創造的信息量比之前兩千年產生的信息量的總和還要多,極其驚人的信息量不僅僅是創造財富的來源,也成為信息管理機構必須要應對的負擔。如果不對這些海量信息加以區分,數據存儲過少必然會導致有價值信息的流失,數據存儲的冗余和過多則會帶來高昂的成本,在技術上也不現實。
檔案文件所記錄的是整個社會最核心的一部分數據,其管理和組織工作必然也會水漲船高,隨著整個社會信息量的爆炸而大量增加。大數據技術的相關理論對于分析和確定信息的價值有非常重要的意義,在大數據的幫助下,檔案管理應該成為這個信息社會的基石,擔負起記錄全社會最有價值信息的重擔。
(二)大數據成為完成多元化的信息管理的重要工具
以往檔案管理的變化只體現在信息載體發生改變帶來的被動變化,從結繩記事到甲骨文,再到竹簡和紙質書籍,信息都是存在于不同媒介上面的可辨認的字符。如今,信息體現為存儲在硬盤、光盤、網路、二維碼等電子媒介上面的數據,這種新的數據存儲形態與以往的信息載體有著本質的區別。新的信息形態的有著智能化的優點,但是大量的信息數據中所存在的噪聲也會相應增多,同時許多非結構化的數據也為這些數據信息的管理帶來了較大困難[6]。
處理多元化的信息資料的來源,還需要大數據相關技術來解決。尤其是如今的數據存儲媒介好多可以實現智能化分類,之前主要靠人工完成的工作逐漸被智能化的算法所取代,紙質的檔案文件也會逐漸被電子數據所代替。許多檔案館已經進行了信息化的改造,包括引入檔案管理系統、為紙質檔案添加磁條等進行區分和識別。這些已有的信息化投入對于大的檔案館來講還遠遠不夠,檔案管理機構應該充分做好準備迎接數字化檔案信息的管理挑戰。
(三)大數據時代檔案管理工作的責任作用更加突顯
傳統的檔案管理職責非常明確,那就是維護好檔案文件的信息完整與準確,盡可能發揮這部分信息的社會應用價值。而大數據時代,檔案管理的作用不再限于這些,新算法的更新和智能處理方式會讓檔案文件信息發揮出新的價值。對未來檔案管理部門的新功能做出預測的文獻有很多,有的學者從智能化城市發展的視角,認為檔案管理應該作為城市基本信息的一個樞紐,做好不同部門間基礎信息的統一化和維護工作,保障智慧城市中的信息安全[4];有的學者分析了未來檔案文件數字化之后,認為從原本的文件管理等基本工作向知識管理這種創新性工作的轉化,檔案管理的專業性和知識性要求會不斷提升[6]。
信息是一種重要的非常珍貴的資源,檔案是被識別出來應該妥善保存的有價值的信息載體。檔案管理機構作為一個知識庫和信息庫,在未來整個社會的信息化建設過程中,必然會承擔起越來越多的責任,大數據則是幫助我們去解讀和利用這部分信息的一個有力工具。
(一)樹立明確的準則和目標
利用大數據改善、提升檔案管理工作的服務要求,需要有所側重,突出重點,否則會深陷海量數據當中,受困于數據的規模,并因目標不明確、準則不具體而難以獲取有價值的信息,使得原本精確細致的檔案管理工作喪失本意。
樹立明確的目標和準則,意義就在于對檔案中的數據作用進行定位,從而縮小數據的選擇范圍,在利用數據、提供服務時可以更加專業,更加直接,達到事半功倍的效果[7]。
(二)注意規避潛在的風險
數據和信息在社會中扮演的角色越來越重要,從而使數據的安全性也顯得原來越重要。所以,盡管檔案信息的價值毋庸置疑,而其涉及個人隱私或者工作機密的私密性也不可小覷。檔案數字化信息資源盡管查詢方便、占用空間小,但是其安全性問題如何保障仍然非常關鍵。電子數據文件常常存在著損壞等故障等風險,一旦數據不可恢復,所造成的損失是無法挽回的。此外,網絡黑客問題也是一個必須重視的問題。原先實體化的檔案安全問題,只要提高安全防范意識就能夠解決,而對于聯網電子數據的安全問題,則在很大程度上依賴技術上的防范和改善。因此,大數據的到來,對于檔案管理的工作來說既是機遇同時也是挑戰,檔案管理機構應該積極擁抱這種新思想,挖掘數據和信息的價值是最有發展潛力的事業,檔案管理將不再是信息資源的“倉庫”,而應該借助大數據這個生產工具,成為信息資源產生價值的“生產工廠”。
·
[1]孟小峰,大數據管理:概念、技術與挑戰,計算機研究與發展[J],2013,50(1):146-169
[2]王珊,王會舉,架構大數據:挑戰、現狀與展望,計算機學報[J],2011,34(10):1741-1752
[3]McKinsey,Big data The next frontier for innovation,competition,and productivity[M],2011
[4]李小晨,大數據時代背景下的檔案管理探討,云南檔案[J],2013,6:48-50
[5]陳智為,檔案管理學[M],北京:中國人民大學出版社,2008,9
[6]李國杰,程學旗,大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考[J],中國科學院院刊,2012,27,(6):648
[7]張健,檔案數據庫“脹庫”問題研究[J],檔案學通訊,2012(4):49
(作者單位:齊魯師范學院)
