周楠

摘 要:通過新思維、新方式、新資源觀、新能力闡述了大數據時代檔案管理的發展趨勢。
關鍵詞:大數據;檔案管理;管理趨勢
大數據是一種技術,更是一種理念,它的出現對各行各業都產生了巨大影響,推動著社會快速發展。大數據時代,檔案作為其中一種重要數據、企業信息資源的核心,將給檔案工作帶來新的發展的契機,同時迎來諸多的挑戰。
一、新思維
大數據視角下,檔案作為數據中不可缺少的重要組成部分,檔案管理工作面臨著前所未有的變革和挑戰。第一,企業檔案工作主要負責檔案資源的收、藏、管、用,一直以來重藏輕用,提供簡單的借閱及編研工作。大數據時代,數據的提取、計算、關聯、預測等技術將顛覆傳統的信息開發利用模式,給檔案開發利用工作帶來更多挖掘的可能性,更廣闊的發展空間,檔案工作將從關注保管轉向利用服務。第二,大數據給檔案安全保密工作帶來了巨大挑戰,數據丟失、更改、失真以及數據泄密等安全隱患風險將大大提高,使檔案工作將從關注檔案保管轉向數據監管、維護及處置、利用審批。第三,大數據與檔案資源的融合,極大提高檔案工作“智能化”,改變了檔案工作傳統管理模式,檔案工作也從技術含量低端轉向高端。第四,有學者提出檔案工作未來研究重點是“數字檔案資源整合與服務”,著力解決利用服務的適應性問題,企業檔案管理的重點將轉向跨專業、跨部門、跨系統、跨業務的檔案資源整合和服務的協同創新與合作。
二、新方式
大數據給檔案工作帶來最大的改變是檔案業務環節側重點的變化,以往,檔案工作多關注于收集,往往為無法齊全完整的收集到文件材料而想盡各種方法,而大數據時代影響檔案工作卻是信息的隱匿和泛濫,關注點將轉移到數據的挖掘以及有效信息的提取。檔案業務環節變化如下:
從圖表中的比較可以看出,大數據時代給檔案工作方式帶來了極大變化。首先,收集工作,傳統檔案工作往往會在收集工作中耗費大量精力,運用各種方式方法去減少收集工作中的漏洞,被大家所熟知的“三納入、四參加、四同步”的要求,主要目的也是為能夠順利開展收集工作,將檔案工作設立在各個業務關卡,來確保檔案的齊全、完整,但由于檔案工作與企業業務工作脫節,很多單位對此要求的執行難以落到實處,對于收集工作并未明顯改善。而利用大數據技術,使得各類數據的抓取和捕獲將變得愈加容易,以“流處理”的模式將數據閃存,收集成本逐漸降低,檔案收集工作的難題將從根本得到解決。
其次,整理工作,以往檔案工作會耗費大量時間進行整理、裝訂,這些技術含量低、大量繁重的手工勞動占據了檔案工作者的大部分時間,使得檔案工作一度被輕視。傳統檔案資源中每份檔案相對獨立,檔案資源的整合方式也相對單一,一般以人工手段按事件、項目、課題歸類,將零散的文件聚集在一起,物理上使得檔案具有邏輯性,但事件之間、項目之間、課題之間難以建立互通聯系,難以挖掘更深層次的關系,對于提供決策支持顯得力不從心。大數據技術使得互不連通的檔案信息整合為連通的數據庫成為可能,將所有信息數據化,包括非結構化數據和半結構化數據,通過數據尋找關聯,使檔案的價值得到成倍增加。
最后,利用工作,長久以“提出需求-檢索答案-解決問題”守株待兔的低層次利用模式,解決問題的成功率受制于著錄信息是否完整全面,其效率依賴于檢索工具的科學性,利用目的多以工作查考為主,利用載體形式單一,以紙質原生信息(即檔案)為主,難以提供知識服務及決策支持。大數據時代,當業務系統的海量數據集成和融合后,大數據分析技術會以計算機算法和邏輯規則給出人工難以得出的分析結果。服務內容,從提供孤立檔案轉變為知識服務,基于海量數據的關聯性分析,大數據在趨勢預測和發現隱性關聯方面具備相當優勢,使得各項業務、各專業、各個年代之間有機聯系在一起,為決策問題打開局面,為技術創新提供更多思路。服務方式,從坐等用戶上門轉變為主動推送,通過對用戶特征數據、行為數據、歷史數據、反饋數據實時分析,跟進用戶需求,滿足用戶個性化利用需求。同時,在處理用戶查詢過程中系統能夠及時不斷地提供反饋,根據反饋結果更改、調整、優化、完善用戶服務策略。利用效率,不在局限于實地查閱借閱,減少用戶與檔案人員的溝通成本,以及信息不對稱而導致查詢失敗,不再受時空限制隨時獲取。
三、新資源觀
傳統檔案資源一般包括文書檔案、科技檔案、專門檔案、聲像檔案、實物檔案,這些檔案只集中收集企業內部的部分信息。大數據之所以稱為“大”,包含了傳統的小數據和現代的大記錄,小數據指有根據的數字,大記錄的表現形式是文本、圖片、音頻、視頻等。大數據廣泛存在于各個領域、各個行業、各個學科,包括企業管理、科技、生產、采購、倉儲、營銷、運輸等各個方面產生或采集的各種信息、數據,企業檔案資源要運用大數據技術,企業檔案就要與企業其他信息、數據一同納入大數據資源管理,形成大的資源觀。面向數據的管理方式使大量數據實現有效管理,有效打破信息孤島,建立信息共享、開放、再利用。
檔案資源角度,從國家檔案局頒布的十號令可以看出,檔案管理的范圍覆蓋了企業所有管理工作中形成的文件材料,檔案的歸檔范圍得到了極大的擴充,向“一切歸檔”的終極目標更進一步。實現“一切歸檔”的終極目標,需要企業檔案管理平臺實現與各個業務系統廣泛連接和實時交互。“將檔案系統融入企業其他信息系統,不僅要讓各系統中生成有價值的文件、數據能直接在線歸檔,還要提供與領域業務流程及數據應用需求深度融合的解決方案,讓檔案資源隨時在各系統的運行環節發揮作用”。
信息資源角度,具有信息資源屬性的圖書、情報、檔案是企業信息資源的核心組成部分,這三類信息資源具備很多共性,有著類似的工作內容和目標,均涉及保存和提供利用工作,大數據技術給圖書、情報、檔案一體化帶來了良好的發展機遇,可以將三類信息資源相互融合,構成三位一體的信息資源數據庫。
四、新能力
1.檔案數據安全
數據全生命周期、全過程、全面質量管理、風險管控的理論和技術條件日趨完善,同時,企業對于檔案工作數字服務的需求日趨強烈,電子文件亟待從雙套雙軌制走向無紙化單軌制,與大數據行動融合。檔案的原始記錄性、憑證性是檔案工作者在大數據時代關注和探究的重點,檔案的原始記錄性一旦無法保證,將會帶來連續性錯誤,錯誤的存儲、分析、計算導致錯誤的結果及決策。因此,要建立全面的數據信息安全保障體系,確保檔案的真實完整、安全利用、可追溯。
2.檔案信息保密
檔案資源的開放與保密一定程度上存在著矛盾,大數據時代下,急需在檔案的開放與保密中找到解決之策。人們常常容易陷入到兩種誤區中,一部分認為,現在已無密可保,有密難保,只注重檔案的服務利用,而忽視了其保密要求,一部分認為,為避免泄密,將檔案束之高閣,脫離現實服務需求,兩種誤區都將阻礙檔案工作的健康發展。因此,對一些涉密及關鍵重要檔案數據在文件形成時甚至之前就進行有效識別,運用技術手段確保檔案數據源頭及其全生命周期的安全。在檔案數據的保密性得到有效保障的同時,充分發揮可公開檔案數據的服務功能。在盡可能降低檔案信息安全風險的同時,最大限度的開放服務中尋找平衡。
3.檔案管理技術
首先,大數據包含很多方案、技術、模塊,企業信息系統需要前期論證和不斷嘗試,找到適合企業的功能模型,兼具安全性、操作性、適用性。其次,大數據的其中一個特點便是數據量大,在數據量足夠大時才能發揮出預測趨勢、尋找關聯的功能,企業如何獲取足夠的數據,獲取多大量的數據,以及數據的選擇才能支持大數據技術的發揮。再次,大數據包含結構化數據和非結構化數據,結構化數據便于數據的提取處理,而非結構化數據的提取處理還需要更加便捷高效的處理方式。最后,大數據的關鍵技術提取和挖掘工作,需要在企業信息系統中建立固定模型,并不斷挖掘新算法,對雜亂的數據進行萃取、提煉、分析。
在大數據環境下,檔案工作迎來了新的機遇和挑戰,引入大數據管理理念是檔案工作發展的重要方向,檔案部門應積極探索,創新檔案工作管理模式,更新對檔案工作的傳統認識,有效提升檔案服務能力。
參考文獻:
[1]安小米.大數據時代數字檔案資源整合與服務的機遇與挑戰[J].檔案學通訊,2017(06):57-62
[2]王 波,郭紅玲.基于信息生態的企業檔案融合利用研究[J].航空檔案,2019(02):46-49.
[3]張 茵.軍工科研院所檔案管理平臺面向數據管理的應用創新思考[J].航空檔案,2019(02):50-54.
[4]徐子沛.數據之巔[M]中信出版集團,2017:255-287
[5]張 玲.大數據2.0時代文獻資源融合與共享利用研究——以圖書、情報、檔案文獻信息資源為例.檔案管理[J],2015:36-37