王金鋼
(哈爾濱市結核病防治所,黑龍江 哈爾濱 150000)
當前,隨著檔案信息數字化的推進,可供分析與利用的電子檔案數據正在匯聚成數量宏大的海量信息。以預測為核心的大數據技術,擁有了海量的檔案信息數據基礎。通過大數據技術,快速剔除數字檔案資源中價值較低的部分,高速篩選并整合其中價值較高的部分,為檔案資源開發和利用提供新思路。不僅能有效節省人力、物力和財力,還能使檔案價值得以深度挖掘,為傳統檔案工作與高新技術的結合提供了發展空間。
檔案信息資源共享在大數據技術支撐下可以獲得更好的實現,使檔案利用者不受時間、空間的限制,方便地存取、利用檔案信息資源,不僅實現檔案信息資源共享,還可以縮減檔案利用的時間、存儲管理的成本。為實現跨區域、跨時空獲取所需的檔案信息資源創造條件,達到檔案信息資源共享目的。
傳統的檔案工作包括檔案實體管理和檔案信息管理兩個部分。無論是實體管理與開發利用,都離不開“卷”或“件”的檔案保管單位,隨著大數據時代的到來,“卷”或“件”的保管單位己無法適應大數據所特有的碎片化、及時性、非結構化特征。因而對傳統的檔案管理模式造成了沖擊,使檔案工作必須摒棄落后管理方式,逐漸向智能化的方向發展,有利于實現檔案工作的變革。
大數據時代,檔案信息資源海量增加。不僅檔案機構需接收數據資源越來越多,而且電子檔案也在增多,這種檔案信息資源雙向的、海量的增長,使得檔案數據資源總量劇增。同時,由于檔案信息獲取、傳遞便捷性增加,且任何組織和個人都可能成為檔案信息來源的主體,導致檔案部門業務量增加,對檔案信息的收集方構成挑戰。
人類活動都可被記錄、存儲,通過電視、手機、電腦等各種方式被傳播、復制。因此,人類每時每刻都在制造海量信息。但被各類檔案館(室)收集保存的檔案只是海量信息中的冰山一角,檔案管理技術面臨挑戰。
在大數據的環境下,人們利用計算機所產生的各種信息都能被隨時記錄下來,這就使得其中有價值的信息被保存下來,而這些信息都可作為潛在的檔案信息資源,所以就造成了有用信息與無用信息的冗雜。如檔案部門需將有價值的信息轉化為檔案,就要花費大量的時間進行篩選和分析,這對傳統檔案管理方式產生了沖擊。加之管理對象中既有傳統的紙質檔案,又有圖片、圖表、音頻、視頻等電子檔案,且格式、特征等也各不相同,從而形成了大量的非結構化數據。這種非結構化檔案數據的出現,必須借助大數據等現代技術手段進行規范的管理。
大數據時代要充分挖掘檔案潛在價值,主動為用戶提供服務。大數據時代檔案的價值散布在不同的地方,因為數據量的增加,在眾多數據庫中可以找到許多分散的信息,它們從不同的渠道、不同的側面、不同的傳播媒介,為事件提供最真實、最原始的證明,為傳統檔案增添更鮮活、更豐富的輔助信息。檔案的各種分散的價值,可以更加充分地證明檔案的真實性。充分利用好這些“稀疏”、“隱含”的價值,挖掘出更深層次的價值可以產生更大的效益。如何將這些潛在的檔案信息進行利用和挖掘,為用戶提供極具個性化和可視化的服務,這是大數據對檔案利用服務提出的新挑戰。
檔案安全,既包括檔案實體安全,也包括檔案信息安全。安全問題已成為大數據時代檔案機構面臨的重要挑戰:大數據環境下信息量多、數據量大、涉及面廣,一旦管理出現問題導致數據泄露,終將引發嚴重后果;檔案資源中包含許多涉密信息,其利用權限、開放程度等如不能明確,也將為安全問題帶來隱患;大數據包含內容豐富、價值大,難免會成為網絡黑客攻擊的目標,部分數據受到攻擊必然導致整體數據的受損;檔案軟件自身漏洞也會帶來檔案共享平臺的崩潰。
原始記錄性作為檔案的本質屬性是對當時所處環境、事件最直接、最真實的記錄。傳統紙質檔案內容劃改、印章偽造等造假容易被發現。而現代社會的檔案材料大多數是在計算機中完成的,沒有字跡、用紙和印章等驗證因素,檔案材料在形成之時的造假現象很難被發現。所以,在大數據、云計算等技術高速發展的社會中,檔案工作者即使利用現代化辦公設備也要堅守檔案原始記錄性,在多人電腦審查和電子簽章技術的支撐下保證檔案原始記錄性的留存。
檔案工作的性質也是檔案工作者應該遵循的基本素養。檔案工作是兼具科學性、管理性、政治性與服務性的工作。紙質檔案時期的檔案工作性質容易發揮。數字檔案時代,在網上辦公、網站咨詢、視頻會議、辦公時間和地點靈活的情況下,檔案部門和人員也應該繼續發揮檔案工作的基本性質,逐漸摸索大數據時代檔案工作運行方式,確保在數字檔案時代檔案工作依然能夠發揮檔案工作的性質。同時,我國《檔案法》中對檔案工作的基本原則也有明確規定,即統一領導和分級管理、維護檔案的完整與安全、便于社會各方面的利用。無論紙質時代還是電子時代都不能改變這些最根本原則。
網絡社會任何公民都可能成為某一事件的報道者和消息提供者。加之大數據時代促使了眾籌(Crowd funding)這種新型的融資形式的出現,如果將這種方式與檔案信息服務相結合,將會對檔案界改進發展方式,更好的走向大眾、增強社會影響力起著重要作用。鼓勵大家成為“公民檔案員”,及時傳遞發生在自己身邊有價值的信息;在檔案信息資源的收集中本著包容和實事求是的態度迎接新型檔案資源的收集渠道,這樣才能促進檔案工作的創新發展。
在檔案的整理上,可以采用虛擬整理,即“脫離檔案實體,僅僅通過一套符號及其符號語法邏輯來記錄和揭示檔案之間歷史聯系的技術”等先進技術保證檔案大數據的深層開發。大數據時代收集到的檔案不僅數據龐大,而且形式多樣,檔案分類可不按照現有檔案分類規則進行整理。傳統檔案工作還存在“重藏輕用”的現象,檔案機構被動向利用者提供信息,而大數據背景下的檔案機構要轉變思想,結合現實社會中發展完善的技術手段,如自媒體、微博、微信平臺以及檔案網站等形式主動地向利用者提供個性化的檔案信息服務。