文/張 旭
大數據時代給檔案工作的挑戰與啟示
文/張 旭

在大數據浪潮的引領下,我國各行業開展了廣泛的大數據技術研究,那么,大數據與檔案有什么關系,大數據時代又會給檔案工作帶來哪些挑戰呢,檔案工作者又該如何應對?本文通過分析大數據與檔案的關系,探討大數據時代電子檔案歸檔“雙套制”以及檔案開放問題,為做好大數據時代檔案工作打好基礎
大數據技術能夠通過海量、動態數據的有效集成,推動社會治理的精細化和科學化進程,并有效節約社會治理的成本,已經吸引了世界多個的國際組織以及國家的關注。在大數據浪潮的引領下,我國檔案部門迅速掀起了研究大數據的熱潮,大數據、檔案信息、大數據檔案等概念在學術界反復地出現,那么到底大數據與檔案之間有怎樣的關系,是我們研究大數據必須首先弄懂的一個問題。
大數據的概念應定義為記錄人類社會活動的、具有規模效應的數據集合。《檔案法》規定:檔案是指過去和現在的國家機構、社會組織以及個人從事政治、軍事、經濟、科學、技術、文化、宗教等活動直接形成的對國家和社會有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄。單從檔案的定義來看,除電子檔案外,其他載體形式的檔案與大數據沒有任何關系,只有檔案記錄的信息可以稱之為數據。從檔案的特征來分析,檔案具有社會性、歷史性、確定性及原始記錄性。而大數據也具有類似的特征,大數據也是人類社會活動的原始記錄,其內容也具有確定性,且其記錄的內容只反映事物已經完成的狀態,同樣具有原始記錄性。因此,檔案與大數據的關系僅是具有相似的特征,大數據是具有鮮明檔案特性的數據集合。但是,從數據的保存價值來講,有些數據集合對國家和社會沒有永久的保存價值,不需要永久保存。真正與大數據有直接聯系的,只有電子檔案一種形式,電子檔案與大數據之間是種概念與屬概念的關系。
要應對大數據時代的電子檔案歸檔工作,首先要做好現階段電子檔案歸檔系統與辦公系統的融合,加強電子公文流轉系統的全程控制,按照公文起草、簽發、擬辦的過程存儲形成的電子檔案,確保公文類電子檔案內容齊全。對于專業類電子檔案,應由國家檔案局會同專業部門,分門別類制定有關專業類電子檔案數據標準,確保專業類電子檔案的系統配置、標準規范的盡快落實。其次,要制定檔案數字化計劃,要著眼未來檔案工作發展需要,制定符合實際的檔案數字化計劃,并按照有關技術規范統一數據標準。最后,要瞄準大數據時代電子檔案歸檔工作的需要,研究數據資源采集、管理、發布、分析、利用的數據平臺模型,滿足電子檔案歸檔及管理的需要。
在實際工作中,由于各種原因檔案開放工作與社會的利用需求還存在一定的差距。而在大數據時代,做好檔案開放工作是決定檔案工作成效的重要因素。
(一)大數據時代對檔案開放提出了更高的要求
按照《檔案法》規定,“國家檔案館保管的檔案,一般應當自形成之日起滿30年向社會開放。經濟、科學、技術、文化等類檔案向社會開放的期限可以少于30年”,1991年-2007年,我國各級綜合檔案館館藏檔案年均開放率僅為27.9%,而歐美多數國家檔案開放率已達到或超過60%,美國的檔案開放率甚至達到了90%以上,根據國家檔案局統計,2009年我國國家綜合檔案館的檔案利用為1308萬卷(館藏檔案為28089.2萬卷,開放檔案為6687.4萬卷),可見,我國的檔案開放率與新時期檔案工作的要求還有一定差距。大數據時代,數據已變成經濟社會發展的重要基礎,信息的利用與開發能力在很大程度上決定著整個社會的創新能力,如果不能及時地開放檔案或數據,讓社會公眾掌握充分正確的數據,勢必會影響政府的行政效率、以及社會的創新力。美國聯邦政府的數據開放策略或許會給我們一些啟示,2009年5月至12月,美國聯邦政府開放數據平臺DATA.GOV共收到社會各界約900項開放數據的申請,美國聯邦政府回復:16%的數據立即開放,26%將在短期內開放,36%將計劃開放,還有22%因為國家安全、個人隱私以及技術方面的限制無法開放。因此,面對大數據時代對檔案工作提出的新要求,怎樣順應形勢做好檔案開放工作是檔案工作者必須認真考慮的問題。
(二)影響檔案開放工作的原因
從實際情況看,影響檔案開放的因素有很多,既有檔案意識的原因,也有法律、人才隊伍等方方面面的原因,諸多復雜的因素交織在一起,導致了我國檔案開放工作進展得不甚理想。一是因為法律規定太籠統,《檔案法》規定了檔案應該開放的時限,而對于限制開放的規定則過于籠統,不夠細致;另外,由于檔案部門開放檔案的責任太寬泛,社會各界對于利用檔案的訴求也日益多元,對于檔案工作者來說,開放檔案不僅意味著方便了檔案利用,也意味著承擔了更多的未知責任,檔案利用現實工作中出現的問題也反復在“告誡”檔案工作者,開放檔案一定要“慎之又慎”,這給檔案開放工作確實帶來了很多限制。
(三)如何做好大數據時代的檔案開放工作
數據是大數據時代社會最基本的組成單元,數據采集和處理將成為社會發展的一項重要工作,隨著科學技術的不斷發展,大數據的增長必然是幾何數量的。面對這樣龐大的數據量,如果單純依靠單一部門(比如檔案館)的力量很難做好數據處理工作。對我國檔案工作者來說,明確檔案開放鑒定的主體,由檔案專職人員負責檔案及數據開放鑒定工作,制訂限制開放及利用的清單,在向國家綜合檔案館移交檔案時,由檔案移交單位提出檔案開放意見,注明哪些檔案或數據應該延期開放,延期多長時間,除此以外全部開放。同時,還要以法律的形式列出國家綜合檔案館的免責條款,免除檔案館開放檔案的責任,檔案館只負責提供檔案利用,由于檔案利用而延伸引起的各種責任則與檔案館無關。
(一)搭建“智慧檔案”服務平臺
根據工業和信息化部的統計,目前全國有400多個大中型城市提出了建設“智慧城市”的目標,約占地級以上城市數量的60%以上。雖然“智慧城市”的建設還處在起步階段,但城市運行與管理的各個系統已經在獨立地發展,很多大中城市在智慧交通、智慧金融等系統已經取得了初步成果。檔案部門可以抓住建設“智慧城市”的機會,結合檔案工作實際,提出一套“智慧檔案”服務平臺的完整指標體系,運用信息和通信技術手段,向社會民眾提供跨平臺、跨設備和跨服務機制的檔案數字服務,整合檔案信息化建設形成的“信息孤島”,解決檔案信息化建設的瓶頸問題,真正實現檔案的信息化管理、專業化挖掘、智能化應用,從而為社會創新和社會發展服務。
(二)拓展檔案信息服務領域
在大數據時代的一個重要目標就是對數據獲取和利用的便捷性,在我們提升檔案信息服務能力的過程中,除了要開展檔案信息化以及做好網絡信息平臺的整合,更重要的是要以用戶體驗為中心,把檔案信息服務領域延伸到手機及手持終端領域。根據中國互聯網信息中心的統計,截止2014年6月底,我國移動電話用戶數量已突破12億戶,而手機網民的數量已達5.27億,手機用戶已經成為信息產業的重要客戶群體。檔案部門要著眼于未來手機以及手持應用終端的市場,積極搭建具有拓展性的綜合信息平臺,開發多樣的手機應用APP,使人們隨時隨地都能享受高質量的信息服務。
(三)制訂數據管理體系
大數據時代,任何一個機構都要面對海量數據,而且數據的格式是多種類型的,如果沒有一個統一的數據管理體系,很難做好數據的采集、利用工作。因此,檔案部門要著眼于大數據時代檔案工作的發展需要,積極與信息化統籌部門合作,制訂各種數據的管理體系,對于各行業產生的數據格式、元數據進行規范,確定數據的種類,構建數據檢索系統,為大數據時代的檔案管理打好基礎。
(作者單位:延安市兒童福利院)