李英
摘 要:大數據時代影響到社會的方方面面,檔案工作也正在發生巨變,“大檔案”概念正在形成,本文闡述了一種大數據時代下的“大檔案”概念及其特征。
關鍵詞:檔案;大檔案;互聯網;大數據;變化
自上世紀90年代起,檔案界就有“大檔案”的表述,但它所表達的含義存在較大差別,如從大局著眼的大檔案觀、構建規模較大的檔案館舍、與文檔、資料合并考量的大檔案觀等等。而文本所說的“大檔案”是指大數據網絡時代下的大檔案,是以檔案資源為核心構建的檔案、情報、圖書、資料等等文獻型信息資源通過云存儲等網絡技術整合后,與相關行業共享共生的一種“大檔案”觀。
它的主要特質表現為未來檔案的社會性、多元性、共享性,以及由此呈現出的先進性。
2012年美國率先提出“大數據”時代已經來臨,大數據技術已經吸引了世界多個的國際組織以及國家的關注,我國不斷推進“檔案數字化建設”和“數字檔案館建設”正是檔案工作邁向大數據時代的
基石。
1 檔案數據與大數據的關系
檔案是指過去和現在的國家機構、社會組織以及個人從事政治、軍事、經濟、科學、技術、文化、宗教等活動直接形成的對國家和社會有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄。因此,不同載體形式的檔案記錄都可稱之為數據。檔案具有社會性、歷史性、確定性及原始記錄性。而大數據也具有類似的特征,大數據也是人類社會活動的原始記錄,其內容也具有確定性,且其記錄的內容只反映事物已經完成的狀態,因此,檔案與大數據具有相似的特征,大數據是具有鮮明檔案特性的數據集合。
2 “大檔案”概念的產生
檔案是一個單位、一個行業,乃至一個地區的記憶,其數據對行業和地區的發展有著無可替代的價值。大數據時代的數字城市、數字流域、數字國家等等數字化的產物的不斷發展,而檔案信息是其中最重要的數據來源。同時各個單位電子政務系統產生的海量文件需要歸檔,形成電子檔案,需要大型的云數據中心支持,兩者既有必要也有可能進行合并建設,這既是數字中心對檔案數據依賴所決定的,又可以避免重復建設、節約資金,還便于數據的集成、共享和協調。大數據環境下信息一體化進程使具有同質性的文獻信息資源相互步滲透、融合發展,形成了“大檔案”的信息內容。
3 “大檔案”的主要特征
縱觀檔案學發展史,每一次重大的技術變革必然引起檔案學的發展,與社會化、多元化的社會經濟發展相適應,筆者認為“大檔案”具有社會性、多元性、共享性和先進性的基本屬性。
3.1 “大檔案”的社會性。建設以檔案館為核心的區域性乃至國家級大數據中心
大數據環境下,為了因應社會化、多樣化、個性化的信息需求,檔案部門的業務將不再僅僅局限于檔案,而會擴展至整個信息范疇,以檔案館為核心的國家、地方、行業大數據中心將出現:
對于利用者而言,關心的是獲取數據信息的便捷性與數據有用性。大數據時代使利用者能夠一次性獲取更全面的數據,無需輾轉于各個不同的數據系統大量重復查詢,這也正是數據共享與大數據的意義所在。傳統的檔案館只能為利用者提供檔案數據,而非大數據。國家、地方、行業在建設大數據中心時依托的是那些數據保存量大、具有數據建設經驗、對信息工作熟悉的部門,檔案機構正是主力軍,檔案部門依托現有資產特色資源和計算機網絡技術,通過拓展網絡、拓展相關數據的方式建設大數據中心、云數據存儲,其結果是檔案館從傳統的檔案服務擴展到以檔案數據為核心、同時囊括行業相關的各種同構、異構數據的“大數據”中心,“檔案”逐步蛻變為“信息”概念涵蓋下的“大檔案”。
3.2 “大檔案”的多元性。表現為內容的多元融合、互動形式的多樣化
上世紀80-90年代產生了圖書情報檔案一體化的概念,但一直缺乏促使其轉化為實踐的動力和環境。隨著“大數據”時代的到來,涵蓋“信息”概念下的幾乎所有的文獻信息資源的一體化過程悄然發生,已超越了圖書情報檔案三種文獻型信息資源的一體化。
無論是圖書、情報信息,還是檔案,擬或是其他的信息形式,都是知識的載體,都是以信息的形式體現出來,都屬于文獻信息資源的范疇,具有同質性。都遵循信息管理的方法和原則。都是研究信息的存儲、開發、利用的學科。圖書情報檔案信息資源傳統的利用方式較為落后,僅局限在各行業視野內,隨著計算機和互聯網技術的廣泛應用,社會環境更加重視滿足利用者的需求,不同種類的信息資源相互滲透和融合,使檔案、情報和圖書等同類型文獻信息利用組織趨于統一,其服務一體化成為可能。信息技術為他們的一體化服務奠定了技術基礎,而經濟社會發展對文獻信息資源的需求則是一體化發生的內在動力。
“大檔案”在利用形式上的變革主要體現在新媒體技術的應用。
新媒體創新了信息傳播的方式,受眾規模呈幾何級擴張。新媒體技術拓展了檔案部門與受眾的互動,檔案利用突破了時空限制,實現了檔案信息傳播即時性、互動性。
新媒體改變了利用者傳統單向性的利用方式,利用者主動參與到檔案信息傳播過程中,并可進行評論和反饋。新媒體應用可以主動抓取并分析檔案使用者的利用習慣、方向和內容,實現個性化的推送服務。因此,新媒體技術使檔案機構可以有針對性地改進檔案利用工作,最大限度實現與利用者的互動。在新媒體環境下,檔案利用者的數量和結構發生巨變。
3.3 “大檔案”的共享性。“大檔案”的社會性、多元性決定了它的共享性
“大檔案”的建設過程,集合了已檔案部門為中心的眾多社會機構,同時其內容也集成了多種文獻信息資源,因此建設成果必然為社會所共享。
高度發達的科技水平,讓大數據的制造和獲取不再是少數機構手中的稀缺資源,這是數據資源共享的基礎條件。共同建設、共同使用的共享時代已經到來,共享能最大程度減少重復投資,資源的使用效率提升至最大,這與飛速發展的經濟社會的需求使相一致。
共享有利于產生高度文明的社會意識。人類素養的提升可以說是一切美好的根源。數據資源只有不掌握在少數人手中,才不再淪為非法謀益的工具。數共享背景下的數據使用,將用于進一步推進人類社會和科技的進步發展,繼而造福了更大的人類社會。
3.4 “大檔案”的先進性。以先進的技術為支撐,符合先進的經濟社會發展趨勢,決定了“大檔案”的先進性
目前,“大檔案”觀處于成型階段,筆者提出這個與“大數據”時代相適應的概念肯定有很多的不足,有太多需要補充完善之處,但其技術基礎是先進的互聯網和大數據及其挖掘技術,而且符合未來社會高度共享的社會形態,其必然是先進的,而且會隨著“大檔案”概念的不斷清晰完善,其內容的不斷充實,與社會發展的契合度也會持續發展,其先進性會不斷保持。
4 “大檔案”觀對檔案工作的要求
“大檔案”觀要求檔案人員應主動轉變觀念,適應大數據時代檔案工作的要求,加強適應大數據時代檔案工作的檔案管理隊伍建設,保障大檔案建設的順利進行,同時加大數字檔案館建設的力度,為迎接大數據時代“大檔案”工作新形勢打好基礎。
參考文獻
[1]郭懷珍.“大檔案”管理體制下高校檔案資源整合途徑研究[J].蘭臺世界,2013,(14):42-43.
[2]高煥.“大檔案”——新形勢下的新發展[J].蘭臺世界,2008,(12):5-6.
[3]黃項飛.大檔案:面向未來的新思維[J].北京檔案,2004,(01):23-25.
[4]周美蘭.大數據時代高校檔案資源體系建設的思考[J].山西檔案,2015,(01):68-71.
[5]李小晨.大數據時代背景下的檔案管理探討[J].云南檔案,2013,(06):48-50.