李英
摘 要: 大數(shù)據(jù)時(shí)代的來(lái)臨必然對(duì)檔案工作帶來(lái)機(jī)遇和挑戰(zhàn),筆者分析了檔案與大數(shù)據(jù)的關(guān)系,對(duì)大數(shù)據(jù)時(shí)代檔案工作的變化進(jìn)行了展望,同時(shí)分析了大數(shù)據(jù)時(shí)代對(duì)檔案工作者的新要求。
關(guān)鍵詞: 檔案;互聯(lián)網(wǎng);大數(shù)據(jù);變化
2012年美國(guó)率先發(fā)出 “大數(shù)據(jù)”時(shí)代已經(jīng)來(lái)臨的驚嘆。大數(shù)據(jù)技術(shù)能夠通過(guò)海量、動(dòng)態(tài)數(shù)據(jù)的有效集成,推動(dòng)社會(huì)治理的精細(xì)化和科學(xué)化進(jìn)程,并有效節(jié)約社會(huì)治理的成本。大數(shù)據(jù)時(shí)代對(duì)各行各業(yè)都產(chǎn)生了深刻的影響。
1.檔案數(shù)據(jù)與大數(shù)據(jù)的關(guān)系分析
檔案是指過(guò)去和現(xiàn)在的國(guó)家機(jī)構(gòu)、社會(huì)組織以及個(gè)人從事政治、軍事、經(jīng)濟(jì)、科學(xué)、技術(shù)、文化、宗教等活動(dòng)直接形成的對(duì)國(guó)家和社會(huì)有保存價(jià)值的各種文字、圖表、聲像等不同形式的歷史記錄。從檔案的定義來(lái)看,不同載體形式的檔案記錄的信息都可稱之為數(shù)據(jù)。從檔案的特征來(lái)分析,檔案具有社會(huì)性、歷史性、確定性及原始記錄性。而大數(shù)據(jù)也具有類似的特征,大數(shù)據(jù)也是人類社會(huì)活動(dòng)的原始記錄,其內(nèi)容也具有確定性,且其記錄的內(nèi)容只反映事物已經(jīng)完成的狀態(tài),但不一定是原始記錄。因此,檔案符合大數(shù)據(jù)的特征,具有鮮明檔案特性的數(shù)據(jù)集合即是大數(shù)據(jù)。
2. 大數(shù)據(jù)時(shí)代檔案工作會(huì)出現(xiàn)新的變化,主要表現(xiàn)在以下兩個(gè)方面:
2.1. 數(shù)字檔案館建設(shè)將得到極大促進(jìn)
大數(shù)據(jù)并非是一個(gè)確切概念,單從字面上來(lái)講,表示數(shù)據(jù)量的龐大,維基百科對(duì)大數(shù)據(jù)的定義為:大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時(shí)間超過(guò)可容忍時(shí)間的數(shù)據(jù)集。還有的學(xué)者用大數(shù)據(jù)的特征來(lái)闡釋定義,比較有代表性的是3V觀點(diǎn),即大數(shù)據(jù)是具有規(guī)模性(volume)、多樣性(variety)以及高速性(velocity)的數(shù)據(jù)。作者傾向于認(rèn)同大數(shù)據(jù)是反映人類社會(huì)活動(dòng)的、具有規(guī)模效應(yīng)的信息數(shù)據(jù)的集合,大數(shù)據(jù)技術(shù)中包含了各種同構(gòu)、異構(gòu)的數(shù)據(jù)。檔案信息作為一種傳統(tǒng)且重要的數(shù)據(jù)信息在大數(shù)據(jù)中的重要地位是無(wú)可取代的,因此大數(shù)據(jù)時(shí)代,檔案數(shù)字化和數(shù)字檔案館工作將得到極大加強(qiáng)。
2.2. 圖書(shū)情報(bào)檔案 “一體化”迅速發(fā)展
圖書(shū)情報(bào)檔案一體化的概念產(chǎn)生與上世紀(jì)80-90年代,但一直缺乏促使其轉(zhuǎn)化為實(shí)踐的動(dòng)力和環(huán)境。近年來(lái),隨著網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,特別是“大數(shù)據(jù)”時(shí)代的到來(lái),這種一體化的過(guò)程已悄然發(fā)生。
無(wú)論是圖書(shū)、情報(bào)信息,還是檔案,都是知識(shí)的載體,都是以信息的形式體現(xiàn)出來(lái),都屬于文獻(xiàn)信息資源的范疇,具有同質(zhì)性。在客觀上,都有著內(nèi)在的本質(zhì)的必然的聯(lián)系,都遵循信息管理的方法和原則。其學(xué)科都是研究信息的存儲(chǔ)、開(kāi)發(fā)、利用。圖書(shū)情報(bào)檔案信息資源傳統(tǒng)的利用方式較為落后,都局限在各自的范疇,在計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用的社會(huì)環(huán)境下,文獻(xiàn)信息工作更加注重滿足利用者的需求,不同種類的信息資源相互滲透和融合,形成利用者需求的資源,這個(gè)文獻(xiàn)信息資源的數(shù)字化和網(wǎng)絡(luò)化的過(guò)程,使檔案、情報(bào)和圖書(shū)文獻(xiàn)信息利用組織趨于統(tǒng)一,使其服務(wù)一體化成為可能,逐步形成融合的跨界的學(xué)科體系。信息技術(shù)為一體化服務(wù)奠定了技術(shù)基礎(chǔ),而經(jīng)濟(jì)社會(huì)發(fā)展對(duì)文獻(xiàn)信息資源的需求則是一體化發(fā)生的內(nèi)在動(dòng)力。
2.3. 以檔案館為核心的區(qū)域性大數(shù)據(jù)中心迅速發(fā)展
大數(shù)據(jù)環(huán)境下,檔案部門(mén)的業(yè)務(wù)將不再僅僅局限于檔案,而會(huì)擴(kuò)展至整個(gè)文獻(xiàn)信息范疇,以檔案館為核心的國(guó)家、地方、行業(yè)大數(shù)據(jù)中心將出現(xiàn):
利用者關(guān)心的是獲取數(shù)據(jù)信息的便捷性與數(shù)據(jù)有用性,對(duì)于是否是原始記錄、是或保管期限并不挑剔。大數(shù)據(jù)時(shí)代使利用者能夠一次性獲取更全面的數(shù)據(jù),無(wú)需輾轉(zhuǎn)于各個(gè)不同的數(shù)據(jù)系統(tǒng)反復(fù)查詢,這也正是數(shù)據(jù)共享與大數(shù)據(jù)的意義所在。傳統(tǒng)的檔案館乃至數(shù)字檔案館只能為利用者提供檔案數(shù)據(jù),這與大數(shù)據(jù)的精神是不符的,而國(guó)家、地方、行業(yè)在建設(shè)大數(shù)據(jù)中心時(shí)依托的是那些數(shù)據(jù)保存量大、具有數(shù)據(jù)建設(shè)經(jīng)驗(yàn)、對(duì)信息工作熟悉的部門(mén),符合這些條件的主要是各級(jí)各類檔案管理部門(mén),檔案部門(mén)依托現(xiàn)有技術(shù)與計(jì)算機(jī)網(wǎng)絡(luò)資源,通過(guò)拓展網(wǎng)絡(luò)、整合相關(guān)數(shù)據(jù)的方式建設(shè)大數(shù)據(jù)中心,屆時(shí)檔案館服務(wù)的范圍將從傳統(tǒng)的檔案服務(wù)擴(kuò)展到以檔案數(shù)據(jù)為核心、同時(shí)囊括行業(yè)相關(guān)的各種同構(gòu)、異構(gòu)數(shù)據(jù)的“大數(shù)據(jù)”中心,呈現(xiàn)在利用者面前的數(shù)據(jù)將由“檔案”逐步變化為“信息”與“大數(shù)據(jù)”。
2.4. “大檔案”概念逐漸成型并得到初步實(shí)踐
檔案是一個(gè)單位、一個(gè)行業(yè),乃至一個(gè)地區(qū)的記憶,其數(shù)據(jù)對(duì)行業(yè)和地區(qū)的發(fā)展有著無(wú)可替代的價(jià)值。大數(shù)據(jù)時(shí)代的數(shù)字城市、數(shù)字流域、數(shù)字國(guó)家等等數(shù)字化不斷發(fā)展的成果,其主要的數(shù)據(jù)來(lái)源是檔案信息。同時(shí)海量檔案信息與海量電子文件歸檔存儲(chǔ)需要大型的云數(shù)據(jù)中心支持。兩者既有必要也有可能進(jìn)行合并建設(shè),這既是數(shù)字中心對(duì)檔案數(shù)據(jù)依賴所決定的,又便于數(shù)據(jù)的共享和集約化管理、避免重復(fù)建設(shè)。把電子政務(wù)、數(shù)字化城市(或流域)云計(jì)算中心的機(jī)房建到檔案館,最終構(gòu)成“大檔案”的基礎(chǔ)設(shè)施框架。
大數(shù)據(jù)環(huán)境下檔案情報(bào)圖書(shū)一體化進(jìn)程使具有同質(zhì)性的文獻(xiàn)信息資源相互滲透、融合發(fā)展,構(gòu)成了“大檔案”的內(nèi)容。
“大檔案”信息資源的推送呈現(xiàn)多樣化。
新媒體是基于網(wǎng)絡(luò)和大數(shù)據(jù)出現(xiàn)的新型互動(dòng)方式,因其區(qū)別于傳統(tǒng)的基于紙質(zhì)媒介而得名,傳統(tǒng)網(wǎng)站信息更像是傳統(tǒng)紙質(zhì)媒介的“數(shù)字化版本”,而新媒體較之于網(wǎng)站信息更具互動(dòng)性和個(gè)性化,這類媒體主要通過(guò)移動(dòng)客戶端呈現(xiàn),可以在網(wǎng)絡(luò)技術(shù)的幫助下,主動(dòng)捕獲閱受眾的閱讀傾向,而主動(dòng)推送個(gè)性化的內(nèi)容,這也是新媒體和網(wǎng)站信息的本質(zhì)不同,目前新媒體以被許多檔案部門(mén)使用,檔案信息資源與新媒體靈活、個(gè)性、互動(dòng)良好的特質(zhì)相結(jié)合,將使檔案信息資源的開(kāi)發(fā)利用如虎添翼,使檔案工作展現(xiàn)出多彩的生命力,這正是“大檔案”時(shí)代的特點(diǎn)之一。
3. 大數(shù)據(jù)時(shí)代對(duì)檔案工作的要求
3.1. 為適應(yīng)大數(shù)據(jù)時(shí)代的檔案工作,檔案人員應(yīng)主動(dòng)轉(zhuǎn)變觀念,
長(zhǎng)久以來(lái),提起檔案行業(yè),經(jīng)常與“重藏輕用、被動(dòng)服務(wù)”等詞匯劃等號(hào)。在網(wǎng)絡(luò)環(huán)境下,如果不突破這些障礙,很難適應(yīng)大數(shù)據(jù)時(shí)代個(gè)性十足、互動(dòng)頻繁、形式多樣的特點(diǎn),轉(zhuǎn)變觀念迫在眉睫,制定符合信息化時(shí)代的檔案管理和工作的制度、流程,首先是轉(zhuǎn)變固有的檔案觀念,主動(dòng)學(xué)習(xí)網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)知識(shí)、數(shù)字化知識(shí)、數(shù)字檔案館知識(shí),了解大數(shù)據(jù)時(shí)代的本質(zhì),從自身做起促成檔案工作模式的改變。
3.2. 加大數(shù)字檔案館建設(shè)的力度,為大數(shù)據(jù)時(shí)代檔案工作打好基礎(chǔ);
各級(jí)檔案部門(mén)應(yīng)抓住機(jī)遇,將數(shù)字檔案館建設(shè)納入檔案工作中長(zhǎng)期規(guī)劃。當(dāng)前,在辦公網(wǎng)絡(luò)化的基礎(chǔ)上,制定明確的目標(biāo),在網(wǎng)絡(luò)和數(shù)據(jù)庫(kù)基礎(chǔ)上,實(shí)施“存量數(shù)字化、增量電子化”的信息化戰(zhàn)略,數(shù)字檔案館建設(shè)將突飛猛進(jìn)。
大數(shù)據(jù)時(shí)代在時(shí)刻不停地發(fā)展,對(duì)檔案工作的影響也日益深刻。以上是作者結(jié)合自身工作對(duì)大數(shù)據(jù)時(shí)代檔案工作的管見(jiàn),一定存在許多不足,正是在與相關(guān)行業(yè)不斷地交融、滲透中,才促進(jìn)了檔案事業(yè)的不斷向前發(fā)展,作為檔案工作者也只有不斷加強(qiáng)自身素質(zhì)的養(yǎng)成,加強(qiáng)知識(shí)獲取和更新能力,才能跟上時(shí)代發(fā)展的步伐,為檔案工作做出貢獻(xiàn)。
參考文獻(xiàn)
[1]周美蘭.大數(shù)據(jù)時(shí)代高校檔案資源體系建設(shè)的思考[J].山西檔案,2015,(01):68-71.
[2]石峻峰,周俐霞,樊澤恒,王麗.大數(shù)據(jù)時(shí)代高校數(shù)字檔案資源管理研究[J].現(xiàn)代教育技術(shù),2015,25(01):19-24.
[3]張欣.解讀大數(shù)據(jù)時(shí)代下檔案管理的價(jià)值提升[J].理論觀察,2014,(01):108-109.
[4]李小晨.大數(shù)據(jù)時(shí)代背景下的檔案管理探討[J].云南檔案,2013,(06):48-50.