劉雙玢
【摘要】大數據背景下海量數據的出現沖擊著原有的傳統檔案編研的模式。大數據時代使得我們尋找新的檔案編研策略,促進檔案“大編研”。本文概述了傳統檔案編研管理現狀,分析了大數據背景下檔案編研工作的整體趨向,并給出了檔案編研工作的開展策略。
【關鍵詞】大數據;檔案編研;新趨向
傳統的檔案編研工作以紙質材料為基礎,進行人工分析后傳播利用。隨著互聯網時代的到來,數據量爆炸式增長,傳統的檔案編研方式明顯不能應對社會多元化的信息需求。檔案工作者要借助大數據技術重新完善檔案編研體系,促進檔案“大編研”的發展。
一、傳統檔案編研管理的現狀
(一)傳統檔案編研的具體做法。檔案編研是以館藏資源為基礎,進行整合與開發,形成印刷型、音像型、數字型成果的一項工作。編研工作主要包括兩個方面:編纂和研究。目前檔案部門的重依然停留在檔案的收集、整理、歸檔和普通利用服務的環節過程中。檔案編研工作主要包括兩個方面:一是檔案的整理和匯編。檔案部門先收集檔案資料,然后根據檔案的工作重心對有價值的信息進行匯編整合。二是分析和研究。根據編研主題,工作人員將根據自己的經驗和觀點對檔案信息進行分析挖掘,形成較為精煉和概括性專題分析材料,供利用者查閱使用。
(二)傳統編研方法存在的問題。目前各個省級檔案館已開通自己的檔案信息網站,但是信息網站中有關檔案編研的問題卻還是存在各個方面。首先,從檔案編研的名稱來看,各個省級檔案館信息網站關于檔案編研的詞條名稱大同小異,如
“檔案編研”“編研成果”“編研出版”等等。其次,編研質量方面,各個網站也是呈現不同的水平。有的省級檔案信息網站內容豐富新穎,上海檔案信息網的“檔案博覽”中有各種歷史檔案故事匯編,如“老撾王室子弟中國留學記”“重訪,鄧小平的上海足跡”等等,有珍貴的歷史考察價值,但是像廣西檔案信息網中卻找不到專門歸類的檔案編研詞條與內容。最后,從編研內容來看,多以“歷史記錄”“全宗介紹”“大事記”為主,和群眾生活密切相關的內容相對較少。綜合來看,檔案信息網站主要存在以下問題:第一,檔案編研選題較少拓展館藏資源以外的內容。第二,檔案編研人員素質和技術手段較為落后。第三,檔案信息的開發利用主要依靠工作人員手工操作,檔案工作“編多研少”。第四,檔案編研主要是工作人員內部進行,與大眾生活脫節。
二、大數據背景下檔案編研工作的發展趨勢
傳統的檔案編研是檔案館、檔案室將以書刊為載體的檔案進行匯編然后予以公布的過程?,F在出現的“大編研”具體體現在編纂者不局限于是檔案館、檔案室,可以是企事業單位、科研部門、學術機構等等。國家檔案局在《全國檔案事業發展的“十二五”規劃》中提出的任務之一是加強檔案編研工作,挖掘檔案信息資源,把“死檔案”變成“活資料”,努力把檔案館建成“思想庫”。大數據時代的到來,數據中心的運維工作和之前有了很大不同?,F在更多考慮如何根據數據預測并避免問題發生,以及大數據時代大量虛擬化設備對于數據分析難度和中心的轉變。綜合分析大數據背景下檔案編研工作的發展趨勢有以下幾點:
(一)數據挖掘觀念增強使得檔案編研工作獲得更廣闊的發展空間。大數據時代檔案信息急速增長,由于檔案本身具有原始記錄性的作用,那么檔案信息的整合就顯得迫在眉睫。大數據時代引導檔案編研工作者對檔案信息進行再加工,運用先進的數據挖掘技術和思維對海量數據進行整合,匯編成有價值的信息,促進編研工作發展空間擴大。
(二)海量數據的增長為檔案編研工作提供了更豐富的信息資源。大數據時代檔案規模的增長速度的加快極大地豐富了可編研的館藏資源。另外,大數據技術的出現使得檔案編研形式變得更加多樣化,除了文本,還可以視頻、音頻、圖片等多種方式進行編研,這樣的編研成果更具有吸引力,也滿足了社會需求。
(三)大數據技術的提升使得檔案編研工作有了技術保障。大數據背景下處理檔案信息更加注重效率。如果精細化處理,將會錯過很多有用的信息,也會失去信息的時效性。數字處理技術變得逐漸發達,目前可以實現信息反復輸出,編排方式靈活,進行迅速檢索,提升工作效率。在數據處理技術的支持下,編研工作勞動量降低,檔案信息編排結果更加清晰,表現形式更多樣化。
三、大數據背景下檔案編研工作的發展策略
(一)檔案管理觀念轉變成數據管理觀念。大數據時代,檔案編研展現出了現代化、信息化、服務化。各個檔案館的電子檔案仍屬于稀缺狀態。大數據時代要求檔案館跟進時代腳步,及時轉變成數據管理思想,并進行信息挖掘。不管是“小編研”還是 “大編研”,都要摒棄“重保管輕利用”“只編不研”的思想,加強數據管理理念,借助現代科技手段,高效完成各類檔案工作編研。
(二)應用大數據技術進行電子編研。大數據技術是指從各種類型、未經加工的海量數據中分析挖掘出有價值信息的過程。大數據處理的關鍵技術有:大數據采集、大數據預處理、大數據存儲及管理、大數據分析及挖掘、大數據的展現及應用。檔案編研在大數據時代的發展需要依托互聯網平臺,進行社會化存取和集約化處理。首先,分析檔案信息內容和用戶信息需求。分析檔案信息要利用數據挖掘技術剔除多余信息,最終產生智能、精品化檔案信息結果。而用戶信息需求數據的挖掘可以借助谷歌大數據技術以及在其基礎上發展起來的Hadoop技術。其次,建立電子編研系統。前期數據挖掘工作完成后,要及時將用戶信息和檔案匯編信息進行整理和數字化入庫,將信息進行專題化分類,在分類后形成知識性、系統性的二次、三次電子編研信息資源,并建立電子編研信息資源庫。
(三)突破界限,開展跨領域合作。大數據時代的檔案編研呈現科技化、專業化,利用到各種較為復雜的數據分析技術。短時間內若想依靠檔案人員解決技術問題并不現實,為了節約成本,提高工作效率,檔案部門可以與其他精通技術行業的人進行跨領域合作,合力完成檔案編研工作??珙I域合作不僅僅可以高效解決技術問題,還可以從專業的角度挖掘數據信息所呈現出的社會需求,對檔案編研提出具有現實意義的指導。
(四)運用互聯網技術加快檔案編研成果的傳播。互聯網技術推動檔案編研成果的快速傳播,影響范圍擴大,能夠為檔案編研成果的使用者提供更加便利的環境。互聯網使得檔案編研的成果接近社會需求,拉近了與社會大眾之間的距離,使得檔案編研成果能夠得以在各個層次和專業的人群中傳播,最大限度地發揮了檔案的價值。
(五)構建滿足社會需求的檔案編研內容。檔案館的編研工作歸根究底還是服務于社會大眾,檔案編研成果不能偏離群眾生活太多,內容要引起大眾的興趣。因此,檔案編研產品要做好前期需求分析,根據不同層次和專業的人群需求做出合適的、圖文并茂的內容。首先,拓展選題視野。比如寧夏檔案局、寧夏檔案館主編的《紀念世界反法西斯戰爭暨中國人民抗日戰爭勝利70周年檔案文獻匯編》是在2015年9月紀念反法西斯戰爭70周年紀念之際面世的,通過豐富的圖文回顧展示光輝歷程。其次,拓展選材空間。要將選材范圍擴大到社會群體,和其他文化教育部門進行合作編研。比如:蘇州大學檔案館、蘇州大學校史研究室聯合編輯的《東吳大學史料選輯(歷程)》,內容來自多所文化教育單位,顯示了豐富選材的重要性。最后,實現編者和利用者的互動化。
四、結語
大數據時代的到來給檔案編研工作帶來了發展機遇。檔案工作者應當抓住機遇,學會運用數據挖掘技術,提升檔案編研水平,充分且全方位地發揮檔案的社會價值,開展全新的檔案信息資源開發格局,為社會提供更有價值的檔案編研成果。
【參考文獻】
[1]吉星昇.對綜合檔案館檔案編研工作"編"多"研"少的新認識[J].檔案與建設,2017(07):24-26.
[2]王永梅,張穎.應用大數據技術開展編研工作[J].檔案與建設,2015(12):73-76.
[3]張雋軒,張文利,黃毅.數據中心運維系統應用ITIL管理體系分析[J].智能建筑與城市信息,2015(03):77-78.
[4]李莉.試析信息時代檔案編研工作發展趨勢[J].檔案學研究,2017(S2):24-27.
[5]周燾.大數據時代的檔案大編研[J].陜西檔案,2014(02):24-25.