趙新民,秦廣久 ,馬向陽,懷保民,姬榮榮
(1.山東建筑大學 合作發(fā)展辦公室,山東 濟南250101)2.山東建筑大學 人事處,山東 濟南 250101)
隨著網絡技術和云計算的不斷興起與快速發(fā)展,數(shù)據(jù)正呈指數(shù)級速度增長,國家檔案局局長楊冬權曾在2013年在全國數(shù)字檔案館建設推進會上提出:數(shù)字化、網絡化和信息化已徹底影響了現(xiàn)在人們的工作和生活方式,數(shù)字不再僅僅代表計算,大數(shù)據(jù)時代已經來臨。
大數(shù)據(jù)可以說是一種數(shù)據(jù)量龐大到不能通過常規(guī)的數(shù)據(jù)軟件進行解析處理的數(shù)據(jù)集[1-2]。主要存在4V特點:其一,海量性(Volume),大數(shù)據(jù)的技術數(shù)據(jù)處理量極其巨大;其二,多樣性(Variety),不僅包含有傳統(tǒng)結構化數(shù)據(jù),還包含著網絡信息時代下產生的新的半結構化和非結構化數(shù)據(jù)形式,且半結構化和非結構化數(shù)據(jù)的增速遠遠大于結構化數(shù)據(jù);其三,速度快(Velocity),主要體現(xiàn)為時刻快速生成的大量數(shù)據(jù),以及快速處理海量數(shù)據(jù)的響應速度;其四,價值密度低(Value),相對與大數(shù)據(jù)的海量,其中有價值的數(shù)據(jù)所占比例相對較小,因此需要找到數(shù)據(jù)之間的不同聯(lián)系,從而提高數(shù)據(jù)的利用率。
檔案基數(shù)和種類隨著科技和時代的發(fā)展的不斷增加,使其檔案管理模式使其適應大數(shù)據(jù)背景下的檔案管理工作,對其大數(shù)據(jù)時代下檔案管理模式變化進行研究尤其重要[3]。模式轉變不僅可以更好的保護檔案文化資源,也能夠一定程度上優(yōu)化完善檔案業(yè)務流程,充分挖掘其檔案增值信息,加快檔案管理機構職能建設,促進檔案事業(yè)快速發(fā)展。
大數(shù)據(jù)背景下檔案管理的適應性主要表現(xiàn)為:大數(shù)據(jù)與檔案管理的特點完全一致,目前而言,我國單個檔案館數(shù)據(jù)資源總量能夠達到PB級的不多,但以我國的龐大的人口基數(shù)來算,隨著現(xiàn)在檔案數(shù)字化不斷擴散到政府、醫(yī)療和教育各行業(yè),可以說覆蓋包含個人一生的數(shù)據(jù),因此電子檔案數(shù)據(jù)正在呈指數(shù)型增長[4];檔案的多樣性體現(xiàn)在隨著不同行業(yè)之間產生的不同檔案數(shù)據(jù),除了涉及傳統(tǒng)紙質版檔案,又增加了非結構化的檔案數(shù)據(jù)(如圖片、視頻音頻、網絡地址鏈接等),其種類和形式均發(fā)生了翻天覆地的變化;隨著不同行業(yè)的檔案進行交叉聯(lián)系,檔案以一種真實、可靠的方式記錄著歷史和社會的發(fā)展,其價制度是不容置疑的,隨著使用的人越多,其價制度越高;同樣為了適應社會發(fā)展的快節(jié)奏,檔案檢索查詢服務也需要專業(yè)的設備與技術,不僅能夠滿足客戶快速查詢的使用需求,還能夠從不同的途徑擴大檔案收集方式,使得檔案更全面具體。
數(shù)據(jù)資源的共享可以說是網絡時代最大的特點,將不同的檔案館之間建立聯(lián)系性,實現(xiàn)檔案資源的共享也是檔案資源管理工作最大的特點。檔案信息資源的前提是需要共建檔案信息資源,即要求各檔案館之間必須打破信息資源壁壘,進一步擴大檔案信息資源數(shù)據(jù)庫收集范圍以及檔案之間的緊密聯(lián)系性,使其形成一個有聯(lián)系性的整體,全面實現(xiàn)檔案信息資源共享[4]。數(shù)據(jù)資源共享平臺的建立不僅要兼顧原始紙質版檔案數(shù)據(jù),還需要對其不斷產生的網絡檔案數(shù)據(jù)進行收集,并依托于大數(shù)據(jù)時代的云計算、語義分析、數(shù)據(jù)挖掘等新技術,進一步提高了檢索速度快的服務需求,更大限度地體現(xiàn)檔案資源共享的價值。檔案資源的共享性不僅提高了檔案資源的利用效率,大數(shù)據(jù)技術的應用使得在數(shù)據(jù)檢索時,只需憑借關鍵詞、時間或類型就能進行快速檢索得到結果,打破了檔案管理工作的時間、空間的限制。
檔案管理工作的網絡化服務思維與其共享性是相輔相成的。檔案數(shù)據(jù)的網絡化管理能夠打破傳統(tǒng)檔案服務模式的時間、地域、利用手段等各方面限制,不再是點對點的檔案查詢服務方式,而是點對面的網絡化思維方式,僅需一個客戶端或查詢系統(tǒng)即可滿足用戶的需求。
依托與大數(shù)據(jù)時代檔案管理模式的共享性特點,建立網絡化的服務思維模式,其本質是通過使用專業(yè)的技術手段和科技設備,提高檔案數(shù)據(jù)查詢的準確性以及信息的針對性,為用戶提供網絡化、個性化的服務工作模式。檔案服務模式隨著時代的不同不斷升級變化,網絡化思維模式改變了傳統(tǒng)的檔案存儲方式,降低了檔案管理成本以及相應的物理風險,同時管理人員也不再是只對檔案數(shù)據(jù)信息進行簡單的分類整理,還需要構建檔案數(shù)據(jù)分析庫,提高檔案管理效率,且能夠確保不同用戶的多樣化、個性化服務需求得到滿足[5]。
信息化思維是指技術人員能夠站在信息化視角下對重新認識檔案數(shù)據(jù)、分析矛盾和聯(lián)系點、處理問題,確保檔案管理工作的順利進行[6]。當然信息化思維也包括檔案數(shù)據(jù)信息化模式改變,積極使用數(shù)據(jù)庫處理、掃描、文件壓縮等信息技術,使其紙質版的原生檔案資料轉變?yōu)橐子诂F(xiàn)代網絡保存的電子數(shù)據(jù)。
檔案數(shù)據(jù)的信息化建設主要從以下三個方向入手:首先要建立全面的數(shù)字化檔案目錄數(shù)據(jù)庫;其次就是建立全數(shù)字化檔案資源數(shù)據(jù)庫(原有紙質檔案資源的數(shù)字化建設,以及保存并歸檔已經形成的電子文件);最后是檔案資源的數(shù)據(jù)化管理。通過上述三個方面完成檔案數(shù)據(jù)的信息化建設工作,順應了檔案管理的數(shù)字化發(fā)展規(guī)律,能夠利用大數(shù)據(jù)處理技術對檔案有效信息進行提取、挖掘和二次處理,從而提高了檔案數(shù)據(jù)信息化管理效率和檔案信息資源的利用效率,也是為我國檔案管理模式改變提供了發(fā)展新的研究方向。
檔案管理模式專業(yè)化思維可以分為檔案管理人員的專業(yè)化、檔案數(shù)據(jù)處理技術的專業(yè)化、檔案管理模式的專業(yè)化三個方面。其中檔案管理人員的專業(yè)化是指成立專職檔案管理工作小組,能夠有效地使用先進信息網絡技術手段進行檔案管理工作,對于海量的電子檔案數(shù)據(jù)信息能夠方便快速地進行處理,尤其是要注重培養(yǎng)檔案管理人員將檔案管理與信息技術聯(lián)系密切的專業(yè)化意識;另外處理技術的專業(yè)化是依托于現(xiàn)有的設備的專業(yè)化以及大數(shù)據(jù)處理技術的專業(yè)化平臺,要善于使用兩個工具嚴格監(jiān)控檔案數(shù)據(jù)接收和信息收集環(huán)節(jié),不僅要確保信息的真實性和全面性,還需要準確挖掘不同檔案數(shù)據(jù)信息之間的聯(lián)系性,并將數(shù)據(jù)處理、儲存兩者實現(xiàn)一體化管理,同時使用更高、更專業(yè)的網絡加密技術來保障檔案數(shù)據(jù)的安全;最后管理模式專業(yè)化是貫穿于檔案管理工作的全過程的,不僅要需要結合自己部門的實際情況,能夠善于使用專業(yè)的管理技術和管理流程,還需要對不同的檔案管理部門進行交流合作,健全和完善檔案管理信息平臺,實現(xiàn)檔案工作的綜合管理,從而保證為需求者提供科學和專業(yè)的信息服務。
傳統(tǒng)檔案管理工作可以劃分為收集、鑒定、保管和利用四個方面,其中重點工作還是對檔案實體收集保管,以及根據(jù)使用者需求提供檔案原件的查詢功能服務[7]。傳統(tǒng)檔案管理工作重管理輕服務,忽視了主動提供檔案信息服務以及信息之間聯(lián)系的價值性。隨著大數(shù)據(jù)時代的到來,傳統(tǒng)紙質載體的檔案數(shù)據(jù)保存方式也是受到使用條件以及實用性的考驗,數(shù)據(jù)處理算法的研究不斷深入,數(shù)據(jù)的價值尤為突出,檔案管理工作在大數(shù)據(jù)背景下不斷完善和發(fā)展的同時其管理手段也需要做出一系列的改變。
過去由于受信息技術存儲方式等因素的限制,其傳統(tǒng)檔案收集模式不能將所有歷史數(shù)據(jù)進行歸檔保存,只能是通過限定歸檔范圍或者保管期限的方式手段,將重要性以及具有代表意義的數(shù)據(jù)資料進行保存留檔,雖然這種檔案管理模式也對檔案數(shù)據(jù)的價值進行了區(qū)分,且保持了不同檔案之間的聯(lián)系性[8],但隨著檔案數(shù)量、類型不斷增加,更何況檔案的形式也隨之發(fā)生了徹底的改變。
傳統(tǒng)的檔案收集模式已經不能對海量檔案進行有效的收集和科學的管理了,繼續(xù)沿用原有管理模式勢必會導致數(shù)據(jù)收集不齊全,檔案分類不系統(tǒng)等問題出現(xiàn),因此檔案管理工作也是需要順應科技的發(fā)展,而且合理運用大數(shù)據(jù)技術使得檔案收集工作的范圍再次擴大,將全覆蓋活動中形成的原生的檔案數(shù)據(jù),以及現(xiàn)存檔案數(shù)據(jù)信息化過程中形成的電子數(shù)據(jù),更或者網站門戶上的信息資源,一切數(shù)據(jù)均被視為檔案資源收集,從而形成檔案信息資源大數(shù)據(jù)集。且大數(shù)據(jù)網絡技術能夠將所有檔案快速的以種類、時間為序進行排列,并確保歸檔齊全完整,避免重復歸檔,且以永久網絡保存。
傳統(tǒng)檔案管理模式下,其檔案材料多數(shù)為紙質版資料,本身的電子檔案數(shù)量較少(主要包括管理文件、視頻音頻材料),因此將電子數(shù)據(jù)存儲在光盤內,整體來說檢索時間和檔案管理成本較小。但大數(shù)據(jù)時代的到來,檔案的數(shù)據(jù)種類發(fā)生改變,多以文本、圖像、圖形、影像、聲音、多媒體鏈接、數(shù)據(jù)庫系統(tǒng)等多種結構化數(shù)據(jù)形式呈現(xiàn),尤其是網頁、圖片、郵件等半結構化或非結構化數(shù)據(jù)正在呈指數(shù)型增長,其占比系數(shù)越來越大[9]。因此光盤存儲介質不管是在容量上還是在形式性都已經不能滿足當前檔案存儲的需求,也是為了更好地兼容半結構化、非結構化數(shù)據(jù)的儲存,選用合適的網絡數(shù)據(jù)存儲方式融合異構數(shù)據(jù),才能夠更加方便于檔案數(shù)據(jù)的挖掘與分析。檔案管理人員通過大數(shù)據(jù)技術能夠處理海量檔案信息,同時合理地調配檔案數(shù)字化所需的資源,能夠不斷降低檔案管理成本,提高檔案檢索服務效率。
大數(shù)據(jù)時代背景下,檔案的使用機制也從對象、載體、內容到手段都發(fā)生了根本性的變化,檔案的使用機制正在趨于多元化、個性化、實時性、時效性[10]。主要表現(xiàn)在:一是用戶多元化,傳統(tǒng)的檔案管理部門的服務對象僅僅是局限于內部使用,隨著網絡化和信息化的發(fā)展,擴展了使用者的范圍,使得任何一個外來成員都有可能是其潛在用戶;二是載體多樣化,除了傳統(tǒng)的紙質檔案數(shù)據(jù)存儲方式,圖片、音頻、網頁等半結構化和結構化數(shù)據(jù)也是成為了檔案數(shù)據(jù)的主流儲存方式,而且這種電子數(shù)據(jù)檔案流形式更能夠方便使用者快速查詢;三是內容集成化,大數(shù)據(jù)的發(fā)展不僅僅使得檔案數(shù)據(jù)的廣泛性增加,也是使得相互之間的聯(lián)系性挖掘成為可能,檔案使用者的需求也發(fā)生改變,不再追求檔案數(shù)據(jù)的廣泛性,而更重視檔案數(shù)據(jù)之間的聯(lián)系性價值;四是服務便捷化、個性化,尤其是網絡化的檢索查詢服務體驗,不僅打破了過去傳統(tǒng)服務模式的時間和空間限制,還能夠滿足需求者隨時隨地高效、快捷的進行檔案數(shù)據(jù)檢索。
傳統(tǒng)檔案管理工作重管理輕服務,對于檔案管理人員要求也較為簡單純粹,只需要具備相應的檔案管理專業(yè)知識、對檔案事業(yè)保持熱情和保守檔案工作秘密等條件即可。而大數(shù)據(jù)時代背景下的檔案管理工作涉及到多學科、多領域、多技術的交叉,因此對于檔案管理人員的技能要求也相應提高,除了需要多年的專業(yè)知識積累,還需要有其他方面的綜合能力,尤其是對網絡技術、計算機知識以及專業(yè)的管理系統(tǒng)技能都要有一定程度的了解。
前面大數(shù)據(jù)時代下檔案管理工作需要轉變工作思維模式,更重要的是轉變大數(shù)據(jù)思維,不要沉浸在傳統(tǒng)的檔案管理理念,因為檔案收集來源和收集方式在不斷的擴充,勢必會帶來海量的檔案數(shù)據(jù)信息,因此將大數(shù)據(jù)技術更好地應用在檔案管理是重中之重。
在大數(shù)據(jù)的時代背景下,檔案的數(shù)據(jù)信息不僅要求真實全面,還要能夠有效進行篩選處理有效信息,并進行二次處理和數(shù)據(jù)挖掘,充分體現(xiàn)檔案信息的價值。為能夠更好的把握大數(shù)據(jù)下的機遇,檔案管理部門首先應當對工作人員不斷強化大數(shù)據(jù)思維宣傳教育,使其充分了解到大數(shù)據(jù)的真正價值,數(shù)據(jù)不再僅僅用于計算,而是個人生活緊密聯(lián)系在一起的,如果能夠有效地利用大數(shù)據(jù)技術對現(xiàn)有的數(shù)據(jù)進行分析處理,就可以挖掘出不同檔案之間的聯(lián)系,從而實現(xiàn)檔案資源的共享化、信息化和網絡化,全民實現(xiàn)檔案的數(shù)字化管理。加強大數(shù)據(jù)思維宣傳教育可以定期讓員工參加大數(shù)據(jù)相關技術講座,更好地了解大數(shù)據(jù)技術,能夠在這個信息快速更替的時代,始終保持走在前列,從而能夠更好地將大數(shù)據(jù)技術與檔案管理工作相銜接,另外,檔案管理部門自身可以給其他的相關部門定期進行管理或技術培訓,使不同的部門之間都能夠形成一種大數(shù)據(jù)思維模式,從而更好地配合檔案信息化的管理工作。
大數(shù)據(jù)時代對于檔案管理人員是一個巨大的挑戰(zhàn),傳統(tǒng)檔案管理方式雖然勞動強度大,但是其科技含量較低,且偏重于檔案實物的管理工作。數(shù)字化時代對檔案管理人員無論是能力,還是整體素質上都提出了更高、更全面的要求,不僅要有認真負責的工作態(tài)度,更要具備基本的電腦操作技能以及相關系統(tǒng)的使用技巧。
目前大部分檔案管理人員計算機以及數(shù)字化處理技能水平仍達不到當代大數(shù)據(jù)化的檔案管理模式,對于數(shù)據(jù)處理設備的更新也不是很及時,使用的陳舊或機房淘汰下來的設備,完全達不到現(xiàn)在檔案數(shù)字化管理的要求。因此,對于部分檔案管理工作部門除了需要引進新的科技設備外,還需要對其進行使用技巧培訓或者檔案數(shù)據(jù)處理技能培訓,使其改變原始的簡單查詢模式,使用更精確、更全面的數(shù)據(jù)查詢系統(tǒng)對檔案數(shù)據(jù)進行挖掘和二次處理,一定程度上能夠降低檔案管理工作人員的工作強度,減輕其工作壓力,更難調動工作人員的積極性,從而提高檔案管理工作效率,還能夠為檔案查詢者提供快速便捷的服務。必要時引進網絡技術方面的專業(yè)技術人員進行檔案管理工作,同時也要支持工作人員對先進示范檔案館進行參觀學習,進行不定期的交流,不斷提高工作人員管理水平和技能水平,同時能夠更加完善和規(guī)范大數(shù)據(jù)下的檔案管理過程。
檔案管理工作的服體系主要是實現(xiàn)檔案使用的多元化、社會化、便捷化和個性化功能,以使用者需求為向導,在檔案數(shù)據(jù)中主動挖掘不同信息之間的聯(lián)系性和價值性,為使用者提供網絡化和智能化服務。在當下信息化和網絡化的時代,檔案管理工作的負責人要對網絡技術發(fā)展有一定的理性認識,分析其對檔案管理工作的影響,并且不能夠再將網絡技術只看做是一種先進的技術手段,而是要將其作為一種優(yōu)質的工作方式和理念。
數(shù)據(jù)共享,擴大檔案服務對象,也就是檔案信息化的建設部署,在構建其優(yōu)良的工作條件下,積極采用網絡信息技術來開展指導檔案信息化建設,引導檔案部門主動參與到社會各項活動中來,將服務范圍由內部擴散到社會局面;同時運用新技術,創(chuàng)新檔案服務方式,對檔案數(shù)據(jù)信息進行分析和深度挖掘,突出不同數(shù)據(jù)之間的聯(lián)系性,檔案數(shù)據(jù)記錄了各行各業(yè)取得的重要研究成果與先進經驗,是促進國家和社會不斷前進發(fā)展的重要參考依據(jù),尤其是高、精、尖的技術資料,除了具有極高的學術價值之外,還能夠帶來巨大的社會和經濟效益。最后,加強管控,提升服務質量,檔案管理人員要改變以往的管理模式,由管理者的身份向服務者身份轉變,不再是檔案的保管者和調卷者,而是檔案數(shù)據(jù)信息的傳遞者和服務者,以用戶需求為導向,建立檔案服務管理過程監(jiān)控體系,進一步規(guī)范檔案服務流程,從而通過網絡技術讓檔案資源實現(xiàn)共享,為開展社會活動提供深層次、高質量的服務。
檔案管理部門是社會工作、科研活動的歷史記錄和數(shù)據(jù)資源的管理者,現(xiàn)階段,檔案的大數(shù)據(jù)化正使檔案工作人員在管理思維、處理技術、機構職能、業(yè)務流程等方面有著前所未有的機遇和挑戰(zhàn)。檔案管理人員要緊跟時代的潮流,積極合理地運用大數(shù)據(jù)信息處理技術,以最佳的方式更好地完成“為國守史、為黨管檔、為民服務”的使命。