林周佳
(中國第二歷史檔案館,江蘇南京,210016)
2010年末,時任中共中央書記處書記、中央辦公廳主任令計劃在出席全國檔案工作座談會時強調,各級檔案部門和廣大檔案工作者要適應當今時代的新發展、適應黨和國家的新要求、適應人民群眾的新期待,大力推進檔案事業改革創新,努力實現檔案工作科學發展,為服務黨和國家工作大局作出更大貢獻。這一指示為檔案事業的發展指明了前進的方向,全國各級檔案部門認真思考,積極探索檔案事業改革與創新之路。當今,是信息化時代,隨著信息技術的不斷發展,各行業對它的依賴程度也越來越高,信息化程度在一定意義上體現了一個行業綜合實力的高低。所以檔案事業的改革與創新必須以信息技術為基礎、為依托,筆者試就民國檔案管理為例從以下三個方面闡述信息技術與檔案館的基礎工作相結合,實現檔案館原先工作模式的改革與創新。
物聯網是新一代信息技術的重要組成部分,其英文名稱是“The Internet of things”。由此,顧名思義,“物聯網就是物物相連的互聯網”。它有兩層含義:第一,物聯網的核心和基礎仍然是互聯網,是在互聯網基礎上的延伸和擴展的網絡;第二,其用戶端延伸和擴展到了任何物品與物品之間,進行信息交換和通信。物聯網通過智能感知、識別技術與普適計算、泛在網絡的融合應用,被稱為繼計算機、互聯網之后世界信息產業發展的第三次浪潮。物聯網是互聯網的應用拓展,與其說物聯網是網絡,不如說物聯網是業務和應用。
國際電信聯盟(ITU)發布的ITU互聯網報告,對物聯網做了如下定義:通過二維碼識讀設備、射頻識別(RFID)裝置、紅外感應器、全球定位系統和激光掃描器等信息傳感設備,按約定的協議,把任何物品與互聯網相連接,進行信息交換和通信,以實現智能化識別、定位、跟蹤、監控和管理的一種網絡。在物聯網環境下,沒有生命的物體植入各種微型感應芯片后,借助網絡就能實現互相通信,人與物體可以“對話”。
目前,國內雖有一小部分檔案館(室)已經開始借助數據庫與互聯網輔助人工進行檔案保管,但由于技術力量薄弱、資金缺乏、保管條件受限、規章制度不完善等多方面原因,此項工作進度緩慢、利用面窄。而大部分國家級、省市級檔案館均未開展物聯網技術應用于檔案保管這項工作。美國權威咨詢機構Forrester Research公司預測:到2020年,世界上物與物互聯的業務相比于人與人通信的業務將達到30:1,因此,物聯網被稱為下一個萬億級的通信業務。物聯網作為按約定的協議,把任何物品與互聯網連接起來,進行信息交換和通信,以實現智能化識別、定位、跟蹤、監控和管理的一種網絡。無疑,在檔案保管這一領域擁有廣闊的應用前景。
物聯網的關鍵技術是RFID(Radio Frequency Identification射頻識別)和WSN(wireless sensor network無線傳感器網絡)。利用RFID和WSN技術,在檔案庫房和特藏室等實體檔案保管部門安裝各種感應芯片,并在芯片中存儲設定信息,包括溫度、濕度、酸堿度等。由處在自然環境中的芯片自動搜集檔案保管環境的信息,并傳遞給中心服務器,可以避免人為干預環境參數測量所產生的誤差,測量過程更為安全,數據結果更加準確。同時,給每件實體檔案植入RFID標簽,并在標簽中存儲該件檔案存放地點、來源、內容等要素,這樣檔案保管員通過讀取電子標簽輕易即可獲知該實物檔案的目前存放的位置,確認它是否在原位,還是被移動,被調閱。保管員可以實時跟蹤每件檔案的入庫、出庫、經手和使用情況,檔案的實時動態數據將被傳到中心服務器,所有被貼上電子標簽的檔案,其每刻“行蹤”都可以通過中心服務器查詢。物聯網及其相關技術的應用給實物檔案保管帶來了前所未有的機遇,它賦予了實物檔案更高的“智能”,物聯網智能化識別、定位、跟蹤、監控和管理的功能不僅最大程度上保障了實體檔案的安全,更從根本上解決了檔案保管員清點和保管海量檔案的難題。
檔案數字化工作是一項順應潮流、適應時代發展的新工作。它把傳統載體的檔案經過檔案整理等前處理工作和檔案數字化加工工作形成數字檔案,通過局域網、政務網、互聯網進行計算機檢索和電子檔案查閱,為信息化時代的檔案利用提供了新的服務模式,增強了檔案業務部門的服務水平和工作效率。
筆者供職的中國第二歷史檔案館正在進行的館藏檔案數字化工程主要分為歷史檔案整理和數字化加工兩個組。歷史檔案整理劃分為:承接登記、檔案入庫、拆分編號、檔案鑒定、托裱修補、填寫卷皮、裝訂還原、質量檢查、移交入庫等9個工序;數字化加工劃分為:掃描、掃描質檢、圖像處理、圖像質檢、著錄、著錄質檢、制作目錄、批量掛接、數據檢查驗收(總質檢)、數據備份、成果管理等11個工序。
同時,借助數字化加工軟件和檔案著錄掛接軟件實現將紙質載體中記錄的傳統檔案信息轉化成可以被計算機識別和處理的數字信息。
數字化加工軟件能提供專業的圖像獲取、處理和管理技術,將檔案的數字化加工從掃描、圖像處理、圖像質檢、統計監控等進行全程的管理和控制,各種自動化技術(自動圖像傾斜校正、批量圖像清理)能夠保證圖像標準、規范、整潔。
檔案著錄掛接軟件符合檔案著錄規范要求,并且能夠進行著錄擴展。軟件具有自動生成序號、繼承著錄、檔號自動生成等快速著錄設置,并能夠進行重復性、一致性、唯一性、必填性等多種校驗方式,能夠準確、快捷的完成檔案條目的錄入,并確保質量;掛接功能能夠自動實現著錄條目和掃描的圖像之間的匹配關系,并保證100%的正確率。
檔案數字化與傳統的檔案管理模式相比,具有不可替代的優越性:
第一,增強了對歷史檔案原件的保護。歷史檔案經過數字化之后,查檔過程中可以減少對檔案原件的使用,甚至可以封存原件,對一般的利用者用電子檔案替代原件使用。
第二,提高了查檔的工作效率。數字化后的檔案被導入中心數據庫,與目錄掛接。查檔過程中可通過對數據庫檢索實現利用,與人工翻閱紙質檔案相比,大大提高了查詢效率。

檔案整理具體流程
第三,為未來互聯網上的檔案利用提供數據保障。
云計算是分布式處理(Distributed Computing)、并行處理(Parallel Computing)和網格計算(Grid Computing)的發展,是這些計算機科學概念的商業實現。從本質上講,云計算是指用戶終端通過遠程連接,獲取存儲、計算、數據庫等計算資源,云計算在資源分布上包括“云”和“云終端”。
圖書館行業對云計算的發展給予了高度重視,對其技術進行了較多的論述與嘗試,并在部分單位進行了試點。與圖書館界相比,由于檔案工作涉及安全性、保密性等諸多問題,檔案界對云計算的應用尚處于理論研究層面。國家檔案局提出“大檔案、大服務、大安全”的觀念,這對檔案利用服務,提出了全新的要求,如何改變原有獨立且分隔的民國檔案信息資源存儲、利用及服務模式,如何有效整合民國檔案分布式資源,消除單個民國檔案信息孤島問題,實現保存在各省、市、縣檔案館的民國檔案信息的資源體系整合共享,將是未來民國檔案管理的重點工作。
構建全國民國檔案云服務平臺,有利于整合全國范圍內民國檔案資源,加快民國檔案資源體系、利用體系和檔案安全體系建設,推進檔案工作自身的科學發展、提高檔案工作的服務效能。因此,檔案界應直面新技術帶來的挑戰,在充分把握、理解各種云計算服務特性的基礎上,綜合考慮當前云計算模式與民國檔案云服務平臺管理間存在的觀念差異,密切結合民國檔案云服務平臺自身的戰略定位與業務實際、創新服務理念,研究分析在云計算時代檔案數字化建設中的全新管理與服務模式。

數字化加工流程
目前全國各級檔案館都在緊鑼密鼓地進行檔案數字化工作,這一契機為民國檔案全文檢索創造了有利條件。中國第二歷史檔案館以全國檔案館資源整合建設實踐為基礎,結合云計算基礎設施即服務(IaaS),平臺即服務(PaaS)和軟件即服務(SaaS)的服務理念,在國家檔案局“三大戰略、三個體系”的建設要求指導下,以數據整合、統一服務為基本目標,研究探索全國范圍內民國檔案資源管理和利用建設思路,明確先進可行的數據存儲模式、協同工作模式、應用服務模式、信息共享模式,擬探索建設全國民國檔案云服務平臺,為國內其他檔案館的云平臺建設提供一種參考思路與方法。
云服務平臺主要是由云上的各檔案館管理應用程序數字管理節點、計算機專用網絡及安全防火墻、各檔案館的硬件設施等構成。云服務平臺上的檔案信息是分布式的,以數據流的形式分布存儲在各個數字檔案管理節點上。在基于云的檔案管理系統里面,核心的還是數字檔案信息的組織形式,也是基于云計算下的一個基本的組織模式。其架構如下:
參與云的各檔案館將其民國檔案數據上傳至云服務器,用戶通過在云平臺上的檢索即可查找到其所需的分布在全國各地的民國檔案信息。對于全國民國檔案管理來說,基礎設施、基礎服務的統一管理可以節約信息化成本,避免重復建設,重復投資,最大限度發揮國家財政的作用;對于各家檔案館來說,能夠減少對硬件設備的投入,減少對傳統管理模式的投入,通過對不同設備、不同地域的數據和應用的共享為查檔者提供更加便捷、高效、全面的服務;對于用戶來說可以避免為了查詢某個檔案信息跑遍全國所有相關檔案館逐家查檔的窘境,可以充分享受云平臺上分布式計算帶來的高效,不必再擔心某一時段客戶端上超負載帶來的困擾。
美國專門從事信息技術研究和咨詢的Gartner公司,在2008年發布的《云計算安全風險評估》中總結了目前云計算技術存在的7個安全風險:特權用戶訪問風險;法規遵守風險;數據位置不確定風險;共享存儲數據風險;數據恢復風險;調查支持(數據跟蹤功能)風險;長期發展風險。
大致可歸結為三個層面的安全問題:云計算用戶的數據安全和應用安全;提供云計算服務的平臺自身的安全和服務的持續性;云計算資源的安全。基于檔案信息的敏感性,為確保檔案信息不因偶然的或者惡意的原因遭到破壞、更改、泄露,保證云環境下檔案服務平臺能夠持續、可靠、正常地運行,法律法規的制定、技術人員的配備、軟硬件的保障、服務商的選擇都顯得尤為重要。

按照《數字檔案館建設指南》中的定義,數字檔案館是指各級各類檔案館為適應信息社會日益增長的對檔案信息資源管理、利用需求,運用現代信息技術對數字檔案信息進行采集、加工、存儲、管理,并通過各種網絡平臺提供公共檔案信息服務和共享利用的檔案信息集成管理系統。數字檔案館作為傳統檔案館利用計算機軟件、存儲及網絡技術形成的全新的展現方式,是當今知識經濟時代基礎信息資源不可替代的部分,能夠為廣大用戶提供科學研究、知識普及及智能化服務的全新途徑。物聯網、檔案數字化、云計算作為多種計算技術和服務理念的合成,將對數字檔案館資源建設與服務運作方式、經營成本、創新方式、支持服務系統等方面產生積極影響,給新時代的數字檔案館的管理與服務發展帶來了巨大的機遇。
當然,信息化技術的應用是一把雙刃劍,它給我們檔案管理帶來便捷、高效的同時,也使更多的檔案信息存儲在計算機硬件上,暴露在開放的網絡環境中,于是計算機安全、網絡失泄密又成為我們不得不深入探討的另一個課題。
[1]令計劃出席全國檔案工作座談會:大力推進檔案事業改革創新努力實現檔案工作科學發展,中國檔案,2011(1).
[2]馬建.物聯網技術概論.機械工業出版社,2011:1-12.
[3]崔海莉,張惠達.云計算環境下檔案信息管理系統風險分析,檔案學研究,2013(1).
[4]國家檔案局.數字檔案館建設指南,2010.