耿志杰 程明宵
[摘要]數字檔案長期保存是信息化背景下檔案部門的長期艱巨使命,涉及技術、管理等諸多領域,是一個龐大的系統工程。針對已識別或潛在的各種風險,檔案部門在制定技術策略時將會面臨技術復雜性和系統性難題,需要在宏觀上進行科學規劃。論文對數字檔案長期保存技術策略規劃的要求、內容、管理三個方面進行研究,以期對檔案部門實踐有所幫助。
[關鍵詞]數字檔案長期保存技術策略規劃
[分類號]G276
Research on Long-term Preservation Technical Strategy Planning of Digital Archives
Geng Zhijie,Cheng Mingxiao
(School of Library Information and Archives of Shanghai University, Shanghai, 200444)
Abstract: The long-term preservation of digital archives is a long-term arduous mission of the archival departments under the informatization-based background. It involves a large number of fields such as technology and management and is a huge system project. For the identified or potential risks, the archival departments will face technical complexity and systemic problems when formulating its technical strategies. The archival departments need to be planned scientifically in macroscopic view. This paper researches the requirements, content and management of digital archives long-term preservation technology strategy planning, in order to help the practice of the archival departments.
Keywords: Digital Archives; Long-term Preservation; Technical Strategy; Planning
現代信息技術在給檔案工作帶來巨大歷史變革的同時,也對數字檔案的真實性、完整性、可用性帶來了嚴峻挑戰,數字檔案長期保存是檔案部門需要面對的長期艱巨使命。目前檔案界對長期保存策略進行了大量理論研究和實踐探索,涉及技術、管理、政策法律等多領域。在技術策略方面,國家檔案局2010年制定的《數字檔案館建設指南》中,將長期保存技術策略概括為“包括存儲格式的選擇,檢測、備份和遷移等技術方法的采用等?!?/p>
“數字檔案長期保存利用機制復雜,涉及數據攝入……等多個領域,覆蓋多方面技術,構成一個復雜的技術體系。”[1]在國內多家檔案館調研過程中發現,目前很多檔案館已經制定并實施了一些長期保存技術策略,但是這些技術策略往往只是針對局部問題,例如只是在存儲環節制定了格式、元數據方案等應對策略,缺乏系統性和長期規劃,難以滿足長期保存的需要。面對技術復雜性和系統性難題,檔案部門在制定長期保存技術策略時,需要在宏觀上進行科學規劃。
1長期保存技術策略規劃的要求
1.1可行性
檔案部門制定的長期保存技術策略,不能好高騖遠、脫離實際,需要綜合考慮三方面因素。
(1)需要充分考慮本館實際情況和信息技術發展趨勢,技術策略不僅要滿足館藏所有數字檔案類型和長期保存需求,而且要充分考慮技術發展帶來的潛在風險。
(2)需要借鑒國內外相關領域的成熟經驗,合理選擇長期保存技術策略,例如在數據格式選擇方面,國家暫未制定標準的,應盡量選擇開放或主流格式,這樣可以減少技術發展帶來的風險。
(3)需要符合國家檔案局制定的行業標準,例如《文書類電子文件元數據方案》(DA/T46-2009)、《版式電子文件長期保存格式需求》(DA/T47-2009)、《基于XML的電子文件封裝規范》(DA/T48-2009)等,當技術發展升級時,可以依靠國家實力來解決問題,減少因本館技術實力不足而帶來的風險。
1.2有效性
檔案部門制定的長期保存技術策略必須確保有效、可靠,并以書面形式明確。
(1)需要充分考慮長期保存過程中可能存在的各種風險因素,確保制定的技術策略在可預測范圍內有效,并能在必要時提供證明材料,例如數據格式遷移記錄等。
(2)需要考慮技術策略實施過程中所有涉及的業務流程和執行部門,以確保各項技術策略能得到有效執行。再完美的技術策略如果不能被有效執行,也只是一紙空文。
2.3可變性
長期保存中使用的各種技術策略,不僅會受到技術發展趨勢的影響,還會受到因技術發展而變化的法規政策、國家標準等方面的影響,充滿了各種未知風險。因此所制定的長期保存技術策略,必須能隨著外部環境的改變而進行必要的升級,同時在升級過程中,不能對數字檔案的真實性、完整性、可用性造成影響,即在升級的同時實現“向下兼容”。
2長期保存技術策略規劃的內容
2.1確定主要技術方法
(1)在數字檔案資源建設環節,采用驗證、格式轉換等技術方法,確保需要長期保存的數字檔案可信、規范。
維護檔案的原始憑證性是檔案工作的核心,確保數字檔案資源的可信性是長期保存的基礎,例如電子文件歸檔中,“在維護電子文件真實性、完整性、有效性、安全性的基礎上,將具有檔案價值的文件移交給檔案部門,以便于今后的有效保管和長久利用?!盵2]如果數字檔案的真實性、完整性得不到保障,則長期保存工作就是徒勞的。在數字檔案資源建設環節,檔案部門應盡量減少人為主觀因素影響,采用多種技術方法,如CA證書、元數據審核、信息安全檢查等,確保數字檔案資源的質量,形成可信數字檔案資源。
對于可信數字檔案資源,應結合行業標準和各檔案館實際情況,針對不同的數字檔案類型確定相應的長期保存格式,這一過程中可采用數據格式驗證、批量轉換等技術方法,確??尚艛底謾n案資源的規范性。
(2)采用封裝技術,形成用于長期保存的數字檔案信息包(AIP),這一環節中要重點注意元數據方案選擇、信息包制作、信息包命名三個方面。
“元數據是電子檔案的重要組成部分,其管理方法、管理水平將直接影響電子檔案長期保存的真實性和憑證性。”[3]因此在長期保存元數據方案選擇中,應該參考行業標準《文書類電子文件元數據方案》(DA/T46-2009),需要注意的是,“這部標準主要是針對文書類電子文件,而其他類型例如圖像、音頻、視頻類電子文件元數據標準缺乏,因此可以借鑒國際上主流標準?!盵4]
按照行業標準《基于XML的電子文件封裝規范》(DA/T48-2009)封裝形成數字檔案信息包,信息包應包含數據文件、元數據、封裝描述信息等,可以被系統識別和管理,并確保數據文件與元數據永久關聯。在封裝過程中,對一般數字檔案可采用物理封裝,對難以封裝的音、視頻類數字檔案可采用邏輯封裝。
在對信息包命名過程中,需要采用規范的命名方法,確保命名的唯一性和長期性,同時系統能夠通過命名對信息包進行識別、定位和管理。
(3)采用多重技術,保障數字檔案長期安全存儲?!耙獙崿F數字檔案長期、有效的保存,主要應解決好兩個基本矛盾:一是數字檔案長期保存的需求與載體脆弱性的矛盾;二是數字檔案保存的長期性與過快的技術淘汰的矛盾?!盵5]長期安全存儲過程周期長、未知風險多,需要綜合采用多重技術,以應對各種未知風險。
針對載體脆弱性難題,檔案部門應該科學規劃和選擇存儲介質,并采取相應的安全管理技術,如磁盤陣列的電源穩定控制、磁帶的防磁場管理等,同時應根據數字檔案的重要程度,采用分級存儲技術。針對過快的軟硬件技術淘汰難題,目前可以根據具體情況采用數據拷貝、遷移、仿真、再生等技術。
異地、異質備份技術是保障數字檔案長期安全存儲的有效方法,調研過程中發現,目前很多檔案館在異質備份上做得較好,但是在異地備份方面,不符合國家檔案局的相關規定。另外,還需要重點關注對異地備份的日常管理維護,以及啟用備份的流程設計和配套監控技術。
2.2建立長效監控體系
(1)數字檔案常規檢測。常規檢測是指對長期保存中的載體和信息包進行檢測,以保證數字檔案的完整性和可用性。在檢測過程中,需要科學設定檢測周期和抽樣比例,并確保檢測過程不會對數字檔案造成損傷。當實施載體、格式、系統遷移等技術策略后,需要進行全面檢測,以防止在技術策略實施過程中數字檔案信息包被修改或丟失。
(2)對技術環境進行監控。長期保存技術策略必須與特定階段的軟硬件技術、行業標準等技術環境相適應,當技術環境發生重大變化時,就需要啟用應對技術策略。因此,檔案部門需要加強對技術環境進行監控,以研判啟用預先制定技術策略的條件和時機。例如存儲格式方面,當主流格式發生重大變化,或者國家檔案局對長期保存格式進行調整時,就需要啟用格式遷移技術進行批量轉換,所以檔案部門需要對數據格式技術發展、行業標準進行監控,為預定技術策略的啟用提供決策依據,目前格式監控環節可以使用DROID工具,“DROID可以評估該文件使用格式的過時風險,推薦采用遷移行動”。[6]
技術環境監控中,還需要重點對技術發展趨勢和新興技術進行跟蹤,不僅可以對目前所采用技術是否會被淘汰進行預警,也可以對將新技術應用到長期保存領域進行預研。例如在存儲載體發展方面,光盤存儲是否會被歷史淘汰,應該引起檔案部門的關注;再如近期興起的區塊鏈技術,在數據存儲安全性方面具有很好的應用前景,是否可以將其應用到數字檔案長期保存領域,檔案部門可以進行跟蹤和預研。
2.3制定風險評估制度和災難應急預案
(1)制定風險評估制度。數字檔案長期保存工作的實質,就是通過識別可能對數字檔案真實性、完整性、可用性造成威脅的各種風險因素,并制定應對策略的過程,因此對各種風險因素的識別是整個長期保存工作的起點。
目前檔案部門需要注意新技術應用帶來的風險,是否可以將某種新技術應用到長期保存中,例如前文所述的區塊鏈技術,需要進行充分的風險評估,這一過程不僅要考慮技術方面的風險,還需要充分考慮新技術帶來的標準、管理等方面的風險。對于已確定使用某種新技術,例如系統升級,需要對具體實施流程進行風險評估,確保新技術替換過程中不會對數字檔案產生影響。
(2)制定災難應急預案。目前制定的遷移、仿真、再生等技術策略,其指導思想是在數字檔案真實性、完整性、可用性被實質破壞之前所采用的預防性技術,可歸為長期保存中“防”的范疇。而在長期保存過程中,不可避免會面臨很多突發災難,例如自然災害、軟硬件故障、人為操作錯誤等,會對數字檔案造成實質破壞,此時檔案部門需要啟動應急預案,例如備份啟用、數據恢復技術等,盡可能將損失減少到最小。應急預案可歸為長期保存中“治”的范疇,“‘防和‘治都是數字檔案保護不可缺少的手段”。[7]在這一方面,青島市檔案館制定的《青島市數字檔案館應急預案》,對自然災害、系統崩潰等情況下數字檔案搶救進行了詳細設計,值得借鑒。
3長期保存技術策略規劃的管理
3.1以書面形式明確既定技術策略
檔案部門在確定長期保存技術策略的基礎上,需要將既定技術策略中的各項實施流程及配套措施以書面形式明確,以保障技術策略的執行。這一過程中,檔案部門的技術實力應能支持技術策略的實施,必要時可借助第三方機構,例如新技術風險評估等;應明確技術策略具體實施流程和業務環節,對每個業務節點要有明確的業務描述和技術指標;應建立配套的責任體系,明確各責任主體的職責和協作,“如果主體不明、責任不清,則長期保存工作難以落到實處,電子文件將面臨失存失控的風險。”[8]
3.2及時更新長期保存技術策略
根據長期保存技術策略可變性的要求,各項技術策略需要與特定階段的外部環境相適應。當外部環境發生變化時,以及技術發展帶來新風險時,需要及時對技術策略做出調整,確保長期保存技術策略在不同的歷史階段都能保持“活力”。
4結語
數字檔案長期保存技術策略,需要從全局視角進行科學規劃,以保證技術策略的可行性、有效性和可變性。檔案部門在技術策略規劃和實施過程中,應以保障數字檔案真實性、完整性、可用性為出發點,根據長期保存中可能面臨的各種風險,確定應對的技術方法,建立技術監控體系、風險評估制度和災難應急預案,并確保技術策略的落實和更新。數字檔案長期保存是一個龐大的系統工程,技術策略只是其中的一部分,技術策略的實施需要組織管理、人員機構、財政保障等方面的支持,相關內容需要在后續研究中繼續深入細化。
*本文系國家社科青年項目“數字檔案安全及長期保存策略研究”(13CTQ050)階段性成果。
參考文獻
[1]趙豪邁.數字檔案長期保存研究[M].西安:陜西師范大學出版總社, 2015:5.
[2]金波,丁華東.電子文件管理學[M].上海:上海大學出版社, 2015:155.
[3]陶水龍,田雷.電子檔案元數據管理方案策略研究[J].檔案學研究, 2016(2): 89-92.
[4]程妍妍,李園園.我國數字檔案館標準規范體系研究[J].檔案學通訊, 2014(6): 53-57.
[5]王芳.數字檔案館學[M].北京:中國人民大學出版社, 2010:285.
[6]錢毅.基于長期保存視角的電子檔案格式管理研究[J].檔案學通訊, 2016(6): 52-57.
[7]唐躍進.數字檔案災難防治研究[J].檔案學通訊, 2014(3):12-14.
[8]屠躍明,張夢霞.電子文件(檔案)長期保存責任體系構建研究[J].檔案學研究, 2016(1):101-106.