蔡 舜(天津科技大學圖書館)
?
解析《數字資源保存管理手冊》的保存策略
蔡舜(天津科技大學圖書館)
摘要:《數字資源保存管理手冊》是由英國的數字保存聯盟編寫的一部被廣泛引用參考的數字資源保存與讀取的重要指南之一。手冊的第三大部分對于數字資源的保存策略進行了詳細的介紹。從媒體的維護和內容保存兩個方面說明了保存策略的操作指南,介紹了媒體的災難恢復計劃、存儲環境、審核與安全和主要保存策略、次要保存策略。
關鍵詞:數字資源保存;媒體;策略;遷移;仿真
《數字資源保存管理手冊》是由英國數字保存聯盟(Digital Preservation Coalition,DPC)于2001年開始編寫有關數字資料保存管理的指導手冊,[1]這項工作一直延續至2008年。截至2008年底,DPC的研究者們緊跟數字保存領域的發展,已經先后對手冊進行了數十次的修訂,通過不斷更新﹑豐富和完善,己經成為世界上數字資源長期保存與長效利用項目的重要參考指南之一,受到各界好評并被廣泛引用?!稊底仲Y源保存管理手冊》主要從數字保存(數字保存會涉及的問題和方面)﹑機構戰略(機構開展數字保存的宏觀管理)﹑機構活動(具體介紹了資源保存機構開展資源保存戰略)﹑媒體和格式(數字保存過程中的載體和文件格式的選擇)四個主題方面制定了操作指南。介于篇幅的關系,本文主要介紹“機構活動”中的關于存儲維護和保存策略手冊。
2.1媒體的災難恢復計劃
災難恢復計劃是指自然或人為災害后,重新啟用信息系統的數據﹑硬件及軟件設備,恢復正常商業運作過程的計劃。[2]手冊認為,盡管災難恢復計劃在大多數情況下是沒有得到執行的(如同大多數消防設施并沒有真正啟用),但是災難發生后恢復的效果往往取決于災難前制定的規劃。
(1)災難恢復計劃要求。要求包括在災難前建立數字資源復本,復本包括在線和離線兩種,且在線與離線復本不能保存在同一個地方,以免出現因人為或自然災難導致的“一損俱損”的情況;保證存儲數據的媒體執行通用產業標準;對于災難恢復計劃的具體流程,需要建立常規機制,保證所有相關人員都能得到關于災難恢復程序的系統訓練。
(2)災難恢復計劃案例。手冊援引了英國埃塞克斯大學的數據存檔(Data Achive)災難處理策略,[3]而這個處理策略對于大多數的機構而言都具有一定的借鑒意義。數字存檔系統是采用層級存檔系統,數據集的每一個文件至少有四個復本。主要復本,這些復本由層級存儲管理系統(HSM)文件系統的主要領域控制;隱藏復本,至少生成一個隱藏復本,當文件更新時它們被隱藏在主要系統的一個獨立的區域內;CD-ROM復本,每個數據集早期都會創作一個CD-ROM復本,作為早期保存程序的一部分,CD-ROM復本允許工作人員存取一個可選的本地資源,當主要系統故障的時候并作為一個備選的長期存儲媒體;離線或者近線復本:創建一個離線或近線復本,當埃塞克斯出現大的災難時使用。表1為埃塞克斯大學不同復本的數據集出現損壞時對應采取的災難恢復計劃。

表1 埃塞克斯大學的災難恢復計劃
2.2媒體的存儲環境
手冊提出適宜的環境條件將提高數字存儲媒體的壽命并能有效防止數字資源或它的文檔受到意外的損壞,同時手冊還指出溫度和濕度大幅度的變動對數字資源的損害要遠大于溫度和相對溫度稍高于理想狀態所帶來的損害。手冊提出了對媒體存儲環境的具體要求,通常情況下,媒體的存儲溫度一般要遠低于正常室溫,如果將其轉移到常溫下操作,需嚴格按照有關程序使其適應環境;對于存儲環境應當建立嚴密的監測程序,及時掌握環境的溫度﹑濕度等相關環境信息;由于存儲媒體對于環境中的灰塵﹑顆粒非常敏感,一粒微小的塵土都有可能導致快速轉動的磁頭毀壞,所以在存儲區域內嚴禁飲食,同時盡可能保持環境干凈;由于存儲媒體有些材料對光敏感,容易引起載體的質變,所以存儲媒體應盡量避免陽光直射,可在媒體的外部加裝附加的保護;對于媒體危害最大的莫過于毀滅性的水﹑火﹑磁場等自然災害,媒體的存儲環境應該遠離水﹑火﹑磁場等危險。
2.3媒體的審核與安全
為保證數字資源在未來的可讀性和完整性,在資源的更新或者遷移過程中不被有意或無意的更改,手冊建議在資源完成操作任務后對其進行審核。為確保遵守法律法規的要求和內部的安全,手冊建議實施一定的安全措施。具體的審核與安全措施:由于媒體狀態的好壞也許光憑表面的現象無法完全判斷,需要通過有關的指數分析才能準確得出答案,手冊推薦由相關的操作人員設置好參數,自動周期性的檢查媒體的可讀性和通過校驗碼周期性的檢查數據文件的完整性。為應對自動審核程序失效,管理層還應建立隨機檢查程序。對于媒體的存儲區域采取嚴格的安全措施,設置獨立的﹑鎖定的區域,對于沒有合理授權的訪問,能準確辨識且完全拒絕。媒體的存儲可能會涉及不同部門的眾多管理人員,為確保存儲設備的安全,相關的管理人員應當簽定專門的職工責任書。

表2 數字存儲媒體推薦環境條件[4]
《數字資源保存管理手冊》把數字資源的長期保存策略分為主要保存策略和次要保存策略。主要保存等略,通常是指那些對數字資源的中長期保存擔負義務的機構如圖書館﹑檔案館等所采用的保存策略。次要保存策略,一般是指可能會被長期保存機構臨時或中短期采用的﹑以及對數字材料暫時有利益關系的機構或個人(如作者﹑出版社等)臨時采用的保存策略。在時間順序上,次要保存策略可能會優先于主要保存策略應用,甚至某些次要保存策略的應用可能會在一定時間內延緩主要保存策略的應用或者起到大大加強主要保存策略的效果的作用。
3.1主要保存策略
目前,主要保存策略應用最為廣泛的還是遷移和仿真。遷移是指隨技術變化定期地轉換數字資源的一種處理過程,它使數字資源從一個硬件﹑軟件的配制向另一個硬件﹑軟件配制轉換,或是從舊的計算機技術向新一代的計算機技術轉換,這一套定期的整體行為能使數字資源適應技術更新不斷地被轉移,使數字資源在將來也可以被存取。[4]就目前的實踐情況來看,數字遷移主要有三種類型:物理遷移(存儲介質遷移)﹑邏輯遷移(數字資源文件格式遷移)和按需遷移(遷移用戶需要訪問的資源)。[5]仿真,則是另一種為應對硬件和軟件技術過時而采用新的技術模仿舊的系統在未來的計算機系統上使用的方式。所謂仿真就是制作一個仿真器,模仿數字信息生成時的軟﹑硬件環境,使數字信息能夠以原始狀態得以重現。[6]仿真器的構建最重要的一點是需要有關數字文件運行必須的軟﹑硬件環境的詳細說明,以保證在未來未知平臺上模擬出原始運行環境。仿真和遷移對維護數字信息的長期存取都有著不可忽略的作用。仿真有助于保護﹑辨認那些極大依賴專門硬件與軟件而又無法在新﹑舊技術平臺間進行遷移的數字對象等,如超文本﹑多媒體等復雜文件。遷移則適用于相對來說較為簡單的數字對象,如線形文本文件等。作為維護數字信息長期存取最常使用的兩種方法,仿真與遷移各有其適用范圍,沒有一種方法是完美無缺,能夠適用于各種類型的數字信息的。因此,在我們選擇維護數字信息長期存取策略的時候,不能簡單地套用某一種保存模式,而應該在時間﹑成本允許的范圍內,綜合考慮數字信息保存的目的﹑數字對象本身的特點以及不同技術策略的優缺點。《數字資源保存管理手冊》詳細的列舉了遷移和仿真兩種策略的優勢﹑劣勢﹑相關的操作要求(見表3)。

表3 主要保存策略[3]
3.2次要保存策略
次要保存戰略最大的特點莫過于其應用時限要短于主要保存策略,同時其相對于主要保存策略可能成本相對較低,對主要保存策略有很好的補充和輔助。
(1)技術保存。技術保存是一種通過保留讀取數字資源的硬件和軟件的方式來克服技術過時的問題。需要注意的是,這種策略當前要求保存硬件和軟件創建的所有材料和關于文件格式說明書。如果具備這些條件,技術保存戰略長期可為仿真和遷移戰略提供有價值的輔助支持。技術保存要求保存硬件和軟件材料的最原始狀態,這對于復雜的數字資源的中短期保存具有很好的實踐價值,但是作為長期的保存策略有點不太現實,因為隨著時間的推移,技術保存的讀取會變得越來越難,訪問會變得越來越有問題。
(2)堅持標準。堅持標準是使用相對開放﹑被廣泛支持或認可的標準和文件格式,因為它們可能具有更大的長期穩定性。在創建和存檔數字資源的時候不拘泥于專門的硬件﹑軟件,技術過時情況也許會推遲出現。堅持標準能減少長期保存的成本,簡化遷移等保存策略,在實施遷移策略時有可能實現規模效應。但是是否采取標準,取決于資源初始創作的意愿,保存機構無法實際干涉,而且穩定的標準本身也面臨升級,不可避免地向新的版本轉化。
(3)向下兼容。向下兼容是指最新的軟件能夠讀取前期用舊版本軟件保存的數字資源。向下兼容策略可以延緩軟件過期的時間,但是并不是所有的供應商都支持向下兼容,這種策略只能用于中短期保存,軟件的兼容與否,取決于供應商及市場,而且任何一種軟件,也不可能指望其能無限期的持續兼容下去。
(4)轉化為穩定的模擬格式。將有一定價值的數字資源轉化為穩定的模擬載體如永久的紙張﹑縮微膠片以及通過電子顯微鏡的可讀鎳盤。這種策略僅對某種小類別的數字材料比較合適,不推薦作為實用的中期策略。轉化為模擬格式是基于縮微膠片和紙張是永久可用的,似乎可以實現一勞永逸,但是使用這種策略不啻于一種倒退,原始數字材料的功能喪失怠盡,數字技術的優勢如使用的便利﹑空間的高利用率都得不到體現。轉化為穩定的模擬格式僅適合不再利用或者不要求數字技術全部功能的特殊類別的數字資源。
(5)數字考古。數字考古是指從原始的字節流中恢復數字資源的原貌,并保證數字資源的可讀性和可用性。[7]它本身算不上是完全意義上的保存策略,只是當有價值的資源不可讀取且沒有相應的保存策略的時候采取的一種措施。目前,有越來越多的專業科技公司提供數字考古的服務,從技術上可以實現恢復由于媒體過時而損壞的信息。但是這種技術往往成本過高且風險大,保存機構很少采用。
(6)封裝。在對數字資源進行包裝過程中,將該數字資源所需的運行環境(包括硬件和軟件),如動態鏈接庫等一起打包,從而實現在其他環境下運行該程序包。封裝技術能確保所有必要的信息都保持一個整體,使后期的使用者能準確的知道哪些因素是讀取需要的。然而通過復制會產生大量文件,使得封裝包變得很大,而且封裝軟件也會出現技術過時的情況。
(7)永久標識符。當數字對象的位置改變,對其進行定位的一種方式,如統一資源名稱(URN’s)﹑數字對象標識(DOI’s);永久統一資源定位(PURLs)等。采用這種方式可以實現當資源位置改變時對資源進行存取,但是沒有一個被所有系統接受的永久標識符方式方法,更為關鍵的是,標識符的有效,取決于一個持續更新﹑永遠得到有效維護的標識符系統。
4.1論述詳細,具有較強的可操作性
《數字資源保存管理手冊》主要關注管理策略應用過程中可能會遇到的一系列問題。相對于其他數字資源保存指南,《數字資源保存管理手冊》對各種情況的闡述更為細致具體,這對于完全沒有數字資源長期保存與長效利用的概念及經驗的人和組織,會有很大幫助。手冊對每一種保存策略都進行優勢和劣勢的比較,讓實際操作者都更能直觀的操作和借鑒。對于媒體的保存環境,指南也給出了范圍明確的溫濕度。
4.2闡述技術的同時,強調操作人員的素質
數字資源的長期保存過程涉及高科技技術的同時,更需要日常的認真嚴格的維護。手冊中多次提到對操作人員的職責要求和進行操作流程的培訓,對于操作人員,不僅要求其具備較高的技術水平,同時還要求具有高度的責任心,認真仔細的工作態度。對于過程要求較嚴格的程序,工作人員稍有不慎就有可能造成前期的努力毀于一旦。
4.3強調多種保存策略的配合
從主要保存策略可以看出,數字資源長期保存策略往往不局限于采用一種策略,而是多種策略的配合才能實現某一資源長期保存。不光長期的主要保存策略如此,臨時性的次要保存策略也是與其它的次要保存策略一起執行。兩種或兩種以上的保存策略互相配合往往能起到互為補充的效果。
4.4保存策略有限,沒有及時更新
從上文可知,手冊論述的保存策略有很多種。但是,隨著技術的變遷﹑平臺的更迭,新的保存技術會不斷涌現,手冊不可能囊括所有的保存策略。如更新(每隔幾年就將信息轉移到新的存儲介質上,防止存儲介質的不可用,保證數據內容的存在性)﹑虛擬(通過軟件模擬的具有完整硬件系統功能的﹑運行在一個完全隔離環境中的完整計算機系統)一種利用率較高的數字資源保存策略﹑再現(re-enactment)(通過技術的運用實現一定層次的過程再現)[8]等,在手冊中都沒有被提及,無遺是件憾事。因此對于廣大參考人員而言,這個手冊也不是萬能,需要操作者根據具體情況進行取舍。
[參考文獻]
[1]數字保存領域相關標準指南[EB/OL].[2014-08-01].http://www.nlc.gov.cn/newtsgj/gtqk/tyck/2009nzml/103/szbc/201012/t20101201_23396.htm.
[2]災難恢復[EB/OL].[2014-08-01].http://baike.baidu.com/view/1871239.htm?fr=aladdin.
[3]Preservation Managementof Digital Materials:The Handbook[EB/OL].[2014-08-01].http://www.dpconline.org/graphics/handbook/.
[4]洪娜.數字遷移的技術可行性分析[J].現代情報,2007(9):37-39.
[5]董曉莉.圖書館數字資源長期保存遷移技術分析[J].圖書館雜志,2012(7):63-69.
[6]肖英.仿真——數字信息長期存取理論與實踐[J].檔案管理,2002(3):19-20.
[7]孟廣均,等.國外圖書館學情報學最新理論與實踐研究[M].北京:科學出版社,2009:268.
[8]Preserving Virtual Worlds Final Report[EB/OL].[2014-08-18].https://www.ideals.illinois.edu/handle/2142/170 97.
Analysis on the Preservation Strategy in Digital Preservation Handbook
Cai Shun
Abstract:Digital Preservation Handbook, compiled by British DPC (Digital Preservation Coalition), is an important and highly referred handbook for preservation and reading of digital materials. The third part of the handbook introduces the preservation strategy in details and illustrates corresponding operation guidance from the aspects of media maintenance and contents preservation. Meanwhile, it introduces media disaster recovery planning, environmental conditions, audit and security,primary strategy and secondary strategy.
Keywords:Preservation of Digital Materials; Media; Strategy; Migration; Emulation
[收稿日期]2015-03-21[責任編輯]王崗
[作者簡介]蔡舜(1979-),女,副研究館員,研究方向:數字資源保存。
中圖分類號:G251.3;G250.73
文獻標志碼:A
文章編號:1005-8214(2016)01-0091-04