張 杰 伍若梅
(上海理工大學圖書館,上海 200093)
隨著信息社會的快速發展,計算機軟件和硬件以及文件格式不斷更新,人們難以對數字資源有效快速地存取。劉喜球認為即使用于數字資源保存的硬件和存儲介質完整無缺,但其存取技術的過時也不可避免[1]。劉家真也指出維護數字信息長期存取的技術措施大多是復雜、昂貴與困難的,都要受到財務、技術與人的因素的制約[2]。從而使得數字資源長期保存問題越來越引起社會的重視。2008年11月由中國科學院國家科學圖書館聯合有關圖書文獻機構在北京召開了主題為“國家數字文獻資源長期保存服務體系建設”的數字圖書館高層論壇首屆年會,呼吁國家教育科研機構和文獻情報機構要充分認識數字文獻長期保存的戰略重要性和現實緊迫性[3]。因此,探討和選擇數字資源的長期保存運行策略,從而有效地實現數字資源的長期高效存取,是數字資源建設必須解決的重要課題。
利用C N K I(中國期刊全文數據庫)對數字資源長期保存策略研究的期刊文獻進行統計,以“數字資源長期保存”*“策略”和“數字信息長期保存”*“策略”為限定條件,從1999年至2011年共檢索相關期刊文獻45篇。按年份劃分,發表論文分布如表1。

表1 數字資源長期保存策略問題研究論文年份分布
從表1可以看出,我國關于數字資源長期保存的策略問題研究,1999~2007年發文量較少,2008~2011年為研究高峰,發文量占總發文量的66.7%,說明學者對這方面的研究已經足夠重視。
目前國內若干文獻機構從不同的角度對數字資源長期保存進行了實踐,取得了一定的進展。筆者在分析國內學者研究成果的基礎上,總結出主要存在的幾方面問題。
技術問題主要是載體壽命和技術格式與更新兩方面的問題。很多學者提出了載體使用年限和載體退化的問題,王萍認為目前這類載體主要是磁盤及C D-R O M,使用壽命為30年,最好的材質也不過100年;磁盤使用壽命更短,大約10至20年,與上千年的紙質相比可謂短暫即逝[4]。李文、周建軍、李肖軍認為載體一般以光、電、磁為介質,一旦受到高溫、潮濕、空氣污染等影響,載體退化就造成了信息的丟失[5,6]。技術格式與更新問題,王萍、李文、張紹武認為數字資源格式的多樣性、軟硬件更新頻繁造成舊的數字信息不能被新的硬件設施和軟件系統讀出以及管理與使用上的不便[4,5,7]。周建軍、李肖軍認為海量的數字資源以各種格式進行保存,缺少統一的格式[6]。
管理問題主要包括公共標準、法律法規、安全問題。公共標準問題,周建軍、楊小云、崔明新等學者認為我國數字信息保存缺乏相關的可被廣泛接受的標準。需要制定通用的技術標準與組織管理協議,降低數字信息在新舊平臺間轉換的難度,減少數字信息長期保存的費用[6,8,9]。秦建寧認為公共標準的缺乏是數字資源難以長期保存的根源之一[10]。關于法律法規問題,楊小云等學者認為在信息專門立法中應包括確認數字圖書館對數字化資料進行管理和保存權利的條文,從而保證這部分資料成為圖書館的永久館藏[8]。熊燕認為數字資源保存過程中信息獲取、提供服務和存儲管理幾個環節都涉及相應的知識產權問題[11]。安全問題方面,楊小云、劉家真等學者認為數字信息媒體的腐壞帶來信息的丟失,而且容易遭受災難性的損失比如戰爭、水災、技術更新、系統升級、格式轉換等[8,12]。楊小云等學者認為網絡的不安全性,已成為限制其發展的最大障礙[8]。陳芳儀稱世界上已發現4000多種病毒,而且每年以12.5%的速度遞增[13]。
數字資源長期保存需要投入大量的資金,由于資金有限,如何合理利用資金也是目前面臨的主要問題之一。丁麗鴿認為如果沒有一個穩定的、可持續的資金支持體系,數字資源的保存將不可能得到有效實施[14]。戴艷清認為目前存在的主要經濟障礙包括:①長期投入與短期收益的不平衡。②潛在利益關系的沖突。③數字信息生命周期的管理鏈斷裂。④我國數字資源長期保存項目之間大多存在交叉重復問題[15]。陳益君、丁梅娟認為數字資源的維護費用受到人員培訓的費用和權利許可交涉的費用的制約[16]。國家圖書館副館長陳力認為,對于重要的數字資源,特別是帶有戰略性的資源和文化遺產的保存,我國還沒有拿出足夠的資金來支持[17]。
在資源選擇上熊燕認為沒有必要保留所有的數字資源,應擬訂一個鑒定與選擇的策略,將有保存價值的數字資源挑選出來長期保存[11]。媒體的利用壽命是需要考慮的因素之一。司莉認為在媒體選擇上,數字信息是存貯在各種類型的物理媒體上的。新型媒體還在不斷涌現,其使用壽命也各不相同[18]。張紹武認為相比傳統媒體,數字信息媒體容易變質,容易遭受災難性損失,對存貯環境的要求較高且使用壽命較短,因此,如何提高產品質量,增強數字媒體的耐久性,已成為數字信息長期保存要解決的問題之一[7]。

表2 數字資源長期保存的技術策略

在保存數字對象的原始版本之外,還需要保存一個簡單的、低技術含量的、經過干燥處理的數據版本,是數字保存策略的附加方案,是一種以防萬一的策略[21]。數據考古技術 將損壞媒體以及損壞和過時的軟硬件環境進行恢復數據內容的方法與手段。數據再造 從原始的字節流中恢復數字資源的原貌,并保證數字資源的可讀性和可用性[21]。通用虛擬計算機(UVC)基于風干的保存策略由Raymond Lorie正在創建一個通用的解碼機器,它用一種簡單的程序在后臺運行來保存數字信息[21]。數據再生技術 將技術過時的數字資源適時地轉到所謂品或紙上[10]。自動存儲包括:直接連接存儲(DAS)、網絡連接存儲(NAS)、存儲局域網(SAN)、ISCSI技術、內容尋址存儲(CAS)。在對數字資源進行包裝過程中,將該數字資源所需的運行環境一起打包,從而實現在其他環境下運行該程序包[10]。標準化技術 將數字資源轉換成一種或多種主流格式,一種特定的格式[22]。硬件博物館 保存計算機中的文件和軟硬件,并保持它們的生命力[23]。服務器存儲保護技術封裝技術包括:ISCSI技術、全自動備份技術、事務跟蹤技術、自動檢驗技術、內存糾錯技術、熱定位技術。
目前,國內學者對技術策略的選擇存在不同觀點。熊燕認為應根據既定目標選擇合適的保存技術,形成一個可行的、安全的混合保存技術策略[11]。婉玲、吳振新、郭家義認為采用哪種技術方案,關鍵取決于被選擇需要保存的資源[23]。張艷敏、馬秀峰認為我國采取的主要技術策略是數字遷移、仿真、更新等[17]。黃維莉稱目前已達成共識的方法主要有拷貝、遷移和再生性保護[24]。王暉認為基于風干的保存策略和基于U V C的保存策略也是數字資源長期保存的主流保存策略。司莉認為數字圖形輸入板適用于文獻和數據庫的長期存取,如年度報告、政府法律文獻、珍貴藝術品等,而對于一些用途有限、需要定期刪除的文獻則適合采用遷移策略[20]。劉喜球提出采用分布連保式網絡存儲[25]。通過對國內學者所提技術策略的研究,筆者比較贊成熊燕的觀點。
管理策略主要從標準規范、法律法規、安全策略、合作保存及責任機制、建立開放系統這幾個方面進行研究。
3.2.1 標準規范。建議使用一些標準格式,如SGML、HTML、TIFF、CCITT Goup4 Fax、JPEG、MPEG、Kodak’s PhotoCD[18]。丁麗鴿認為從數字資源長期保存系統實現的角度看,數字資源長期保存中涉及的標準主要有系統層次的標準、業務層次的標準和數據層次的標準[14]。我國在2002年6月由國家質量技術監督局頒布了《開放式電子出版物結構1.0》,為電子出版物的內容表述提供了規范,這是我國第一個關于數字資源的國家標準[10]。
3.2.2 法律法規。熊燕認為應建立電子出版物的呈繳制度和數字版權保護制度,以利于數字資源保存工作的順利進行[11]。婉玲等人指出在制定數字資源長期保存策略時不僅要考慮版權法,而且還要考慮相應軟件版權保護問題[23]。楊小云等人認為妥善解決知識產權和版權問題的有效措施就是要制定相關知識產權法、版權法、合同法、繳送制等。中國科學院國家科學數字圖書館項目制定了“國家科學數字圖書館數字資源采購技術要求(草案)”,其中專門對資源采購中的“數字資源長期保存要求”做出規定[8]。
3.2.3 安全策略。秦建寧、熊燕認為數字資源的安全問題主要集中在網絡安全上。在大多數情況下,數字資源的安全管理應采取以下策略:①訪問控制;②信息保密;③抗否認;④制定嚴格的法律法規[10,11]。秦建寧還提出面對日益嚴重的網絡犯罪,必須建立與網絡安全相關的法律法規,對確保網絡安全可靠地運行將起到十分有效的作用[10]。袁麗華、包平認為一是要加強用戶認證,二是要采用加密手段,三是要設定訪問權限,四是要做數據備份[26]。
3.2.4 合作保存及責任機制。婉玲、吳振新、郭家義認為數字資源長期保存不僅僅是圖書館、檔案館、博物館等文獻機構的責任,內容創造者、出版商等也應當承擔相應的責任。圖書館尤其是科學圖書館必須要對科學資源提供長期獲取服務,國家圖書館應當擔負起建立國家存檔庫的責任。同時需要數字對象生產者(如科學家)、提供者(如圖書館)、傳播者(如出版商、網站)等之間相互合作,需要圖書館之間相互合作,需要國家、國際層面上的合作[23]。秦建寧、劉家真認為涉及信息形成者、信息系統設計者、出版發行者、信息用戶與信息提供者。館際之間的合作、文獻收藏館所與技術部門、產業部門、標準部門的合作[10,27]。范文蘭認為應建立不同層次的合作機制:①國際合作;②國家級別機構之間的合作;③縱向合作(即個人與機構、基層機構與省級機構、省級機構與國家機構、國家機構與國際機構之間的合作)等[28]。劉喜球提出用分布連保式網絡存儲[25]。戴艷清提出建立國家層面的數字資源合作保存網絡[15]。張玫、李麟等也認為有必要建立國家保存體系[29]。黃維莉提出開展全方位的廣泛合作保存網絡,例如我國擬建的國外科技文獻數字保存網絡[24]。戴艷清提出由國家圖書館牽頭,參與國際合作項目[15]。
3.2.5 建立開放系統。王暉指出有必要建立一個全國性數字信息歸檔保存系統,使之對全國文化、經濟、科技、社會等領域的數字信息的存貯和存取承擔管理責任,使之成為我國數字信息的資源基地[21]。劉家真認為通過維護數字信息可處理性與遷移的交替或同時進行,可維護數字信息的長期存??;執行該策略的前提條件是建立一個開放系統[2]。中國科學院文獻中心提出了一個數字保存技術系統,其中,數字保存技術分屬于保存管理、攝入、倉儲、管理和訪問5個功能塊[17]。張紹武、東野廣升、東野廣鋒、于嘉提出建立全國統一的數字信息歸檔系統,保證數字信息長期可獲取[7,30,31]。
經濟策略是能否順利開展數字資源長期保存的重要因素之一,能否長期持續地對數字資源進行保存,需要資金的支持。丁麗鴿認為編制一個科學的資金需求計劃,清楚認識保存項目中存在的經濟風險;多渠道籌集數字資源長期保存費用,除了依靠行政資金外,還必須有主要來自于數字資源用戶的使用費用和一些大集團的贊助;實施集中分布合作保存模式[14]。熊燕認為要大力做好宣傳工作,讓數字保存理念深入人心[11]。張艷、馬秀峰稱目前我國各項目資金主要來源于國家或政府機構專項投資、圖書館業務經費分配、出版商贊助、用戶贊助等[17]。戴艷清提出開展數字資源長期保存項目立項前的論證,避免盲目投資[15]。
3.4.1 資源的選擇。目前許多專家提出首先保存容易丟失、與未來有關聯且有重要價值的數字資源。王暉建議研究和創建確定什么是必須保存的數字資源特征屬性的工具[21]。秦建寧指出保存重要的科學數據,特別是“原始數據”[10]。戴艷清認為首先應識別并優先保存有消失危險的數字信息資源;其次是選擇有重要價值的資源進行保存[15]。
3.4.2 媒體的選擇。楊小云、魏鑫、吳玉玲、司莉指出現有一種高密度的只讀存貯光盤H D-R O M,是C D-R O M光盤存貯能力的180倍,而價格只是它的一半,是很好的選擇[8,18]。楊小云等學者還提出從存貯技術來看,光盤的D V D系列的存貯設備較有前途,將光盤與磁盤陣列結合起來,讓高速的磁盤陣列作為光盤庫的大容量緩存,可以滿足海量的數字圖書館的存貯要求[8]。周建軍、李肖軍、劉家真指出縮微膠卷被認為是唯一能夠接受的存儲載體,其壽命至少可達300年[2,6]。張艷等學者認為我國的數字資源保存介質以D V D、C D、磁帶、錄像帶為主[17]。我國的國家標準《電子文件歸檔與電子檔案管理規范》對長期歸檔保存的文獻媒體選擇進行了推薦。“本標準推薦采用的媒體,按優先順序分別是:只讀式光盤、一次寫入光盤、硬磁盤、可擦式光盤等[10]。
筆者對國內學者數字資源長期保存策略研究成果進行總結歸納,主要從技術策略、管理策略、經濟策略、選擇策略這4個方面進行探討。目前研究對數字資源長期保存沒有形成成熟的策略方案,學者基本上從理論的角度進行探討,正處于初步階段。通過對國內學者研究成果的歸納,希望今后數字資源長期保存項目在一有研究成果基礎上得以快速發展。
[1] 劉喜球.中小型圖書館數字資源長期保存的對策[J].科技文獻信息管理,2009(3):8-61.
[2] 劉家真.數字信息保存的策略[J].情報學報,2000(4):349-353.
[3]圖書館界呼吁建設國家數字文獻資源長期保存服務體系[J].現代圖書情報技術,2008(11):71.
[4] 王萍.數字信息資源長期保存策略探析[J].湖南第一師范學報,2009(4):134-138.
[5] 李文.試論數字資源的長期保存問題[J].惠州學院學報:社會科學版,2005(2):103-106.
[6] 周建軍,李肖軍.數字資源長期保存的技術障礙及對策[J].數字蘭臺,2009(8):4-5.
[7] 張紹武.數字信息長期保存的策略取向[J].圖書情報工作,2000(6):41-44.
[8] 楊小云,魏鑫,吳玉玲.數字資源長期保存存在的問題及對策[J].農業圖書情報學刊,2009(11):30-33.
[9] 崔明新.數字資源長期保存的技術策略初探[J].現代化管理,2008(3):55-57.
[10] 秦建寧.數字資源長期保存研究進展及發展策略[J].圖書情報工作,2010(6):236-240.
[11] 熊燕.數字資源長期保存的策略研究[J].農業圖書情報學刊,2010(4):124-127.
[12] 劉家真.保護數字信息長期存取研究綜述[J].情報雜志,1999(7):32-35.
[13] 陳芳儀.數字文獻資料的保護[J].江蘇圖書館學報,1997(4):53-55.
[14] 丁麗鴿.非技術因素對數字資源長期保存的影響及應對策略[J].山西檔案,2010(2):28-30.
[15] 戴艷清.原生數字資源長期保存的經濟策略研究[J].圖書館雜志,2010(11):9-17.
[16] 陳益君,丁梅娟.數字資源管理與利用研究[M].北京:科學出版社,2003:207-209.
[17] 張艷敏,馬秀峰.中外數字資源長期保存策略比較研究[J].圖書館學研究,2009(6):29-32.
[18] 司莉.數字信息面臨的挑戰與對策[J].圖書館雜志,1999(3):1-3.
[19] 趙永超.基于仿真的數字資源長期保存策略[J].情報探索,2009(1):89-91.
[20] 司莉.數字文獻長期存取技術策略比較研究[J].大學圖書館學報,1999(5):35-37.
[21] 王暉.數字信息長期保存的技術策略[J].情報探索,2008(10):111-114.
[22] 王清飛,劉琳.數字資源長期保存的策略探討[J].江西圖書館學刊,2008(3):33-35.
[23] 宛玲,吳振新,郭家義.數字資源長期戰略保存的管理與技術策略[J].現代圖書情報技術,2005(1):56-59.
[24] 黃維莉.數字資源長期保存策略研究[J].圖書館學刊,2009(7):68-70.
[25] 劉喜球.中小型圖書館數字資源長期保存的特點及其策略[J].工作研究,2008(9):120-122.
[26] 袁麗華,包平.國外數字資源長期保存及我國的發展策略[J].新世紀圖書館,2009(2):9-11.
[27] 劉家真.保護數字信息的長期存取策略[J].武漢大學學報,1999(4):146-149.
[28] 范文蘭.數字信息長期保存的合作問題探微[J].圖書館學研究,2007(11):23-25.
[29] 張玫,等.中國圖書館數字文獻資源長期保存現狀調查[J].圖書情報知識,2009(2):47-51,59.
[30] 東野廣升,東野廣鋒.數字信息長期保存策略探討[J].情報科學,2001(7):743-744.
[31] 于嘉.數字信息長期保存的策略探討[J].河南圖書館學刊,2005(6):14-23.