〔摘 要〕數字資源長期保存是目前全世界所面臨的一個重要課題,我國近幾年也越來越重視這方面的研究。本文對近幾年國內學者在數字資源長期保存方面所做的研究,尤其是所存在的問題和策略研究進行了綜述。
〔關鍵詞〕數字資源;長期保存;綜述
DOI:10.3969/j.issn.1008-0821.2011.11.043
〔中圖分類號〕G252.8 〔文獻標識碼〕A 〔文章編號〕1008-0821(2011)11-0174-04
A Summary of the Domestic Studies on Long-term Storage of Digital Materials
Wang Yingli
(School of Computer and Information Science,Southwest University,Chongqing 400715,China)
〔Abstract〕The technical of long-term storage of digital materiel is now an internationally important subject,and researchers of our country are paying more and more attentions on it.In this essay,the writer will summarize the studies,especially the problems and strategies in these researches,in the area of long-term storage of digital materiels in our country.
〔Key words〕digital materiel;long-term storage;summary
2011年1月19日CNNIC在京發布的《第27次中國互聯網絡發展狀況統計報告》中顯示,截至2010年12月底,我國網民規模達到4.57億,較2009年底增加7 330萬人,互聯網普及率攀升至34.3%,較2009年底提高5.4個百分點。全年新增網民7 330萬,年增幅19.1%;中國的網站數,即域名注冊者在中國境內的網站數(包括在境內接入和境外接入)減少到191萬個,年降幅41%。網站數量的下降與國家加大互聯網領域的安全治理有關,網站等互聯網基礎資源的質量隨著“水分”的溢出而得到提升。雖然網站數量下降幅度較大,但網頁數和網頁字節等互聯網資源數在大幅度增長。網頁的規模反映了互聯網的內容豐富程度。自2003年開始,中國的網頁規模基本保持翻番增長,2010年網頁數量達到600億個,年增長率78.6%[1]。以上數據充分顯示出,互聯網時代數字資源數量的爆炸式增長,但是在信息量劇增的同時,每天也有大量的數字資源丟失,這就要求我們必須對數字資源的長期保存進行研究,從而更好的保護好人類數字文化遺產。
目前,數字資源長期保存已經引起了各國的重視,我國近幾年也成立了一些相關研究項目,學者們也開始對數字資源長期保存相關問題進行了一些探討。筆者利用CNKI的“中國期刊全文數據庫”對從2000年以來國內關于數字資源長期保存方面的發文情況進行統計。分別以題名中同時出現“數字資源”和“長期保存”以及“數字信息”和“長期保存”作為檢索限定條件,共檢索到152篇文獻(會議通知等除外),其中按年份來劃分,發文數目分布情況如 表1:表1 國內關于數字資源長期保存研究文
從表1可以看出,我國關于數字資源長期保存的相關研究是從20世紀90年代末開始的,2000-2004年間發文量很少,表明相關研究還沒得到足夠的重視,但是到了2005年相關文獻量有了較大的提升,并在后面幾年有上升趨勢,2009年發文量達到最高,說明近兩年出現了數字資源長期保存的研究熱潮。雖然我國學者開始關注于數字資源長期保存研究,但是在研究內容上還偏重于理論研究,缺乏實踐研究,對數字資源的研究主要以對相關項目的簡單介紹為主,還有很多都只是偏重于對國外研究成果的介紹以及對有關數字資源長期保存存在的問題和策略進行探討。本文主要對我國數字資源長期保存面臨的主要問題及策略進行總結概括,希望能為以后的相關研究提供參考。
1 國內數字資源長期保存的研究現狀
我國數字資源長期保存的研究開始于20世紀90年代末,國內圖書館界紛紛從政策、法律、管理、技術等多種角度對數字資源長期保存進行了跟蹤研究,做了大量的長期保存知識普及、積累和儲備,同時,我國對數字資源長期保存的實踐研究越來越重視,并進行了多項關于數字資源長期保存領域的研究項目。如中國國家圖書館的網絡信息資源保存試驗項目WICP-Project,數字資源持久保存國際合作試驗項目CSDL項目,數字化科技信息資源長期保存體系與政策機制NSDL項目;在國家973和985項目支持下的中國WEB信息博物館項目(Web Informall);中國高等教育文獻保障系統(CALIS)的建立;中國知網的數字資源保存體系的建立和完善;清華大學圖書館參與的數字資源長期保存系統的研究與開發項目以及“大學數字博物館建設工程”等項目[2-3]。
2 數字資源長期保存面臨的主要問題研究
雖然國內外對數字資源長期保存的研究取得了一定的進展,但是由于數字資源長期保存是一項復雜的研究項目,它涉及到技術、管理、法律、經濟、文化等多方面的影響因素,因此,在進行數字資源長期保存過程中還存在著一些問題有待我們進一步探討。
閻軍、黃國彬在《2007年國外數字資源長期保存研究述評》一文中將數字資源長期保存中遇到的問題分為技術問題和非技術問題,技術問題主要包括OCR與文檔技術的應用、獲取網頁內容的同時獲取用于長期保存的元數據以及評估數字對象長期保存的流程等問題,非技術問題包括數字資源長期保存的權益問題、圖書館在數字資源長期保存過程中的合作與共享問題以及長期保存資源的訪問問題。并提出了人們目前在數字資源長期保存研究中所表現出的技術問題與非技術問題研究并重和側重于研究較優的數字資源長期保存方案[4]。筆者也比較贊同將數字資源長期保存過程中存在的問題分為技術問題和非技術問題兩方面來進行研究。
2.1 數字資源長期保存中的技術問題
網絡信息時代,信息呈爆炸式的增長,雖然計算機技術也在飛速的發展,出現了大量的數字資源存儲技術,但是還遠遠不能滿足數字資源長期保存的需要,保存技術和方法還嚴重滯后,還存在著一系列的技術問題。
張智雄等人在《數字信息資源長期保存技術體系研究》一文中在對一般的數字保存系統涉及的技術進行分析的基礎上,提出了數字資源長期保存技術體系,該體系主要分五大功能塊,涉及到的技術主要有:保存管理相關技術、與攝入相關的主要技術、與倉儲相關的主要技術、與存儲相關的主要技術、與訪問相關的主要技術等[5]。在這些模塊中所涉及到的技術都還存在著各自的問題,需要我們進一步的開發和研究。
周建軍、李肖軍在《數字資源長期保存的技術障礙及對策》一文中分析了原始數據處理技術及其所面臨的障礙,原始數據處理技術主要有數據遷移、標準化技術、仿真技術、封裝技術等,并且還對原始數據保存技術中所面臨的載體脆弱、技術過時、存儲容量小、數據格式不統一等問題進行了闡述[6]。程雪梅在《數字資源長期保存技術之探討》一文中也對數字資源長期保存的幾個原始數據處理技術的優缺點進行了闡述,分析了在具體技術上的缺陷,導致出現技術上的問題[7]。
趙敏[8]、楊小云[9]等都認為數字資源長期保存中所面臨的技術問題主要有:數據載體損壞、技術過時、存儲能力弱、標準不統一等問題。
2.2 數字資源長期保存中的非技術問題
數字資源長期保存過程中涉及到的非技術問題表現在很多方面。學者們大都主要針對管理問題、法律問題、成本問題、權益問題及合作共享問題等方面進行研究。
李亭在《數字資源長期保存的非技術因素探析》一文中提到數字資源長期保存面臨的非技術問題主要是管理問題,其中管理問題又具體包括國家的保存政策、各機構間的合作機制、權益關系等問題,并且提出了數字資源長期保存首先必須受到國家政府的重視,然后各個機構通力合作,明確責任機制、平衡好各機構的權益分配,從而開展合理、合法、經濟和高質量的數字資源長期保存工作[10]。
呂志梅在《國外數字資源長期保存的現狀、問題及對我國的啟示》一文中提出數字資源長期保存過程中存在的比較具體的問題:圖書館高層對數字資源的保存重視不夠、數字發展政策缺乏數字保存方面的規定;數字保存缺乏資金的支持;技術更新速度加快導致數字保存困難重重,而圖書館等信息存貯機構應對措施相對滯后等問題[11]。
臧國全在《數字遷移風險管理》一文中,就主要針對遷移過程中所存在的風險進行分析,主要包括三大方面:與數字資源管理相關的風險、與數據文件格式相關的風險、與格式轉換過程相關的風險,并且他還將3個方面進行細化,分成8項內容:內容穩定性風險、安全性風險、內容連貫性和完整性風險、參考性風險、成本風險、人力資源風險、功能風險以及知識產權風險等,并提出了一些相關的評估和預測方法[12]。
曾怡在《數字資源長期保存的成本與管理因素分析》一文中,將成本具體分為固定成本和可變成本,并對人力資源管理、責任體系和合作制度、安全管理問題等相關管理因素進行了分析,引起對數字資源長期保存的預算成本和管理的重視[13]。
蘇等人在《數字資源長期保存的標準與法律問題綜述》一文中主要就長期保存研究過程中3項較為重要的數字資源長期保存國際標準進行詳細的論述,并且從數字資源的呈繳制度立法和數字資源的版權法問題兩個方面對數字資源長期保存中面臨的法律問題進行了分析[14]。宛玲、張曉林在《數字資源長期保存過程中的知識產權問題分析》一文中,根據開放檔案信息系統參考模型,闡述了圖書館需要解決的長期保存資源攝取環節、存儲環節和服務中的知識產權問題及其需要建立的管理機制[15]。張家德、楊愛萍[16]也認為目前國家關于數字資源長期保存的相關政策和法律的缺失已經成為數字資源長期保存的瓶頸。
宛玲、張曉林[17]還專門對數字資源長期保存的權益管理進行了研究,他們認為要想可靠的進行數字資源的長期保存,就必須解決相應的保存權利問題,必須妥善協調各個相關機構的關系和利益,明確各方所應承擔的責任和權利。
張艷敏、馬秀峰在《中外數字資源長期保存策略比較研究》一文中,通過對國內外數字資源長期保存的研究現狀進行分析,分別從合作保存策略、技術策略、風險管理策略、經濟策略等方面進行比較分析,借鑒國外經驗,找出我國所存在的缺陷和不足,具體指出我國數字資源長期保存項目的合作保存措施有待加強,還沒建立起數字科技文獻長期保存的公共責任和 投入機制以及整體責任體系,嚴重缺乏在大規模時間運營情況下的技術、經濟和服務測試, 還缺乏對已有項目的風險管理和政府足夠的資金支持等問題[18]。
此外,還有一些學者專門就數字資源長期保存過程中的某一具體方面所表現出來的問題進行探討,這里就不再詳細闡述。
3 數字資源長期保存策略研究
面對數字資源長期保存過程中出現的一系列問題,學者們開始研究并提出各種解決問題的對 策和發展策略。
宛玲、吳振新、郭家義在《數字資源長期保存的管理與技術策略——中歐數字資源長期保存國際研討會綜述》一文中將數字資源長期保存的策略分為管理策略和技術策略兩個部分,其中管理策略又包括保存政策、責任體系及合作機制的建立、知識產權問題的解決策略等,技術策略又具體包括開放描述與標準化、各種應用技術方案(如:遷移、仿真、UVC、封裝、硬件博物館、數據再造等)、應用技術方案評價:效能分析方法等[19]。
下面將主要從技術策略和管理策略兩個方面進行闡述。
3.1 技術策略
計算機技術的發展是進行數字資源長期保存工作的保障。在進行長期保存的過程中,不同的階段和情況應該選擇不同的技術策略來對數字資源進行保存,靈活的運用各種保存技術策略,可以更好的對數字資源進行長期保存。
楊小云等[9]人認為數字資源長期保存中主要使用到的技術策略包括數據更新、技術仿真、數據遷移、建立數字信息歸檔系統等策略。周建軍、李肖軍[6]也提出數字資源長期保存機構可采用的技術策略,主要包括統一標準、延長載體壽命、定期更新數據、數據遷移與數據仿真以及利用先進的網絡附加存儲技術等。值得注意的是,數字資源長期保存技術策略的制定不僅僅是一個選擇哪一種技術的問題,而是要根據完整的上下文語境,識別影響選擇技術策略的各種關鍵因素,根據所保存的目標,來選擇合適的保存技術,制定一個安全、可行的混合保存技術策略,這樣才能最終完成好數字資源長期保存的使命。
并且大多數學者都認同以上所列舉的數字資源長期保存技術策略,技術策略的選擇有賴于對各個技術的深刻認識,綜合利用。
3.2 管理策略
雖然技術策略的選擇在數字資源長期保存過程中占有重要的地位,但是管理策略的選擇和制定對數字資源長期保存的整個過程具有更重要的作用。數字資源長期保存如果得不到有效的管理和控制,即使有再好的數字資源長期保存技術方案也不可能有效的實施。所以有很多學者都是針對管理策略來進行探討的。
宛玲在《國外數字資源長期保存的最新發展及對我國的啟示》一文中提到,我國應該積極推進國家數字資源長期保存戰略機制和基礎結構的建立,呼吁研究與實踐并行發展,建立不同層次的合作機制,并且要積極推進學術性資源永久使用權的建設,另外還要建立責任分配與認證機制,加強相關法律、管理模式、經濟運作模式等問題的研究,積極開展自檢數字資源的長期保存活動等[20]。
黃維莉在《數字資源長期保存策略研究》一文中提出我國數字資源長期保存的相關策略主要有以下幾點:①啟動數字文獻資源長期保存戰略計劃,制定相關政策;②落實數字資源長期 保存責任機制,加強相關管理;③制定科學合理的保存策略,尋求技術支持;④開展全方位 的廣泛合作,建立保存網絡。這樣才能有效的開展數字資源長期保存工作[21]。 呂志梅[11]等人也提出了類似的觀點。
針對管理策略中的法律策略,張家德、楊愛萍[16]提出我國應該盡快完善數字資源長期保存的法律保障體系,在實踐中,一方面要保護版權人的利益,另一方面又要加大對數字資源長期保存的力度。因此,國家要調整相關法律政策,完善法律保障體系,調整知識產權、數據保護和政策及指導仿真中不完善的地方,從而保證數字資源長期保存能夠合理、合法的順利進行。袁麗華、包平在《國外數字資源長期保存及我國的發展策略》一文中指出法律問題是數字資源長期保存必須面對的問題,也是數字資源長期保存重點研究的內容,我們應該建立電子出版物呈繳制度,從而可以在法律制度保護下獲得盡可能多的數字文化遺產,同時,還應該構建數字版權保護制度,盡快解決數字資源的保存和使用權的問題[22]。
4 結 語
數字資源長期保存是我們在網絡信息環境下所面臨的一個重大課題,也越來越受到世界各國的重視。目前我國學者在這方面的研究還處于探索階段,主要研究都局限于理論研究,大都是把國外的已有研究成果拿過來進行討論,從而提出一些建議,很大一部分都是針對所存在的問題和對策來探討的,相對國外的相關研究而言,實踐研究還相對缺乏。
通過以上對數字資源長期保存存在的問題和主要應對策略相關研究進行綜述,可以對我國在長期保存方面的研究有一個較為全面的認識。如果我國研究人員在明確了數字資源長期保存過程所存在的問題和相應的技術和管理策略以后,將更多的精力投入到實踐研究中去,那么我國的數字資源長期保存事業將會發展的越來越好。
參考文獻
[1]第27次中國互聯網發展狀況統計報告[EB/OL].http:∥www.cnnic.net.cn/dtygg/dtgg/201101/t2011011820250.html,2011-06-20.
[2]王小林.國內外圖書館數字資源長期保存探討[J].數字與微縮影像,2010,(3):18-20.
[3]數字資源長期保存的基本知識[EB/OL].http:∥www.dlforum.net.cn/front.do,2011-06-20.
[4]閻軍,黃國彬.2007年國外數字資源長期保存研究述評[J].圖書館建設,2008,(11):102-105.
[5]張智雄,林穎,吳振新,等.數字信息資源長期保存技術體系研究[J].現代圖書情報技術,2006,(4):2-7.
[6]周建軍,李肖軍.數字資源長期保存的技術障礙及對策[J].蘭臺世界,2009,(8):4-5.
[7]程雪梅.數字資源長期保存技術之探討[J].圖書館理論與實踐,2005,(5):85-87.
[8]趙敏.淺談數字資源長期保存的相關問題[J].科技情報開發與經濟,2010,20(18):98-101.
[9]楊小云,魏鑫,吳玉玲.數字資源長期保存存在的問題及對策[J].農業圖書情報學刊,2009,21(11):30-33.
[10]李亭.數字資源長期保存的非技術因素探析[J].情報探索,2010,(9):84-86.
[11]呂志梅.國外數字資源長期保存的現狀、問題及對我國的啟示[J].現代情報,2008,(5):28-33.
[12]臧國全.數字遷移風險管理[J].中國圖書館學報,2006,(3):54-56.
[13]曾怡.數字資源長期保存的成本與管理因素分析[J].現代情報,2009,29(4):93-97.
[14]蘇,李景,殷立新,等.數字資源長期保存的標準與法律問題綜述[J].標準科學,2009,(5):53-57.
[15]宛玲,張曉林.數字資源長期保存過程中的知識產權問題分析[J].中國圖書館學報,2005,(3):65-69.
[16]張家德,楊愛萍.淺議數字資源長期保存的瓶頸——國際政策法律的缺失[J].中國科技信息,2009,(12):313-318.
[17]宛玲,張曉林.數字資源長期保存權益管理政策研究[J].圖書情報知識,2006,(2):24-27.
[18]張艷敏,馬秀峰.中外數字資源長期保存策略比較研究[J].圖書館學研究,2009,(6):29-32.
[19]宛玲,吳振新,郭家義.數字資源長期保存的管理與技術策略——中歐數字資源長期保存國際研討會綜述[J].現代圖書情報技術,2005,(1):56-60.
[20]宛玲.國外數字資源長期保存的最新發展及對我國的啟示[J].中國圖書館學報,2004,(2):22-26.
[21]黃維莉.數字資源長期保存策略研究[J].圖書館學刊,2009,(7):68-70.
[22]袁麗華,包平.國外數字資源長期保存及我國的發展策略[J].新世紀圖書館,2009,(2):9-11.