施納
(長(zhǎng)沙師范學(xué)院圖書(shū)館 ,湖南 長(zhǎng)沙 4101001)
高校圖書(shū)館數(shù)字資源長(zhǎng)期保存的策略研究
施納
(長(zhǎng)沙師范學(xué)院圖書(shū)館 ,湖南 長(zhǎng)沙 4101001)
在我國(guó)數(shù)字資源保存起步較晚的情況下,高校圖書(shū)館進(jìn)行數(shù)字資源保存政策更加少。因此我國(guó)高校圖書(shū)館要結(jié)合當(dāng)前實(shí)際情況,應(yīng)制定一套合理、完善的長(zhǎng)期保存政策來(lái)引導(dǎo)數(shù)字資源保存的實(shí)踐。
數(shù)字資源;長(zhǎng)期保存;策略
隨著信息技術(shù)的發(fā)展,數(shù)字資源飛速增長(zhǎng),大多數(shù)的出版物都以數(shù)字形式出現(xiàn)。圖書(shū)館文獻(xiàn)資源體系中數(shù)字資源已經(jīng)成為的重要的一部分,特別是高校圖書(shū)館,對(duì)數(shù)字資源的利用更多,因此高校圖書(shū)館必須在數(shù)字資源保存方面發(fā)揮其主要作用,制定一整套的長(zhǎng)期保存政策來(lái)完成數(shù)字資源保存的實(shí)踐。
數(shù)字資源長(zhǎng)期保存是指為保證數(shù)字比特流可長(zhǎng)期維護(hù)和其內(nèi)容可長(zhǎng)期獲取的必要管理活動(dòng),有兩層含義,一是長(zhǎng)期存儲(chǔ)(storage),一是長(zhǎng)期可獲取(access)。其中,長(zhǎng)期存儲(chǔ)的目的是長(zhǎng)期可獲取,包括權(quán)利和技術(shù)層面的可獲取。長(zhǎng)期在這里的特殊含義是指這個(gè)資源被社會(huì)所需要的時(shí)間。數(shù)字資源很依賴于存儲(chǔ)設(shè)備和目標(biāo)管理,數(shù)字資源的長(zhǎng)期保存實(shí)際上是對(duì)數(shù)字資源本身和與之相關(guān)的技術(shù)、方法和工具的保存。因此,要想做到數(shù)字資源的長(zhǎng)期保存就必須達(dá)到以下幾個(gè)要求:①通過(guò)對(duì)數(shù)字存儲(chǔ)媒體的保護(hù)與轉(zhuǎn)移,保證存儲(chǔ)其中的物理數(shù)字?jǐn)?shù)據(jù)能準(zhǔn)確而完好地讀出;②通過(guò)對(duì)相關(guān)數(shù)字資源的格式、編碼、壓縮、加密、標(biāo)記、結(jié)構(gòu)等方面的信息,對(duì)數(shù)字資源內(nèi)容進(jìn)行識(shí)別和解析;③保存好相關(guān)的軟件和硬件的環(huán)境,通過(guò)相應(yīng)的技術(shù)工具來(lái)識(shí)別和利用數(shù)字資源;④利用數(shù)字資源的內(nèi)容驗(yàn)證、身份校驗(yàn)、版本變更知識(shí)產(chǎn)權(quán)管理機(jī)制、資源安全機(jī)制等一系列手段,可靠地、合法地來(lái)鑒別與使用被保護(hù)的數(shù)字資源;⑤對(duì)數(shù)字資源的知識(shí)組織體系和利用環(huán)境進(jìn)行保存。
(1)數(shù)字資源急劇增長(zhǎng)的需要。隨著信息技術(shù)的不斷發(fā)展與提高,人們對(duì)數(shù)字資源的依賴日益增強(qiáng),主要表現(xiàn)在網(wǎng)民數(shù)量的大幅增長(zhǎng)(如圖1所示)、IP地址數(shù)量的增長(zhǎng)(如圖2所示)、網(wǎng)站數(shù)量的增長(zhǎng)(如圖3所示)和網(wǎng)頁(yè)數(shù)量的增長(zhǎng)(如圖4所示)。

圖1 網(wǎng)民數(shù)量的大幅增長(zhǎng)

圖2 IP地址數(shù)量的增長(zhǎng)

圖3 網(wǎng)站數(shù)量的增長(zhǎng)

圖4 網(wǎng)頁(yè)數(shù)量的增長(zhǎng)
(2)保障數(shù)字資源來(lái)源的需要。政府部門(mén)、事業(yè)單位、教育機(jī)構(gòu)尤其是圖書(shū)館(幾乎所有)都在不懈的進(jìn)行著數(shù)據(jù)庫(kù)的建設(shè),根據(jù)需要或買(mǎi)、或建、或通過(guò)獲得贈(zèng)送等方式實(shí)現(xiàn)自己的數(shù)字資源。總體來(lái)看,缺少統(tǒng)一規(guī)劃,呈現(xiàn)出凌亂的格局。如:①采購(gòu)的期刊。國(guó)內(nèi)的如清華同方、國(guó)外的如WSN,NSTL購(gòu)買(mǎi)的。圖書(shū)則是方正,超星或其它。②自建的。研究生論文庫(kù)、特色數(shù)據(jù)庫(kù)(如河北大學(xué)文庫(kù))、機(jī)構(gòu)網(wǎng)站信息或其它等等。③免費(fèi)獲取的。
(3)保護(hù)脆弱的數(shù)字資源需要。數(shù)字資源一旦無(wú)法使用會(huì)帶來(lái)很多問(wèn)題① 從物理存儲(chǔ)方面:數(shù)字資源及其所依賴的網(wǎng)絡(luò)、存儲(chǔ)媒體非常不穩(wěn)定;信息技術(shù)變化太快,硬件和軟件都在不可預(yù)測(cè)地老化。② 從使用方面:多數(shù)情況下信息機(jī)構(gòu)僅購(gòu)買(mǎi)了數(shù)字資源的使用權(quán);由于多種原因,數(shù)據(jù)庫(kù)商或其委托的鏡像服務(wù)商有可能終止經(jīng)營(yíng)或者停止向用戶提供服務(wù)。
我國(guó)數(shù)字資源保存活動(dòng)雖然起步遲,通過(guò)吸收國(guó)外成功案例的經(jīng)驗(yàn)的基礎(chǔ)上也取得了一定的成績(jī)。目前中國(guó)國(guó)家圖書(shū)館WICP項(xiàng)目和中國(guó)Web信息博物館計(jì)劃是國(guó)內(nèi)比較有影響力的關(guān)于數(shù)字資源的保存活動(dòng)。
國(guó)內(nèi)圖書(shū)館的數(shù)字資源保存活動(dòng)剛剛開(kāi)始,還只有極少數(shù)的文獻(xiàn)機(jī)構(gòu)對(duì)數(shù)字資源的保存地進(jìn)行研究和試驗(yàn)。高校圖書(shū)館的數(shù)字資源保存政策更是少有問(wèn)津,據(jù)了解,目前僅有北京大學(xué)圖書(shū)館制定了比較正式的數(shù)字資源保存政策。清華大學(xué)圖書(shū)館通過(guò)對(duì)國(guó)外技術(shù)的借鑒并合作研發(fā)并制訂了保存元數(shù)據(jù)框架,得以實(shí)現(xiàn)數(shù)字資源的長(zhǎng)期保存。經(jīng)研究發(fā)現(xiàn),我國(guó)高校圖書(shū)館數(shù)字資源保存更適合參加第三方保存機(jī)構(gòu),通過(guò)機(jī)構(gòu)政策來(lái)約束并指導(dǎo)圖書(shū)館數(shù)字資源的保存,但加入了第三方保存機(jī)構(gòu)的圖書(shū)館不多。例如,中國(guó)科學(xué)院國(guó)家科學(xué)圖書(shū)館和清華大學(xué)圖書(shū)館參加了LOCKSS項(xiàng)目,香港浸會(huì)大學(xué)圖書(shū)館、香港教育學(xué)院圖書(shū)館、香港科技大學(xué)圖書(shū)館和北京大學(xué)圖書(shū)館參加了CLOCKSS項(xiàng)目,還有幾所高校圖書(shū)館參加了兩個(gè)及以上的第三方保存機(jī)構(gòu)。國(guó)內(nèi)其他高校圖書(shū)館基本上不僅沒(méi)有制定明確的數(shù)字資源長(zhǎng)期保存政策,也未參加任何有關(guān)的第三方保存機(jī)構(gòu)。
20世紀(jì)90年代初,歐美等發(fā)達(dá)國(guó)家的圖書(shū)館和相關(guān)聯(lián)盟為應(yīng)對(duì)數(shù)字資源長(zhǎng)期保存,對(duì)數(shù)字資源長(zhǎng)期保存方面開(kāi)展了一系列的研究,如美國(guó)的OAIS參考模型和NDIIPP項(xiàng)目、澳大利亞的PANDORA項(xiàng)目、荷蘭的NEBLIB項(xiàng)目等,進(jìn)展迅速,也積累了豐富的經(jīng)驗(yàn)。
(1)美國(guó)的OAIS參考模型。OAIS即開(kāi)放檔案信息系統(tǒng),1999年5月由美國(guó)空間數(shù)字系統(tǒng)咨詢委員會(huì)發(fā)布的來(lái)支持?jǐn)?shù)字資源的長(zhǎng)期保存和維護(hù)的參考模型。這一參考模型在2003年 3月通過(guò)評(píng)審,正式成為一項(xiàng)新的國(guó)際標(biāo)準(zhǔn)(ISO14721:2003)。此模型對(duì)數(shù)字信息的長(zhǎng)期保存和維護(hù)的檔案系統(tǒng)提供一個(gè)概念性的框架,描述了一個(gè)檔案系統(tǒng)存在的環(huán)境及功能組織和支持檔案處理的信息基礎(chǔ)結(jié)構(gòu)。在CCSDS和ISO的推動(dòng)下,OAIS參考模型成為了規(guī)范數(shù)字檔案系統(tǒng)普遍遵守的標(biāo)準(zhǔn),適用于范圍廣,因而被政府部門(mén)、圖書(shū)館、檔案館、文化傳承等領(lǐng)域很多組織所采用。
(2)澳大利亞的PANDORA項(xiàng)目。1996年澳大利亞國(guó)家圖書(shū)館創(chuàng)建的PANDORA是保護(hù)和存取澳大利亞網(wǎng)絡(luò)信息資源項(xiàng)目,主要是建立一個(gè)在選擇使用澳大利亞網(wǎng)絡(luò)信息資源歸檔系統(tǒng),同時(shí)也保護(hù)和存取澳大利亞電子資源制定政策和程序。該項(xiàng)目采取了選擇存取的方法主要用于收集和澳大利亞相關(guān)的有研究及保存價(jià)值的信息。它的特點(diǎn)是數(shù)據(jù)增長(zhǎng)快,數(shù)據(jù)規(guī)模大,各種類(lèi)型的文件多,主要是文本文件和圖像文件。
(3)荷蘭的NEBLIB項(xiàng)目。網(wǎng)絡(luò)化歐洲存儲(chǔ)圖書(shū)館項(xiàng)目NEDLIB項(xiàng)目,是歐洲7個(gè)國(guó)家圖書(shū)館(荷蘭、法國(guó)、挪威、德國(guó)、葡萄牙、瑞士、意大利)以及3個(gè)主要出版社KLUWER、ELSEVIER、SPRINGER—VERLAG共同參與,以合作項(xiàng)目形式研究長(zhǎng)期保存基礎(chǔ)結(jié)構(gòu)。它起源于歐洲國(guó)家圖書(shū)館會(huì)議主持的書(shū)目記錄計(jì)算機(jī)化行動(dòng),1998年正式啟動(dòng),由荷蘭國(guó)家圖書(shū)館領(lǐng)導(dǎo),歐洲委員會(huì)的遠(yuǎn)程信息處理應(yīng)用計(jì)劃資助,合作開(kāi)發(fā)一個(gè)通用的結(jié)構(gòu)框架和基本工具來(lái)建立電子出版物的存儲(chǔ)系統(tǒng)。
(1)建立健全法律保障體系。圖書(shū)館數(shù)字資源長(zhǎng)期保存必須要建立健全法律體系才能順利推進(jìn),完善的法制建設(shè)為圖書(shū)館數(shù)字信息資源長(zhǎng)期保存指明方向,數(shù)字資源長(zhǎng)期保存是一個(gè)多個(gè)行業(yè)、機(jī)構(gòu)和部門(mén)共同參與協(xié)作的系統(tǒng)工程,為了協(xié)調(diào)之間的利益和職責(zé)來(lái)制定相應(yīng)的政策法規(guī)。目前正在研究和即將推出的《圖書(shū)館法》是對(duì)數(shù)字資源長(zhǎng)期保存的權(quán)利和義務(wù)進(jìn)行規(guī)定,保證各個(gè)部門(mén)和機(jī)構(gòu)的利益不受侵犯,保證用戶充分利用可以承受的價(jià)格來(lái)使用這些資源。
(2)圖書(shū)館專業(yè)人才的培訓(xùn)。圖書(shū)館人員不但要具備圖書(shū)館專業(yè)知識(shí)還要有一定的外語(yǔ)知識(shí)和網(wǎng)絡(luò)信息知識(shí),才能勝任“信息導(dǎo)航員”、“ 網(wǎng)絡(luò)咨詢員”等工作。通過(guò)各種形式的培訓(xùn)對(duì)工作人員進(jìn)行繼續(xù)教育是圖書(shū)館開(kāi)展數(shù)字資源長(zhǎng)期保存的一項(xiàng)重要措施,使工作人員成為高層次、全方位、復(fù)合型的圖書(shū)館管理人才。也是圖書(shū)館進(jìn)行數(shù)字資源長(zhǎng)期保存的有力保障。
(3)建設(shè)數(shù)字資源長(zhǎng)期保存的標(biāo)準(zhǔn)化。統(tǒng)一的技術(shù)和業(yè)務(wù)標(biāo)準(zhǔn)對(duì)圖書(shū)館數(shù)字資源長(zhǎng)期保存很重要。這些標(biāo)準(zhǔn)既有軟件的選擇還有數(shù)據(jù)的格式等。軟件是專門(mén)購(gòu)買(mǎi)還是采用免費(fèi)的,數(shù)據(jù)格式是采用一種還是幾種等等,這些都必須落實(shí)到實(shí)處。這樣統(tǒng)一的標(biāo)準(zhǔn)才會(huì)在數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)遷移更具有一致性和可操作性。
(4)利益平衡關(guān)系。在數(shù)字資源長(zhǎng)期保存中,主要是大型圖書(shū)館數(shù)字資源為主,中、小型圖書(shū)館資源大多是受益者角色。必須要有專門(mén)機(jī)構(gòu)和組織來(lái)制定相應(yīng)的補(bǔ)償機(jī)制。平衡好各個(gè)機(jī)構(gòu)的利益,實(shí)現(xiàn)參與方的多贏,數(shù)字資源長(zhǎng)期保存才能長(zhǎng)遠(yuǎn)的發(fā)展。
(5)采用適當(dāng)?shù)募夹g(shù)和措施。當(dāng)信息的營(yíng)建或軟件的規(guī)范或程式發(fā)生變化時(shí),營(yíng)建與軟件也會(huì)發(fā)生變化,信息將無(wú)法正常讀出,對(duì)于多媒體信息來(lái)說(shuō)非常。對(duì)此情況常用的技術(shù)有:“仿真”、“更新”和“遷移”。“仿真”是用一個(gè)計(jì)算機(jī)系統(tǒng)去模擬另一個(gè)計(jì)算機(jī)系統(tǒng),使兩者的功能完全相同。“更新”就是通過(guò)復(fù)制,將數(shù)字信息從一個(gè)媒體拷貝到另一個(gè)媒體上。“遷移”是數(shù)字信息從一個(gè)硬件、軟件配置向另一個(gè)硬件、軟件配置轉(zhuǎn)移,或是向新一代的計(jì)算機(jī)技術(shù)轉(zhuǎn)換。
數(shù)字資源的長(zhǎng)期保存對(duì)科學(xué)、教育、文化和社會(huì)的可持續(xù)發(fā)展至關(guān)重要,數(shù)字資源長(zhǎng)期保存是一項(xiàng)艱巨而復(fù)雜的任務(wù),面臨著經(jīng)濟(jì)、技術(shù)、法律、安全等多方面的問(wèn)題,數(shù)字資源保存不僅僅是單個(gè)機(jī)構(gòu)和個(gè)人的責(zé)任,還關(guān)系到整個(gè)人類(lèi)社會(huì)的生存和發(fā)展,需要政府的鼎力支持和社會(huì)各方面力量的共同努力。高校圖書(shū)館通過(guò)制定數(shù)字資源保存政策能夠保障并實(shí)現(xiàn)學(xué)術(shù)成果的有效存取,為人類(lèi)文明的傳承貢獻(xiàn)一份力量。形成數(shù)字資源長(zhǎng)期保存的技術(shù)環(huán)境與社會(huì)氛圍,在瞬息萬(wàn)變的信息時(shí)代做好數(shù)字資源的長(zhǎng)期保存工作。
A Research on Strategies for Long-term Storage of Digital Resources in Libraries of Universities and Colleges
SHI Na
(Libruary of Changsha Normal College,Changsha,Hunan 4101001,China)
AS it started relatively late in our country to save digital resources,there was less polices in libraries of universities and colleges in respect to save digital resources.As a result, the libraries of universities and colleges shall combine the actual situation in our country,develop a reasonable,perfected policy to guide the practice of the long-term storage of digital resources.
digital resources;Long-term preservation;strategy
G250.73
A
2095-980X(2015)02-0112-02
2015-01-15
本文系2013年湖南省情與決策咨詢研究課題(2013BZZ13 0),課題名稱:“湖南省數(shù)字資源長(zhǎng)期保存的策略研究”。
施納(1971-),女,湖南長(zhǎng)沙人,館員,碩士(本科),主要研究方向:數(shù)字資源。