999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

高校圖書館數字資源建設與長期保存研究探析

2022-09-30 07:08:10梁學明
河南圖書館學刊 2022年9期
關鍵詞:數據庫圖書館資源

高 健,梁學明,秦 奮

(大連理工大學圖書館,遼寧 大連 116024)

1 緒論

圖書館作為高校的文獻保障中心,主要職責是負責館藏資源的建設與管理,其中數字資源的長期保存是一項長期而艱巨的任務,是全球學術界普遍關注的熱點課題。數字資源的特點是規模龐大、格式各異、增長迅速,獲取和利用條件各不相同,異構數據庫互操作繁瑣,缺乏統一規范的維護與管理標準。相對于傳統媒介資源,數字資源在使用、保管等環節也面臨很高風險,容易被清除、篡改,同時,技術手段的迭代、新材質的應用、新媒體的興起也極易導致數字資源存儲媒介被淘汰、獲取方式面臨更新等問題,因此,長期保存及可持續性應用成為數字資源揭示與管理工作中面臨的一個巨大挑戰。

1.1 數字資源與數字資源長期保存

所謂數字資源是指以電子化、數字化的形式存儲、傳播與使用的信息資源的總稱,存儲介質多為縮微膠片、磁帶、光盤、硬盤、閃存等磁光電物理設備,通過網絡及計算機終端存取、傳播和顯示,在不同場合也可冠以電子出版物、電子資源等名稱。

數字資源長期保存可被描述為:為保證數字資源不受各種環境因素影響,內容信息完整準確,且能長期安全存儲和有效傳遞,被現在或將來用戶順利理解而進行的持續維護更新的目標導向活動。美國學者Priscilla Kaplan提出的數字保存金字塔模型清晰描繪出數字資源長期保存流程整個生命周期中各節點的具體實現目標。

1.2 國內外研究進展

國外對數字資源長期保存與利用的研究開展于20世紀90年代,以項目經驗為依據,制定和修訂制度、標準、規范,指導現實中的資源長期保存工作。

1994年,歐洲保存與獲取委員會(ECPA)宣告成立,委員會的宗旨是聯合組織成員共同研究人類文獻資源的保存和使用問題。迄今為止,ECPA已成為全球最大的數字資源長期保存的協會組織。2003年,OAIS參考模型(Open Archival Information System)作為ISO標準頒發,該模型推廣一個參考模型和基本概念框架,旨在規范數字資源長期保存的標準化流程,如今已被眾多數字資源的生產與傳播系統和組織所采用,為數字資源長期保存的實踐應用奠定了基礎。

國外數字資源長期保存項目包括澳大利亞的PANDARA項目(保護和存取澳大利亞網絡信息資源項目)、美國斯坦福大學的LOCKSS項目(多備份資源保存系統)以及美國的NDIIPP項目(國家數字信息基礎設施和保存計劃)等。

理論研究主要包括以下四個方面:一是基礎性研究,包括長期保存相關標準、規則、框架的制定與完善,體系建設研究等。二是元數據技術及相關應用,包括大量文獻研究元數據類型,元數據技術在數字資源長期保存中的應用等。三是生命周期及技術流程,主要研究長期保存生命周期的特征,以及實操中的相關技術流程。四是其他方面的研究,包括長期保存成本分析研究、知識產權及法律問題研究等。

我國對數字資源長期保存課題的研究開展于21世紀初,相關合作性實踐項目的開展也處于起步階段。近年來,相關研究內容已擴展到數字資源長期保存的策略及體系建設、風險管理、成本分析、法律問題等領域。同時,圖書館也開始參與國際合作項目,包括WICP項目(中國國家圖書館主持實施的數字資源長期保存項目)、Web Info Mall項目(中國Web信息博物館項目)以及中國記憶項目(國家圖書館主持開展)等。

2 數字資源長期保存的實施過程

2.1 采集方式

選擇性采集也就是傾向性專門領域采集,主要面向特定領域內具有豐富歷史價值、文化價值、科研價值、社會價值的珍貴信息,針對采集對象的選擇通常事先制定有相關的遴選標準或規范。選擇性采集是一種小而精的采集模式。

全面采集是利用網絡爬蟲技術在腳本中設置爬取周期和頻率,定向獲取指定網絡路徑下所有可獲得的數字資源,采集到的原始資源再通過后臺腳本進行自動分類和標引,分門別類地保存在存儲設備中,面向的對象可以是一個領域也可以是多個相關領域。全面采集是一種大而全的采集模式。

聯合采集方式是全面采集和選擇性采集的綜合利用,在采集方式上通常采用全面采集的模式,用網絡爬蟲收集原始資源,在數字對象選擇方面則采用選擇性采集模式中的標準與規范,在保證全面性的基礎上優先處理高價值資源。

呈繳制度是實施部門與數字資源生產者或所有者(出版商或個人)簽訂協議,數字資源以固定格式的呈繳本形式定期或不定期提交到相關機構,所涉版權問題應在協議中提及并保證履行。

國外典型的長期保存項目多數應用選擇性采集方式,其優勢是收集的數字資源質量有保障,體量較小,但也存在遴選標準的問題,容易出現遺漏珍貴資源的現象,因此,筆者建議我國項目選擇聯合式采集方式為宜。

2.2 采集對象

采集對象通常包括電子期刊、電子圖書、會議文集、數字化多媒體資源、源代碼、網頁、商業記錄、政府出版物、地理空間數據等,一些國家還特別關注本國本地區特色資源的采集。除常規類型采集對象外,一些專業項目往往采集特定方向和領域的數字資源對象,如:Pandora項目主要面向政府出版物、科研出版物、專題數據庫等,資源類型包括書籍、圖表、音視頻、地圖等數字資源。

2.3 保存內容

數字資源保存內容包括資源載體的保存與維護、資源內容的長期保存、元數據的保存與維護。

2.3.1 資源載體的保護和維護。數字資源的載體和內容是可分離的,載體媒介隨著技術的發展可能面臨淘汰或升級,同時,電子設備本身壽命較短,定期或不定期的數據遷移工作非常必要。數據遷移的原則是出現可替代的新技術媒介產品,同時可獲得相應的功能擴展,或原有媒介壽命到期、可靠性降低。

2.3.2 資源內容的長期保存。內容是數字資源的核心,是以特定數據格式存儲的電子文件,電子技術的迭代會經常性地產生更優設計、更高規格的新媒體格式,在必要的情況下應考慮數字內容的格式升級,在保證原始內容完整無損的前提下將數字資源無損升級到新格式是數字資源內容保存的一個重要手段。

2.3.3 元數據信息的保存與維護。元數據是關于數據的數據,是用來描述數字內容的重要信息資源,元數據可以引導使用者更好地檢索、甄別和閱讀數字內容,也有助于維護人員管理和分析相關資源。元數據的質量保證了數字內容的真實性、可靠性和可獲得性,是數字資源內容信息的重要補充,也可單獨作為原始數字資源應用于各類數據庫檢索、統計分析研究。因此,元數據信息是數字資源長期保存與利用的重要內容之一。

2.4 標準、工具與技術

數字資源長期保存的相關規范與標準隨著時代的發展和技術進步始終處于不斷的演進與更新狀態,當前需要重點關注的有以下標準與規范:一是PREMIS(保存元數據:實現策略標準)和METS(數字對象進行封裝的描述性、管理型和結構性元數據標準),一個用于定義元數據框架,一個用于進行數字對象封裝,二者的結合可以實現對元數據框架方案的架構。二是長期保存領域最重要的標準是OAIS,目前已發布了第三版更新草案,新版本將包含多項變更,如引入“保存目標”概念;保存描述信息PDI組件的指向有所變更;功能模型、透視圖截取等功能得到更新;提高存儲庫的可審核性等。三是在信息包規范與存儲標準方面。E-ARK的信息包通用規范CSIP與版本保存文件組織規范OCFL,CSIP定義符合OAIS標準信息包的邏輯結構和內容,OCFL描述了以易于保存的方式將數字對象布局映射到物理文件系統,以及如何識別管理此類對象所需的基本操作。OCFL可保證獨立于專門系統之外的原始數字文件的持久性,可用于數據災難恢復,重新構建數據存儲。

3 數字資源長期保存聯盟建設模式選型

聯盟建設是指通過分工協作的方式共建數字資源長期保存項目的模式,目前國內外已有的大型長期保存項目在資源采集、存儲方面通常存在兩種模式可供選擇,即集中式或分布式。常規的選擇是集中式采集或分布采集元數據收割、分布式存儲的模式,聯盟建設的組織及管理機制其實也面臨模式選擇的問題,在架構設計、運營模式等方面有多重選擇,大致可分為以下幾種:集中式建設模式、分布式建設模式,以及融二者特點于一體的混合式建設模式。

3.1 集中式建設模式

集中式建設模式是指長期保存聯盟建立的聯合體選擇金字塔式管理模式,聯盟中的核心成員機構負責建設和運營數據平臺及維護后臺倉儲,其他成員館遵循統一制定的元數據標準及數據開放獲取協議,使用平臺配套工具包分別采集分包之內的數字資源,并將數據上傳至中心數據庫,或者由中心數據庫定時收割原始數據及元數據。

3.2 分布式建設模式

分布式建設模式是指本身擁有或擬建長期保存平臺的機構間組成聯盟,遵循相同的數據交互標準及開放獲取協議,以資源共享為目的,鼓勵各成員館在各自平臺中分享聯盟中所有數字資源,或者在各自平臺之外再設計統一的聯盟檢索平臺,實現一站式檢索,方便各成員館用戶訪問。

3.3 混合式建設模式

顧名思義,混合式聯盟建設模式是集中式聯盟和分布式聯盟的結合體,試圖兼顧二者的優點,并使各自存在的問題得到相對完善的解決。混合式聯盟的構想是由一個或幾個技術力量雄厚、資金充足的大型機構組成核心成員,負責相關標準、規范、協議的制定和選擇,負責數據采集、收割流程的規劃,負責中心平臺設計與建設,負責中心元數據倉儲的建設,對之前沒有長期保存平臺和倉儲的成員機構按集中式聯盟管理的方法,按分發的任務和方向用統一的配套工具進行數字資源的采集和上傳工作;對之前已有平臺不想放棄自身特色的成員機構,則采用分布式聯盟的模式,通過專門的協議提供收割接口,允許中心元數據倉儲定期收割數據,數字資源的采集則依舊按自有平臺模式進行,對聯盟中心平臺具有完全的訪問權。混合式建設模式見下頁圖1。

圖1 混合式建設模式

混合式聯盟的管理組織架構可以設計得更加靈活,對需要聯盟更多技術指導、資金資助的成員機構,核心機構有義務提供更多服務,而對更注重自身特色的成員機構則允許其保留更大的自由度。事實上,對中心平臺來說,最重要的是各成員機構提交的元數據資源,在此前提下凡是有利于元數據順利收割的做法都是被允許的,凡是能導致元數據提交、收割困難的問題都需要成員機構間共同合作、鼎力幫助。

4 高校圖書館數據資源建設與長期保存

4.1 高校圖書館數據資源的主要來源

依據高校圖書館數字資源的不同引進途徑,館藏數字資源可以分為兩大部分:商業數據庫資源及自建數字資源。商業數據庫資源是當前高校圖書館的主要數字收藏,也是購置經費的主要投入方向,訂購數據庫的多少以及對學校主要專業的覆蓋情況是高校文獻資源保障評估的一個重要指標,也是學校師生特別是科研教師與研究生對學校資源的一個主要需求。商業數據庫資源由高校圖書館通過與數據商或代理商接洽商談、簽約購買。在購買方式方面,數據商通常提供數字資源使用權和購買數字資源所有權兩種購買方式,二者的購買價格相差很大,附加條款也不盡相同,大多數高校圖書館購買的是數據庫的使用權,在合同期內校內用戶可以獲得數據庫資源的正常瀏覽、下載權限,這就意味著一旦合同因故終止(如數據庫續訂價格漲幅過高、高校文獻購置費出現缺口),高校的用戶將完全失去對數據庫資源的訪問權限,前期若干年投入的資金無法獲得穩定的回報,這種現象成為我國高校圖書館資源建設過程中的極大隱患。

高校圖書館自建數字資源主要通過各種數字化轉換技術實現,涉及的主要技術包括掃描識別技術(OCR)、圖像無損壓縮存儲技術、網絡安全傳輸技術、數據庫存儲技術等。資源的類型主要包括以下三個方面:①本校學位論文資源。我國高校的畢業論文管理大多實行呈繳本制度,這也是教育部相關學位條例實施辦法的硬性要求。呈繳本制度的普及極大地方便了高校數字化學位論文資源長期保存系統的建立健全,也是各高校普遍實現的,完成度、延續度很高的資源長期保存項目。有條件的高校還會組織人力物力對這部分資源進行回溯建設,將早期以紙本形式保藏的歷史學位論文進行數字化轉換,再提交到管理系統中,從而形成了本校完整的數字化學位論文長期保存和檢索平臺。②數字科研信息資源。高校的科研信息資源主要指學校的科研產出成果,以及科研成果完成過程中形成的各種中間信息或階段性記錄。目前,多數高校積極開發或引進的機構知識庫系統就屬于數字科研信息長期保存系統的一種,機構知識庫系統通過Web爬取或呈繳本制度,收集本校研究者主要文獻類型的科研成果,如著作、期刊論文、會議論文、專利、國家省市各類課題等,采集的數據按預定的規范進行元素提取、轉換,生成元數據,原始數據保存至數據庫存儲中,后臺系統針對元數據提供各種檢索、統計、分析服務,有條件的高校也會對本校的科研信息資源進行回溯建設,基本方法與數字化學位論文的回溯相同。這是我國高校目前主流的針對科研信息資源數字化長期保存的方案,該方案還有很大的提升空間,除元數據挖掘及系統配套功能升級外,在文獻類型、資源內容上也有巨大的挖掘潛力,如對科研中間產出,包括實驗數據、階段總結報告、錯誤分析、仿真結果、模型數據,乃至項目來源信息、課題組概況信息、經費使用信息等,都可以作為數字資源的有機組成部分。③特色資源自建數據庫。特色文獻是很重要的收藏類型,我國地域廣大、歷史悠久,散布在全國各地的高校圖書館通常都會有自己的特藏資源,如善本古籍、珍稀地方史料、少數民族史料、藝術品、冷門技術資料、名人手稿、歷史影像圖片、珍稀圖譜/曲譜/膠片/地圖等,這些資源往往被當作所在圖書館的“鎮館之寶”,極富歷史價值、文化價值、藝術價值和研究價值。因此,針對這部分資源的長期保存項目的建設就非常有必要。

4.2 高校數字資源長期保存體系選擇的思考

我國高校圖書館的館藏電子資源主要以外購的商業數據庫資源為主,在購買方式上多數是購買數據庫的使用權,由于知識產權方面的制約,僅有使用權的商業資源是無法作為機構本地長期保存對象的,而可以作為長期保存對象的資源包括:買斷的電子書、訂購數據庫綁定的電子期刊,以及商業數據庫中的OA刊源(不穩定)。如果考慮建立長期存儲并揭示以上數字資源的機制,高校在解決方案的選型上應優先參考斯坦福大學的LOCKSS項目(多備份資源保存系統)。LOCKSS由美國國家自然基金組織贊助,斯坦福大學圖書館組織實施,是基于JAVA平臺的分布式開源系統,系統設計遵循OAIS規范,在通用功能外也提供可擴展功能及互操作訪問。LOCKSS與眾多出版社簽約,可直接收割多個出版社的數字資源,并面向用戶提供開放服務。LOCKSS聯盟是一個非營利的組織,在申請加入LOCKS聯盟后,圖書館可以很便捷地在LOCKS平臺上構建本館的數字資源板塊,在獲取相應權限和許可后通過網絡管理工具配置本館的LOCKSS存檔箱,將買斷電子書、綁定電子刊及OA刊等資源配置到存檔箱中,經過平臺的一些常規驗證,就可以完成這部分資源在LOCKSS平臺上的存儲和發布。

自建資源大致可以分為兩個部分:一是本機構的核心科研產出及教學成果,包括科技論文、專著、學位論文、專利、會議論文、課題報告、教學課件、電子講義,以及科研與教學過程產生的中間附帶成果,如實驗數據、階段性報告、CAD模型、源代碼資源等。二是特色資源,即收藏館特有的、獨有的珍貴資源。目前情況下,自建資源的數字化長期保存策略優先選擇利用各高校已有的知識機構庫平臺,同時也是為了規避相似項目重復建設的問題。我國高校數字資源長期保存項目建設的最優解、最理想的方案是未來建設高校聯盟模式的長期保存聯合體,而當前各高校知識機構庫的建設可以看作聯盟形成之前的基礎性建設,從知識機構庫到高校聯盟最重要的工作是在各自機構知識庫下本機構數字資源的完整采集以及元數據質量的穩定控制。

4.3 高校數字資源長期保存聯盟模式選擇設想

當前形勢下,高校圖書館以聯盟模式開展數字資源長期保存項目建設無疑是最佳選擇,聯盟模式下的項目建設可以統一標準規范,綜合技術優勢,規范管理流程,減少成本支出,同時也是高校資源共享建設的核心需要。改革開放以來,在科技興國的方針指引下,我國高等教育事業進入了突飛猛進的發展階段,高校圖書館的文獻購置費也在不斷增多,商業文獻數據庫資源迅速成為高校科研教師的主要參考資源,但必須關注的是,高校的發展并沒有形成合力,資源的重復訂購、項目的重復建設、科技攻關的各自為政,都造成了極大的資源浪費現象,圖書館領域也是這樣。因此,數字資源長期保存項目的協同開展給我國高校圖書館提供了一個合作發展的契機,有利于科研資源的有效整合,有利于先進技術方案的普及應用,有利于科研資源的合理分配。

在聯盟模式選擇方面,聯盟式高校數字資源長期保存項目在選型方面應首選混合模式,主要原因是高校發展水平并不均衡,“雙一流”高校、京津地區高校、東南沿海發達地區高校占有更多的教育資源,而普通高校、內陸偏遠地區高校即使有相當的技術實力和豐富的特色資源,在獨立開展資源保存項目時很難獲得持續的經費支持或基金贊助。混合式聯盟開展模式可以有效解決這個問題,發達地區高校更多地承擔平臺運營支出,內陸地區高校專注提供資源,這符合國家的基本發展戰略,也符合我國高等教育的發展規律。

在資源平臺建設方面,各高校應充分考慮類似項目的已有基礎,避免資源浪費。近年來,各校普遍建設的機構知識庫系統是一個不錯的基礎,盡管現有機構知識庫平臺可能存在諸如元數據格式不標準、存儲方式落后、采集方式簡陋、平臺技術含量低、功能欠缺、開放性差等問題,但數字資源本身及元數據才是最重要的,各高校累積處理和存儲的海量數據資源將成為高校聯盟項目最寶貴的基礎性資源。

在組織管理架構方面,與資源平臺建設方面的考量一樣,從成本分析、實現難易等角度出發,全新創建一個聯盟不如以原有類似聯盟為基礎,修訂聯盟宗旨、擴充服務功能、拓展覆蓋范圍,綜合來看DRAA聯盟就是最佳的選擇。DRAA聯盟是以高校圖書館為核心成員的數字資源集團采購組織,以DRAA聯盟為基礎建設我國高校科研數據長期保存合作性組織具有較高的可行性和可持續性。

5 結語與思考

以DRAA采購聯盟為基礎構建的數字保存聯盟采用混合模式的聯盟策略,具有兼顧集中統籌與自愿協議式管理的優勢,管理與組織形式相對靈活。規模不一、能力各異的成員可以根據自身稟賦自由選擇適合自身的建設模式,可以更貼切地滿足其內部數字資源管理與利用需求,也能在更大范圍內與外部聯盟成員間實現資源共享及技術分享,在充分尊重各成員自主性的基礎上,通力協作,共享技術,分擔成本,實現數據的分工協作、分布保存,為各高校數字資源長期保存打下堅定的基礎。

隨著大數據時代的來臨,信息技術的進步和新興理念的出現,為數字資源長期保存課題提供了更多的思路、選擇和技術手段。近年來,國內外的學術理論研究和實踐探索也逐漸走向成熟和穩定,出現了眾多的理論分支、解決方案、平臺工具和實踐項目,但也必須看到,數字資源長期保存策略的具體實施及保存體系的建立健全受多方面因素的制約和影響,如技術因素、經濟因素、法律因素等。資源長期保存課題面臨的發展前景是復雜的,面臨的挑戰也是巨大的,我國文獻收藏機構,特別是高校圖書館應肩負起自己的責任,從現狀研究和需求分析入手,全面洞悉長期保存課題的發展脈絡,遵循我國科研與社會發展的實際情況,利用已有的有效平臺基礎,采用成熟的理念、全新的技術,建立健全長期保存制度,建設完善的長期保存機制,為廣大科研人員構建高水平的學術交流與分享平臺,為國家科技興國方略夯實數據基礎。

猜你喜歡
數據庫圖書館資源
基礎教育資源展示
一樣的資源,不一樣的收獲
資源回收
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
數據庫
財經(2017年2期)2017-03-10 14:35:35
飛躍圖書館
數據庫
財經(2016年15期)2016-06-03 07:38:02
數據庫
財經(2016年3期)2016-03-07 07:44:46
數據庫
財經(2016年6期)2016-02-24 07:41:51
主站蜘蛛池模板: 久久精品波多野结衣| 狠狠色噜噜狠狠狠狠奇米777| 黄色污网站在线观看| 国产在线八区| 中文字幕一区二区人妻电影| 国产成人亚洲日韩欧美电影| 国产真实二区一区在线亚洲| 精品无码国产自产野外拍在线| 久久久久夜色精品波多野结衣| 91精品视频播放| 欧美国产日韩一区二区三区精品影视 | 黄色网在线免费观看| 欧美亚洲国产日韩电影在线| 人妻21p大胆| 国产成人凹凸视频在线| 国产精欧美一区二区三区| 欧美日韩国产成人在线观看| 国产亚洲成AⅤ人片在线观看| 四虎国产精品永久一区| 中国特黄美女一级视频| 久久精品亚洲专区| 国产精品不卡片视频免费观看| 欧美在线天堂| 久久综合色视频| 又大又硬又爽免费视频| 热久久这里是精品6免费观看| 久热99这里只有精品视频6| 精品一区二区三区水蜜桃| 亚洲国产看片基地久久1024| 欧美色图第一页| 国产精品短篇二区| 人妻精品全国免费视频| 国产成人精品视频一区二区电影| 日韩精品资源| 激情综合激情| 99精品这里只有精品高清视频| 97se亚洲综合在线韩国专区福利| 亚洲成A人V欧美综合| 国产欧美综合在线观看第七页| 精品一区二区三区自慰喷水| 亚洲天堂久久| 精品欧美日韩国产日漫一区不卡| 久久国产精品麻豆系列| 国产午夜精品一区二区三| 亚洲人成在线免费观看| 97亚洲色综久久精品| 欧美黄色网站在线看| 亚洲人成日本在线观看| 国产精品综合久久久| 国产精品一区二区不卡的视频| 国产精品深爱在线| 欧美一区二区啪啪| 国产精鲁鲁网在线视频| 99人妻碰碰碰久久久久禁片| 免费jizz在线播放| 97国产在线观看| 一级毛片在线免费视频| 日本精品影院| 国产免费人成视频网| 一级片免费网站| 成人午夜精品一级毛片| 999在线免费视频| 看你懂的巨臀中文字幕一区二区| 四虎亚洲国产成人久久精品| 蜜桃臀无码内射一区二区三区| 在线a视频免费观看| 国产精品自在在线午夜| 日本尹人综合香蕉在线观看| 中文字幕66页| 亚洲精品无码成人片在线观看| 国产欧美视频在线| 九九这里只有精品视频| 在线欧美a| 又黄又湿又爽的视频| 亚洲精品视频网| 日本高清成本人视频一区| 青草精品视频| 国产99精品视频| 久久亚洲日本不卡一区二区| 国产女人在线观看| 亚洲综合中文字幕国产精品欧美 | 中文无码伦av中文字幕|