關鍵詞:圖書館;數字化資源;生命周期;連接方式
摘要:文章介紹了圖書館數字化資源的利用優勢,分析了圖書館數字化資源的生命周期,提出了圖書館基于數字化生命周期進行館藏資源建設的策略,探討了館藏數字化資源的常用連接方式。
中圖分類號:G250文獻標識碼:A文章編號:1003-1588(2018)10-0084-03
互聯網時代,隨著圖書館數字化資源的迅速增多,人們對數字化資源的利用率也在不斷提高。對信息資源進行數字化處理,就是將紙質資源轉化為計算機可以識別的信息,方便圖書館對經過轉換的信息進行數字化存取、傳輸與管理。圖書館在采集、創建與管理數字化資源的過程中,應該認識到信息資源是不斷更新的,且具有特定的數字化生命周期。在不同的生命周期階段,數字化資源具有不同的應用價值,因此圖書館應該采用不同的管理方式。數字化資源處于動態變化中,在創建的初始階段,用戶出于對新生事物的好奇,其使用頻率相對較高。而隨著時間的推移,這些館藏數字化資源的利用率會隨之下降,數字化資源的利用價值也會隨之降低[1]。如何促進數字化資源的持續保存與利用,保障用戶知識需求的有序轉化,提供更加便于用戶利用的信息資源,是圖書情報界研究的熱點問題。基于數字化生命周期的信息資源建設,圖書館要根據數字化資源所處的不同階段,采取相應的管理與服務策略,借助信息管理軟硬件設施,滿足用戶對館藏數字化資源進行連接、共享、保護等方面的需求,提高館藏數字化資源在不同生命階段的利用率。
1圖書館數字化資源的利用優勢
1.1館藏數字化資源的界定
數字化資源是指借助先進的信息技術,將信息資源轉化為計算機可以識別的數字化形式,并通過遠程服務器進行高速傳輸,供用戶隨時隨地利用智能檢索技術獲取的資源。2007年修訂的《高等學校圖書館數字資源計量指南》將數字化資源定義為圖書館引入或自建的,擁有磁、光介質或網絡使用權的數字形態的文獻資源。數字化資源的采集、加工與處理是一個復雜、系統的工程,圖書館需要將分散于不同位置、不同載體的信息資源,統一轉變為數字化形式,并通過網絡連接為用戶提供服務。目前,數字化資源可分為電子圖書、電子期刊、二次文獻數據庫及其他數據庫等四種類型。
1.2數字化資源的特點
隨著數字化技術的廣泛應用,圖書館的數字化資源迅速增多,存儲容量日益擴大,數字化資源成為信息建設的重點。由于數字化資源的檢索便捷,用戶能移動訪問與閱讀,因此其需求量不斷增加。數字化資源分布廣泛,存儲路徑多樣,類型豐富,包括音頻、視頻及各種類型的數據庫等[2]。它具有較高的存儲密度,占用的存儲空間較小,且更新的速度較快,便于圖書館進行長期存儲與動態管理。圖書館可以將其存儲于本館服務器中,也可借助云計算技術將其存儲于在線虛擬空間,方便用戶獲取與利用。
1.3數字化資源的利用優勢
圖書館加強數字化資源建設,目的在于最大限度地發揮其利用價值。與傳統館藏資源相比,數字化資源具有使用便捷、檢索途徑多樣、方便隨時獲取、使用方法靈活及查準率高等特點。數字化資源的存儲時間長、存儲空間小、維護成本低及利用率高[3],同時數字化資源的不斷更新也有利于豐富館藏,優化館藏結構,進而滿足用戶的信息需求。數字化資源便于傳輸的特點決定了其具有共享性,能夠促進不同機構間的信息共享,簡化信息組織流程,提高信息反饋速度,實現更大范圍內的信息共建共享。數字化資源便于圖書館進行智能化管理,能減輕館員的工作量,促進圖書館的現代化建設進程。
2圖書館數字化資源的生命周期分析
生命周期是數字化信息運行的自然規律,與信息需求有關,分為生產、采集、組織、存儲、維護和利用等階段。各個階段緊密相連,層層推進,在一個生命周期中按順序展開。
2.1生產與采集
在生產與采集階段,圖書館要確定信息資源的內容和范圍,選擇合適的軟硬件設備,為后續對數字化資源的篩選和利用提供便利[4]。由于數字化信息資源來源多樣,載體各異,包括電子圖書、視頻及數據庫等,圖書館應根據館藏建設規劃,不僅要對各類館藏資源進行數字化,還要對既有的數字化資源進行格式轉換。圖書館也要通過采集外部數字化資源的方式,不斷優化館藏結構,一方面可以利用網絡爬蟲等技術,有針對性地采集互聯網中的開放信息資源;另一方面可與數字資源供應商合作,購買或免費獲取使用權,將數字化資源納入其數據庫。不同圖書館還可以通過共享數字化資源的方式,共同探討知識產權的保護問題,擴大數字化資源的傳播范圍。
張穎:圖書館館藏資源的數字化生命周期及連接方式研究2.2組織與存儲
在組織與存儲階段,圖書館應對已有的數字化資源進行整合處理,為用戶獲取信息資源提供便利。圖書館需要按照一定的標準和使用規則,對數字化資源進行分類,將相同的資源存儲于相同的子系統中[5]。對于引入本體的數字化資源,圖書館需要進行編目與標引,通過創建元數據的方式,提高用戶的檢索效率。數字化資源規模大,種類繁多,圖書館有必要設計合理的存儲系統,方便不同類型資源的存儲與利用。同時,圖書館也需要考慮資源的存儲形式等問題,即對不同的數字化資源采用不同的存儲載體,并根據用戶的使用要求,確定存儲方式。
2.3維護與利用
圖書館要想實現長期保存數字化資源的目的,就需要做好維護工作。在維護與利用階段,圖書館需要應用各類信息資源管理技術,如射頻識別、大數據技術等,對各類資源進行高效清點、統計及分析,設定不同資源的管理指標,方便系統進行自動化管理。數字化資源易于變化,圖書館需要關注信息安全問題,引入適合的安全防護技術,及時清理殘缺、陳舊的資源,保障數字化資源的傳輸、利用安全。共享是利用的前提,沒有共享就無法最大限度地發揮資源價值[6]。因此,圖書館可秉持跨界融合的理念,與政府、企業和其他信息機構合作,形成寬渠道、多領域的資源共享網絡。
3圖書館基于數字化生命周期的館藏資源建設
信息資源建設是一個循環往復的過程,在不同階段涉及不同的內容,每個環節都需要進行周密思考,保障整個流程的無縫銜接。圖書館基于數字化生命周期理論,可利用先進技術對數字化資源進行集約化建設,構建數字化資源建設技術框架(見圖1),消除“信息孤島”,促進信息資源的交流融合,實現數字化資源的共建共享。
3.1采集處理層
圖書館應引入射頻識別技術和傳感器技術,對數字化資源進行集約化采集與加工,依托元數據實現格式統一。在數據采集階段,圖書館需要利用大數據技術對數字化資源進行綜合處理,了解不同類型數據的屬性與特點,確定與其相對應的元數據建設標準。圖書館也應按照元數據提取、映射規則,對采集的數字化資源進行元數據描述和語義標注,在保留不同資源共性的基礎上,展現不同數字化資源的特色,促進不同數據之間的轉換。同時,圖書館也應將數字化資源轉化為機器可識別的格式,構建館藏數字化資源核心數據集,并利用過濾、分析設備抽取核心數據。此外,圖書館還應借助數字化資源標識技術,對不同類型的資源進行標識,通過語義關聯揭示不同資源之間的內在聯系。
3.2存儲管理層
由于每個機構的存儲系統相對獨立,如果圖書館采用傳統的手段與技術對數字化資源進行存儲管理,就會導致資源浪費,增加工作人員的工作量,因而無法實現資源的共建共享。因此,圖書館可以聯合其他信息機構,利用統一認證、數據備份和云存儲等技術,設計能夠兼容多個存儲系統的中心存儲器,滿足分布式數字化資源的長期存儲需求,提升整體存儲能力,促進館藏數字化資源的靈活存儲與可持續利用。圖書館也可依托Hadoop數據庫架構實現分布式存儲,設置多個存儲設備與云存儲空間,在緩解存儲壓力的同時,提高數字化資源的存儲效率和可拓展性[7]。此外,圖書館還可利用災難備份技術,對不同模塊的數據資源進行備份處理,實現異構資源的及時備份,在系統發生故障時,圖書館依然能夠保障服務的連續性。
3.3展示反饋層
對于經過集約化處理的數字化資源,圖書館可以在公共信息網絡上建立專用數據通道,依托集群式檢索技術,實現高效的數據信息傳輸,并通過不同的媒介形態,將館藏數字化資源以圖文并茂的形式展示給用戶。同時,圖書館也需要對各項業務進行合理調度,收集終端用戶的交互反饋信息,并根據反饋信息調整與完善服務內容[8]。圖書館要想提高數字化資源的建設與服務質量,就需要利用移動信息技術,實現對數字化生命周期不同階段的質量控制,實現數字化資源管理的規范化。為了降低數字化資源建設成本,圖書館需要將更多精力放在質量控制上,以規范化的操作方式避免資源浪費,提高各種資源的利用率。例如,對于部分使用率低,而相對重要的數據資源,圖書館可采用常規設備進行存儲管理;對于實際應用價值、使用頻率高的數據資源,圖書館則可采用運行速度快、價格高的設備進行存儲管理。
4圖書館館藏數字化資源的常用連接方式研究
圖書館不僅要做好基于生命周期的數字化資源建設工作,還要利用先進技術實現多種途徑的館藏數字化資源鏈接,為用戶提供更多的信息獲取途徑,促進信息的廣泛共享。
4.1建立統一的檢索平臺
不同的信息機構都有相對獨立的文獻數據庫,且具備獨立的文獻展示、控制與揭示等功能。但從整體上看,分散孤立的狀態不利于有效發揮數據庫的應用價值,容易導致數據檢索的缺失或局限。即使用戶有明確的檢索目標,在單一的數據庫中也無法保障檢索結果的完整性。因此,圖書館在加強數字化資源建設的基礎上,可以聯合其他機構建立統一檢索平臺,以實現館藏數字化資源的一站式檢索,為用戶獲取信息提供便利。例如,清華大學圖書館通過對多個機構數據庫進行整合的方式,涵蓋了本館館藏資源、超星圖書館、中國知網、維普中文期刊等數據庫,方便用戶利用統一檢索平臺進行跨庫檢索。該方式不僅優化了館藏資源的結構,還為用戶構建了更加便捷的檢索環境,擴大了數據整合的范圍,消除了數據檢索、傳輸速度等方面的障礙。
4.2生成超文本鏈接
所謂超文本鏈接,就是在互聯網頁面上形成的、方便用戶從當前頁面跳轉至指定地址的另一個頁面的技術。圖書館在完成數字化資源建設后,可以將不同類型的數字化資源收錄進專門的存儲文本中,并利用先進的技術對這些文本進行提取操作,從中抽取作者、出版社等重要信息,以及章節、摘要等結構化信息。圖書館應將這些從原有文本中抽離出來的信息,存儲于另一個單獨的文本文件中,方便用戶進行結構化查詢。圖書館也可利用自動分類器對所有文本文件進行分類,賦予它們對應的分類號,并依據分類號將它們依次錄入后臺并行的數據庫。在用戶進行文獻檢索時,系統會根據檢索要求將分析結果傳輸至后臺數據庫,自動建立與參考文獻條目相關的超鏈接,進而提高用戶的檢索效率。
4.3基于HTTP協議的數據鏈接
由于數字化資源的文獻類型、存儲格式存在較大差異,為了提高館藏數字化資源的利用率,為用戶提供便捷、操作性強的檢索方式,圖書館可以借助文獻編目中的特定字段標記法,對數字化資源進行科學分類,揭示不同資源之間的內在聯系,并利用HTTP協議(HyperText Transfer Protocol,超文本傳輸協議)進行鏈接。用戶在檢索特定文獻時,可以直接閱讀對應的電子版。由于相同的文獻可能被多個出版社或多個數據庫收錄,圖書館可以設置多個數據鏈接,將所有相關內容有機結合起來,最大限度地提高信息資源的查全率。
5結語
圖書館應基于數字化生命周期,對館藏數字化資源進行科學規劃與管理,在不同階段進行分層、分級保護與服務,最大限度地提高館藏數字化資源的利用率。互聯網環境下,先進技術的應用為圖書館數字化資源建設注入了活力,為基于數字化生命周期的館藏資源建設提供了新的機遇。
參考文獻:
[1]嚴軒.重慶市公共圖書館館藏資源數字化及利用情況研究[J].圖書館研究與工作,2017(2):44-47.
[2]劉香蘭.基于生命周期的跨機構文化資源數字化建設[J].圖書館,2016(4):62-65.
[3]劉永剛.數字化時代下對高校圖書館整合院系圖書資源的思考[J].內蒙古師范大學學報(哲學社會科學版),2015(1):146-148.
[4]史艷芬,劉玉紅.基于科學數據管理生命周期的高校圖書館服務角色定位研究[J].新世紀圖書館,2016(4):35-39.
[5]尹文武.信息生命周期理論下的移動圖書館信息服務質量控制[J].圖書館理論與實踐,
2017(4):91-93.
[6]薛晶晶,焦坤,張欣,等.國外大學圖書館基于科研生命周期的科研支持服務研究[J].情報理論與實踐,2016(5):110-114.
[7]周淑云,伍丹.基于信息生命周期的高校圖書館數據監護流程分析[J].山東圖書館學刊,
2016(3):26-29.
[8]孫仙閣.基于數據生命周期理論的學術圖書館科研數據管理模型研究[J].圖書館學刊,
2016(12):4-7.
(編校:孫新梅)第38卷第10期河南圖書館學刊2018年10月
收稿日期:2018-09-13
作者簡介:張亮(1979—),鐵嶺市圖書館副研究館員。