特色數據庫建設是公共圖書館發展的重要方向,是提升圖書館信息資源利用率和服務水平的有效途徑,其目的是為了解決圖書館特色館藏收藏與利用的矛盾,在展示本館及本地特色的同時,更好地滿足讀者閱讀需求,提供更加精準、便捷、高效、個性化的服務?,F探討了公共圖書館特色數據庫建設的意義、實踐探索、關鍵技術、研究方法及未來建設思考等內容,并以太原市圖書館《太原日報》老報紙資源庫建設為例,提出數據庫建設實踐思路與構想,以供參考。
公共圖書館作為城市文化建設的重要組成部分,承擔著普及知識、促進文化交流的重要職責,并在地方文化建設中扮演著重要角色。隨著信息技術的快速發展,公共圖書館在服務理念、服務方式、服務內容上不斷創新和改進。公共圖書館特色數據庫的建設可以更好地服務于地方文化傳承、普及和推廣工作,增強公共圖書館在地方文化建設中的地位和作用。
公共圖書館特色數據庫建設意義
保護紙質珍貴館藏,提高館藏資源的利用率
通過將紙質資源數字化處理,圖書館可以將珍貴館藏文獻轉化為數字資源,避免因頻繁借閱或保存不當而造成的損壞,從而起到保護紙質珍貴館藏的作用。同時,特色數據庫的建設,可以將分散、零星的館藏資源進行整合、梳理和提煉,形成具有系統性和連續性的資源體系,通過互聯網進行傳播和利用,提高了資源的利用率,也為更多讀者提供了獲取珍貴館藏的機會。
拓展文獻服務領域,實現數字化轉型
在數字化時代,圖書館需要不斷探索和創新,實現數字化轉型和高質量發展。特色數據庫建設是圖書館數字化轉型的重要內容之一,通過建設特色數據庫,可以突出本地化特色,提升圖書館的信息服務能力和水平,為讀者提供更加高效、便捷的信息服務。
提供個性化服務
圖書館可以根據讀者的需求和興趣,為其定制專題資源,提供有針對性的信息服務。并利用大數據技術,分析讀者的閱讀行為、借閱記錄等信息,形成用戶畫像,以便為其推薦相關領域的最新研究成果、學術動態等,幫助讀者更好地了解該領域的發展狀況和趨勢。圖書館可以建立專業的咨詢服務隊伍,并利用AI大語言模型技術,為讀者提供個性化的咨詢服務,幫助讀者解決在利用特色數據庫過程中遇到的問題和困難。
促進學術交流與合作
特色數據庫可以展示本地區歷史人文、經濟發展、社會變遷、民風民俗和科技動態等多樣性知識,為相關領域的學者和研究人員提供科研、交流與合作的平臺。通過特色數據庫的建設,可以促進學術交流與合作,推動該領域的發展和進步。
提升圖書館的社會影響力
特色數據庫是圖書館對外展示自身優勢和特色的重要窗口,通過不斷地推廣使用,可以提高圖書館的社會知名度和影響力。同時,特色數據庫可以吸引更多的用戶關注和利用圖書館,提高圖書館的借閱量和用戶滿意度。
公共圖書館特色數據庫建設方法與實踐
資源收集突出特色
公共圖書館要注重地方文獻工作,這不僅是其自身發展的重要任務,也是完善整個公共文化服務體系的重要環節。圖書館要進行充分調研和分析,了解本地特色,收集具有鮮明地方特色的文獻資源,包括地方史志、地方年鑒、地方文獻匯編、地方報刊等。對于圖書館來說,特色文獻資源建設是針對讀者需求,以某一學科專題人物或某一個歷史時期為研究對象,將文獻信息資源進行收集整理、存儲、分析、評價,是一個整體的過程。同時,要按照一定的標準規范進行組織管理,使其成為本圖書館獨有或其他圖書館少有的資源庫。每一個地域、每一個圖書館都應該有自己的特色,只有具有特色才能夠產生區別。因此,我們更應該把特色作為公共圖書館發展、建設、壯大的重要抓手和內容。
太原市圖書館自成立之始就將《太原日報》的收集、整理和利用作為報刊收藏的重點工作,并持續開展。目前,太原市圖書館收藏有《太原日報》1951年9月1日試刊至今的報紙,是全國收藏《太原日報》紙質版最全的單位?!短請蟆分覍嵱涗浟颂臍v史變遷、文化發展、生產實踐等綜合性知識,是反映太原地區政治、經濟、文化、社會發展、風土民情及自然風貌等的重要地方報紙,具有很高的保存及研究價值,是太原市圖書館的珍貴特色館藏。
文獻數字化處理
根據特色文獻資源的類型和重要性,制訂合適的數字化策略,選擇適合的掃描設備和OCR識別軟件,確保數字化處理的質量和效率。對特色文獻資源進行掃描、OCR識別、數據清洗等,將紙質資源轉化為數字資源。按照一定的分類標準,對特色文獻資源進行整理和分類,便于后續管理和使用。將數字化后的資源存儲在安全的數據庫中,并建立相應的管理機制,確保資源的可用性和安全性。對數字化處理的過程進行質量控制,確保數字資源的準確性和完整性。在數字化處理完成后,根據使用反饋和數據分析結果,不斷優化數字化策略和方法,提高數字資源的品質和可用性。
老舊報紙數字化,即通過數字出版技術把紙質報紙的內容進行掃描、文字識別以及插入音視頻或動畫進行版面重構等一系列步驟,轉換成可以被電腦、手機、平板等多終端使用的格式,通過互聯網展現的一種基于PDF版面的多媒體數字報。由于《太原日報》早期的報紙紙質脆化,20世紀50年代的老報紙在移動及翻閱過程中已經出現受損掉渣的情況。近年來,讀者對老報紙的查閱需求在不斷提升,圖書館亟待解決老舊文獻的保存和利用之間的矛盾。因此,對紙質版文獻修復和數字化處理提上了圖書館的工作日程,這樣既保護了珍貴館藏,又解決了頻繁利用的問題。太原市圖書館于2019年起對《太原日報》老報紙開展了全文數字化加工,建設項目采用與山西同方知網數字出版技術有限公司合作的形式開展。對老舊裝訂報紙采用邊修復邊掃描加工的方式進行。圖像掃描采用大幅面非接觸式掃描儀及數碼相機完成,圖像分辨率設置不低于300pdi,在確保紙質文獻不受損壞的前提下,保證采集圖像的清晰度。采集后的圖像經過糾偏、去噪、裁切等處理,形成可用的對象數據。采用OCR識別軟件對圖像進行版面分析、全文識別,并進行人工校改,形成雙層PDF文件。全文數據經過篇名、作者、關鍵詞、出版日期、版次等字段的標引,形成元數據。
建立數據庫展示平臺
根據地方特色建立相應的數據庫,采用適合的數據庫管理系統,如SQL Server、MySQL、Oracle等。建立方便用戶檢索的檢索系統,包括網頁端和移動端檢索系統,提供便捷的檢索方式和搜索結果展示。
太原市圖書館建設的“《太原日報》老報紙展示平臺”底層使用中國知網提供的TPI信息資源建設與管理平臺。展示平臺可實現報紙的原貌閱讀、關鍵詞檢索、全文檢索、組配檢索、繁簡對照、放大縮小等功能。平臺同步設計了PC版、手機微信版及觸摸屏版展示界面,以滿足讀者不同場合的查閱需求,形成通過互聯網展現的一種基于PDF版面的多媒體數字報?!短請蟆诽厣Y源庫的建設對保護太原市圖書館珍貴館藏文獻,加快紙質資源數字化改造與使用,突破圖書館館舍的限制,結合公共數字文化建設實現資源共享,拓寬延伸服務領域,滿足讀者多元化需求具有重大意義。
數據評估、更新維護
特色數據庫建設需要定期評估其建設效果、收集用戶反饋,以便不斷優化和完善數據庫。并且,需要建立完善的更新維護機制,及時更新數據庫內容,確保資源的準確性、完整性和實用性。
《太原日報》老報紙數據庫一期建設完成后,太原市圖書館對已建資源內容及平臺功能先由館員進行審核把關,通過網絡和在圖書館現場收集讀者的反饋意見,了解數據的使用情況和潛在問題,根據反饋進行必要的數據調整和功能改進。對于暫未加工資源,積極籌措資金、規劃建設,以推動數據庫的不斷完善。
推廣宣傳
通過多種渠道進行推廣宣傳,如通過圖書館官方網站,微信、微博等社交媒體等,提高地方特色數據庫的知名度和利用率。
太原市圖書館在官網及官微的顯眼位置,設置自建特色數據庫的入口,并在微信或者網站的首頁進行推廣。同時,發布關于特色數據庫的使用方法和最新更新內容,吸引讀者的關注,幫助讀者快速上手。
注重知識產權
圖書館在收集和處理特色資源時,應注意遵守相關法律法規和知識產權規定,避免侵權行為。
《太原日報》老報紙數據庫選取已進入公有領域的文獻開展建設階段。在進行數字化加工時,為尊重原作者的著作權,不會對文獻進行修改、刪節,并保證所采集數據的質量,包括圖像、文字、格式等,以確保資源的可用性和準確性。
未來公共圖書館特色數據庫建設構想
隨著信息技術和互聯網的不斷發展,以及大數據、人工智能、云計算等數字化技術的不斷涌現和應用,人類社會逐漸進入了智能化、數字化的時代。圖書館特色數據庫建設也需要運用相關技術,逐步建設細顆粒度知識資源,為讀者提供更為智能、便捷的智慧圖書館知識服務。
國家圖書館于2021年出臺了《智慧圖書館知識資源數據建設指南》,為全國各級圖書館開展智慧圖書館知識資源建設提供了可行的參考依據。該指南旨在指導各級圖書館在智慧圖書館知識資源建設過程中,如何科學合理地規劃、組織、整合、保護和利用知識資源,提高知識資源的利用效率和服務水平。它涵蓋了知識資源的分類、采集、加工、存儲、傳輸、共享和安全等方面,提供了具體的技術和方法建議,幫助圖書館更好地實現知識資源的數字化、網絡化和智能化。
資源的細顆粒度建設
數字圖書館時代,公共圖書館已建設積累了圖書、期刊、報紙、古籍、音視頻等多種類型的基礎數字資源。資源的細顆粒度建設就是在基礎數字資源上,開展知識資源精細化標引及關鍵知識點的標簽和標引。對基礎資源的著錄,一般以文獻“種”為著錄粒度;而細粒度文獻著錄,則一般以篇章(包括封面、封底、目錄等)、片段作為著錄粒度。資源的細顆粒度建設即更為精細化的資源著錄,對圖書、期刊、報紙、古籍、音視頻等基礎數字資源,進行片段化、章節化標引,以形成基于文獻片段內容的語料庫。
文獻關鍵知識內容抽取是指充分利用自動化手段分析文獻內容,建立知識抽取模型,確定知識抽取方法,從文獻中抽取人物、機構、事件、地理名稱,以及其他具有標目意義的專題、實物等內容,開展知識標引工作,以形成基于文獻知識內容的語料庫。
知識組織與知識服務
通過對文獻基礎數字資源開展細顆粒度內容標識、關鍵知識點的標簽和標引建設,可以實現資源精細化揭示的知識組織和知識管理。通過關聯數據形成專題化的知識圖譜,可以將文獻中分散的知識點連接起來,形成一個完整的知識體系。知識圖譜本質上是語義網絡,表示現實世界中存在的實體、概念及其相互關系,是一種基于圖的數據結構。知識圖譜的出現改變了傳統的知識獲取模式,將知識工程由“自上而下”的方式轉變為挖掘數據、抽取知識的“自下而上”方式。這樣的知識圖譜使得用戶的閱讀不僅僅停留在文獻本身,而是能夠充分挖掘文獻中的知識點,并展示各知識點之間的關聯,還能揭示知識的層次結構和演變過程,從而為用戶提供更為全面、直觀、深入的知識服務。
新型數字資源建設
本文的新型數字資源建設是指充分利用多種數字創意技術,如VR(虛擬現實)、AR(增強現實)等技術,打造的全新數字資源。這種新型數字資源閱讀內容不再局限于平面的文字和圖片,而是在三維立體空間中形象地還原原始紙質文獻的初始風貌,通過數字技術進行故事化的解讀,賦予了原始文獻新的生命,為讀者提供虛擬化、交互式、立體化和沉浸式的多維度閱讀體驗。通過視覺、聽覺、觸覺三維立體的共同感覺,讓讀者與虛實場景深度融合,使讀者身臨其境,從而能更深入地理解原始文獻,了解文獻背后的故事,感受其中蘊含的文化和歷史價值。
公共圖書館特色數據庫建設是提升圖書館信息資源利用率和服務水平的有效途徑。公共圖書館特色數據庫建設應注重以下幾方面。首先,要結合《全國智慧圖書館體系建設方案》,并根據本館的實際情況,確定特色數據庫的建設方向和內容,保證其與圖書館的定位和服務需求相匹配;其次,要運用好現代數字信息技術,構建實用性強、使用便捷、訪問高效智慧的資源體系;再次,加強數據庫的更新和維護工作,確保數據庫的內容充實和準確;最后,要提升用戶體驗,搭建友好易用的數據庫使用界面,幫助用戶快速準確地獲取所需信息。在實踐中,公共圖書館要注重與相關機構、學術界的合作,共同推動特色數據庫建設的深入發展。同時,要不斷加強人才隊伍建設,培養專業的數據庫管理人員,提升公共圖書館信息服務的專業化水平。
總的來說,公共圖書館特色數據庫建設實踐是一個復雜而系統的工程,需要各方的共同努力和現代信息技術的支持,只有這樣,公共圖書館才能更好地發揮其在文化建設中的作用,為社會大眾提供更加優質的服務。
(作者單位:太原市圖書館)