


摘 要 為了充分參與關聯開放數據環境,美國國會圖書館研制并于2012發布了BIBFRAME模型,在以關聯數據技術為基礎的更廣泛的網絡背景下,提供一個從MARC格式過渡的路徑。BIBFRAME模型自從發布以來,在圖書館社區得到積極的響應和廣泛的實踐,到目前為止已進入到RDF數據生產、與MARC數據轉換、BIBFRAME編輯工具開發、圖書館系統開發支持的應用階段。論文基于BIBFRAME模型的應用實踐,分析圖書館如何管理書目關聯數據,如何重構工作流程,如何交換重用編目數據,如何實現基于實體的資源發現,以便為我國圖書館書目向關聯數據轉變提供參考借鑒。
關鍵詞 BIBFRAME;文獻編目;關聯數據;元數據管理
分類號 G254.3
DOI 10.16810/j.cnki.1672-514X.2025.01.012
Linked Bibliographic Data Management Based on BIBFRAME in Libraries
Yan Yana, Li Yanru, Ma Xiaoya
Abstract To actively engage in the linked open data environment, the Library of Congress in the United States developed and released the BIBFRAME model in 2012. This model provides a transition path from the MARC format within a broader network context based on linked data technology. Since its release, the BIBFRAME model has received positive responses and extensive practice within the library community. It has progressed to applications such as RDF data production, MARC data conversion, BIBFRAME editing tool development, and support for library system development. This study examines the practical applications of the BIBFRAME model, analysing how libraries manage bibliographic linked data, reconstruct workflows, exchange and reuse cataloguing data, and achieve entity-based resource discovery. This analysis aims to provide insights for Chinese libraries transitioning their bibliographic data towards linked data.
Keywords BIBFRAME. Cataloguing. Linked data. Metadata management.
0 引言
關聯數據是Tim Berners Lee于2006年提出,是語義網發布數據的一種方式,主要通過URI命名并鏈接資源、采用RDF等資源描述模式來提供信息,強調在語義網背景下建立數據之間的鏈接,用以支持網絡資源的發現、利用和整合。為了充分參與關聯開放數據環境,美國國會圖書館研制并于2012發布了BIBFRAME模型,在以關聯數據技術為基礎的更廣泛的網絡背景下,提供一個從MARC格式過渡的路徑。BIBFRAME模型自從發布以來,在圖書館社區得到積極的響應和廣泛的實踐,到目前為止已進入到RDF數據生產、與MARC數據轉換、BIBFRAME編輯工具開發、圖書館系統開發支持的應用階段。本文基于BIBFRAME模型的應用實踐,分析圖書館如何管理書目關聯數據,如何重構工作流程,如何交換重用編目數據,如何實現基于實體的資源發現,以便為我國圖書館書目向關聯數據轉變提供參考借鑒。
1 基于BIBFRAME模型的書目關聯數據
自1966年MARC研制發行后,在圖書館社區得到廣泛使用并應用至今,有力地推動了圖書館技術的自動化和標準化,由MARC格式編制的機讀目錄也成為圖書館開展各項服務的基礎。隨著計算機技術與網絡技術的發展,圖書館管理的資源類型日趨多元化,要求元數據能夠靈活的描述紙質、電子、數字、網絡資源,并且能夠利用網絡上其他社區豐富的數據資源來擴展發現的范圍,提升用戶信息探索體驗。關聯數據技術的出現使圖書館這一愿景的實現成為可能,同時也能將相對封閉的圖書館書目記錄、規范記錄、值詞表等行業數據開放到互聯網上,促進信息共享、數據重用,提升圖書館領域知識的可見度和影響力。
圖書館資源關聯數據化的核心是本體模型設計。本體是一個領域內對共享概念的形式化、顯性的規定,通過分析書目數據,識別并抽取實體和關系。關聯書目數據模型主要有FRBR、LMR、RDA、BIBFRAME、Schema和EDM等。圖書館書目數據關聯化的一些研發和實踐項目分別采用過不同的模型,比如瑞典國家圖書館聯合目錄LIBRIS發布為關聯數據,其中實體類型根據FRBR模型進行實體抽取,包括作品、人、概念和機構四大類[1];OCLC將WorldCat書目記錄發布為關聯數據,采用Schema.org作為本體模型和詞匯來源[2];BIBFRAME推動了FRBR、RDA模型的應用,旨在將書目描述標準發展為鏈接數據模型,以促進書目信息更加融入互聯網,提高書目數據在圖書館領域內外的利用率[3]。其中由美國國會圖書館開發的BIBFRAME本體模型在書目數據關聯化中應用范圍最廣,如圖書館關聯數據LD4系列項目、由圖書館驅動的基于關聯數據的Share-VDE項目[4]、歐洲一些國家圖書館發布的書目關聯數據大多采用BIBFRAME框架[5]。除此之外,系統廠商ExLibris和開源圖書館系統Folio也積極探索和實踐BIBFRAME格式的書目元數據管理工作流,以支持圖書館由MARC向關聯數據環境過渡,構建圖書館關聯數據生態系統其中一環[6]。
為了充分參與關聯開放數據環境,也為了更好的實現RDA目標和愿景,美國國會圖書館(LC)研制并于2012發布了BIBFRAME模型,在以關聯數據技術為基礎的更廣泛的網絡背景下,提供一個從MARC格式過渡的路徑[7]。隨著MARC向關聯數據的轉變,圖書館創建和管理書目數據的方式正在發生巨大變化,一方面以BIBFRAME本體實施書目關聯數據的圖書館社區實踐得以廣泛開展,尤其是2017年LC發布了用于測試MARC-BIBFRAME的轉換工具和規范以來;另一方面,圖書館還存有大量遺留MARC數據,進行這種過渡需要顯著的改變和(或)系統遷移[8]。這意味著未來幾年,這些混合格式或混合鏈接數據環境將成為在實踐中使用鏈接數據的最常見方式,對于基于BIBFRAME模型的書目關聯數據提出了相應的管理要求,不僅需要圖書館在一段時間內具有支持混合環境的能力,還能使用混合鏈接數據來增強和擴展現有的數據模型,用于書目關聯數據管理的有效工作流、工具和協作,并且能夠用于管理關聯數據和改進發現的系統[9]。
2 圖書館BIBFRAME數據模型的應用實踐
1998年國際圖書館協會和機構聯合會(簡稱國際圖聯,IFLA)發布《書目記錄的功能需求》最終報告(簡稱FRBR)。為了克服AACR2在數字資源描述能力的不足,聯合編目委員會開發了其升級產品RDA,這是一部專為數字環境所設計的、并能適用于圖書館和其他信息機構進行資源描述與檢索的內容標準,也是目前國際上第一個完全采用基于FRBR的實體-關系(E-R)書目概念模型的編目標準[10]。RDA采用FRBR的WEMI結構,隨著2017年IFLA推出FR家族系列的統一版《國際圖聯圖書館參考模型》(簡記為IFLA-LRM),導致基于該模型的RDA的修訂和更新,官方RDA已于2020年12月份上線。此次RDA的修訂目標是讓用戶能夠更全面的發現、識別、選擇和獲取所需資源,以適應電子資源、數字圖形、音視頻等多種類型信息資源的編目要求。
2.1 以BIBFRAME為基礎的數據模型開發
由RDA的產生背景和模型基礎來看,是需要有新的書目格式更好的承載RDA模型,發揮其優勢。為了達成這一目標,LC研制了未來取代MARC并能在關聯數據實現上更有優勢的BIBFRAME模型框架。從發布至今,圖書館社區,尤其是歐美國家圖書館和學術圖書館以BIBFRAME本體為基礎展開了大量的實踐應用項目,并基于廣泛的用例和交流反饋,在實踐中對BIBFRAME本體進行了一定程度的擴展,圖1是IFLA-LRM, BIBFRAME與Share-VDE模型比較[11]。
RDA采用IFLA-LRM模型結構[12],用“實現為”“體現在”“實例化”連接第一組實體Work、Expression、Manifestation、Item之間的關系,RDA作品被定義為“獨特的知識或藝術創作”。MARC21采用RDA標準,盡管受限于本身的扁平化結構,并不能很好發揮RDA層級化聚類與整合的潛在優勢,仍然是當前圖書館采用最多的書目描述格式,生成并保有大量的書目數據資源。
BIBFRAME緊隨RDA之后開發,目標是允許圖書館在MARC格式以外更好的利用RDA標準生產符合語義網的書目關聯數據。出于編目實踐的需求,LC最初建模時,是對FRBR模型采用簡化處理方式,將FRBR的“Work(抽象作品)”和“Expression(內容表達)”合并為BIBFRAME的“Work”,這導致RDA的WEMI模型和BIBFRAME的WII(Work、Instance、Item)模型之間的不一致[13]。
在BIBFRAME模型的實踐應用中,由圖書館社區驅動的Share-VDE項目,在國際合作和聯盟的共同努力下,開發了一系列創新工具和服務,支持成員從傳統書目數據過渡到鏈接開放數據,具有很高的影響力。Share-VDE使用書目框架倡議BIBFRAME數據模型和精心定義的擴展[14],提供了一個動態的、可發現的鏈接數據框架。該項目在審查由MARC轉換到BIBFRAME作品與作品的關系時發現,盡管“作品”-“表達”關系目前可以在BIBFRAME中通過“Has Expression”來體現,但這些關系最終是“作品”-“作品”關系,很難確定初始(或主要)作品以及作品之間的層次關系;此外,如果不能定義“作品”和“主要作品”之間屬性元素的差異,將無法通過轉換獲取并自動處理這些關系。因此,基于數據轉換實踐,Share-VDE創建了“svde:Opus”,由“svde:Work”來表達其層次關系,擴展為如圖1所示的4層實體關系,從而與IFLA-LRM兼容[15]。
LC用BIBFRAME模型開展實踐活動,包括轉換遺留MARC數據及原生BIBFRAME數據的編制,基于對bf:Work搭配組合及分層聚集需求的認識,將原有的BIBFRAME本體進行了擴展,幾乎與svde:Opus同一時間開發了bflc:Hub,它是bf:Work的一個子類,被定義為“在兩個作品之間起橋接作用的一種抽象資源”[16],通過“Has Expression”與“Work”相關。擴展后的BIBFRAME-LC(HWII)與RDA(WEMI)、Share-VDE(OWII)形成一組高度相關的等效模型。
2.2 BIBFRAME書目數據的互操作、重用與共享
書目信息資源模型通常描述“書目世界”中重要的實體類型,其屬性及相互關系,構建的模型本身就是一種可互操作性的度量。基于同一模型產生的數據在某種程度上都是可互操作的,但同時也取決于模型規范的形式化和嚴格程度,松散的規范會導致使用上的自由靈活,進一步形成應用中的多樣性,從而引起最終數據互操作上的問題[17]。
在應用BIBFRAME進行書目關聯數據實施的社區中,LC、PCC、OCLC、Share-VDE等組織
和項目做出了貢獻,產生了大量的BIBFRAME數據,目前有數十億三/四元組托管在BIBFRAME數
據節點中,Share-VDE系統中包括1.5億BIBFRAME
格式的各類實體(Original work、Work、Instance、Item、Subject、Person、Family、Organization、Conference)[18]。不同社區和項目基于BIBFRAME本體的不同擴展和實施決策是數據能否良好交換的主要障礙,而通用書目控制是建立共享資源描述的基礎上,通過書目數據共享和重用來消除冗余,因此,我們需要存儲在BIBFRAME節點上的數據及不同社區產生的數據能夠支持交換、重用和共享[19]。
在許多方面,LC的用例與Share-VDE的需求非常相似,因此幾乎同步擴展了BIBFRAME模型,分別構建了更為抽象的作品層Hub和Opus,形成與RDA-WEMI幾近等效的四層實體模型,也進一步驗證了對這種級別的描述和作品聚合的總體需求。盡管Hub和Opus存在相似性,但兩者在數據轉換和聚類處理方面存在關鍵差異。Hub側重于name/title檢索點和等同的MARC字段使用,而Opus基于與RDA核心元素集(區分Work與Expression)相關的MARC字段進行映射轉換和聚類[20]。隨著實踐范圍的擴大與用例規模的增加,如何在BIBFRAME數據的互操作中包容差異,如何更明確的定義邊界以支持數據交換與共享,是BIBFRAME社區中共同探討研究的問題。
PCC政策委員會(PoCo)于2022年1月批準成立的國際書目框架互操作小組(The International BIBFRAME Interoperability Group-BIG)承擔的任務是:原始數據創建中表達BIBFRAME本體的不同選擇以及MARC數據轉換的不同結果導致的BIBFRAME數據交換問題[21]。該小組對實施BIBFRAME的11個成員目前使用的編目標準進行了調查:大部分依據BIBFRAME2.0版本;在具體應用中有50%成員與bf:2.0模型差異較大,如Share-VDE、BIBFRAME擴展bflc、本地擴展詞表或者BIBFRAME lite等;MARC到BIBFRAME的轉換處理分別用到RDFizer工具、本地轉換邏輯、LC的MARC2BIBFRAME轉換器;BIBFRAME到MARC的轉換處理也不同,如基于LC的轉換邏輯或是本地自行開發。BIG小組審查成員BIBFRAME實現用例,并討論如何解決他們對互操作的要求和遇到的問題,同時BIG小組也與BIBFRAME互操作性領域的其他小組合作和溝通,以確保在不同社區之間重用BIBFRAME的能力。
當前開展的工作主要是定義數據交換所需的標準BIBFRAME“形狀”(如圖2所示[22]),構建用于交換的中間模型作為數據交換“通道”,創建形狀約束語言(SHACL)的“形狀”,構建SHACL驗證工具,以支持數據重用。并基于樣本數據,探索定義數據交換所需的核心BIBFRAME元素,確定bf:Work屬性元素的數據建模,確定bf:Instance的最小交換要求和屬性元素,并與BIBFRAME一起使用官方RDA的問題,提出解決策略。
3 BIBFRAME元數據編輯與管理
用關聯數據表示的書目數據與傳統MARC格式的書目數據有很大不同,圖書館對書目關聯數據的采用在很大程度上取決于圖書館社區整個關聯數據基礎設施的開發和搭建,包括美國國會圖書館開發的BIBFRAME本體,MARC與BIBFRAME之間的映射轉換,不同書目模型之間的對齊、互操作,對作為關聯數據規范的長期維護,保持詞表的穩定可持續,以實體為單位的元數據編輯工具等等。未來幾年,圖書館書目數據會向關聯數據快速轉變,我們在這種“傳統數據與關聯數據混合”的數據環境中,如何實現書目關聯數據,如何生成、編輯、管理這些元數據就成為其中重要一環。
3.1 BIBFRAME書目元數據生成方式
目前世界各地對書目信息的描述大多使用MARC格式,這也是我們轉向書目關聯數據時需要重點考慮的歷史遺留數據問題。盡管在未來排他性關聯數據環境可能會成為某些應用程序的標準,正如現在的MARC數據一樣,但在很長一段時間,MARC格式數據在一些機構還將長期使用,混合環境可能會持續存在。在MARC格式逐漸被BIBFRAME取代的過程中,可以對MARC格式進行數據化改造,通常將鏈接數據容納在這種傳統格式中,如MARC21增加了$0和$1,分別用于記錄規范記錄(控制號/標準號)和真實世界對象URI;此外還新增758字段資源標識符,用于書目記錄描述的資源(即載體表現對應的作品或內容表達的URI)及相關資源(包括相關作品、內容表達和載體表現等)[23]。這種方式是通過使用URI鏈接構建MARC數據來擴展功能,挖掘關系,以增強發現。
在圖書館實踐中,主要通過兩種方式生成BIBFRAME書目關聯數據。首先,以現有MARC數據為基礎,利用外部數據源,如ISNI、VIAF、LCSH、WIKIDATA等,對其進行豐富,并將其轉換和聚類到BIBFRAME圖中。在轉換的過程中需要遵循轉換規范,已經建立MARC21到BIBFRAME轉換流程的包括LC、Share-VDE、LibrisXL、ExLibris[8],
此外,Share-VDE與IFLA合作,正在進行UNIMARC-BIBFRAME的映射轉換規則[24]。我國通用機讀目錄格式采用CNMARC,主要依據UNIMARC編制的,IFLA的工作成果對我國CNMARC轉為BIBFRAME很有參考價值。其次,可以直接在RDF編輯器中生成關聯數據,如LC的BIBFRAME編輯器MARVA、Sinopia關聯數據編輯器。
在數據的轉換處理上,以Share-VDE的LOD(Linked Open Data Platform)平臺為例,數據處理流程(如圖3所示),在這些過程結束時,數據就可以在發現門戶上索引,并以RDF發布在各個站點上,主要包括的環節如下[25]:
(1)導入不同格式數據,如MARC、XML格式的書目、規范記錄,根據文本分析和字符串匹配處理,以識別MARC記錄中包含的實體;
(2)通過外部數據源(VIAF、ISNI、LCSH、GND等)的其他變異形式和URI豐富實體數據,增強和擴展實體的識別功能;
(3)通過URI識別的相同實體進行協調,創建集成的、豐富的集群知識庫(Cluster KnowledgeBase-CKB);
(4)提取“隱藏”關系,以生成和提供一個關系數據庫,在后續步驟中可重復使用,以豐富數據,并在數據發布階段重復使用,以擴大數據之間的關聯;
(5)CKB數據轉為RDF發布,并可通過SPARQL和API查詢端點訪問;
(6)遵循特定的BIBFRAME模型和/或其他本體,處理并轉換為RDF。
3.2 BIBFRAME書目關聯數據編輯器
與MARC編輯器一樣,編制原始BIBFRAME格式元數據也需要專門的編輯器。MARC格式書目數據編制是以記錄為單位,與FRBR模型對照,注重的是“載體表現”實例化層面的書目信息描述,同時將“作品”抽象層和“表達”實現層等要素封裝在一起,打包形成一條記錄[23]。而BIBFRAME采用FRBR的實體-關系模型,以實體為描述對象,以詞表來揭示實體屬性及其之間的關系,與MARC記錄相比,描述的單位不一樣,是一種分層的粒度更細的描述。上文提到BIBFRAME編輯器主要有LD4P資助開發的Sinopia和LC的Marva,用以針對實體進行編輯,兩個關聯數據實體編輯器中包含基于所描述資源書目格式的“模板”,BIBFRAME核心抽象級別是Work、Instance和Item,每個模板中的數據元素適合所描述的資源的格式。
Sinopia是一個用于編目的關聯數據(RDF)編輯器,支持多機構和組織等團體在關聯數據環境中的合作編目,允許經過授權的用戶進行通用編輯。用戶可以在Sinopia的資源模板中使用任何本體,如Schema.org、Performed Music Ontology、RDA、FRBR、BIBFRAME等,但Sinopia針對BIBFRAME進行了優化,內嵌了Lookup能夠檢索在Sinopia創建的數據及LC的LCGFT(Genre/Form Terms)或LCNAF外部詞表等。Sinopia編輯創建的以RDF存儲的書目關聯數據資源,可轉換為MARC21和JSON記錄,轉換后的記錄可集成到第三方系統,加載到圖書館集成系統(ILS)和圖書館服務平臺(LSP),以提供適用的書目數據資源;其中,Sinopia中的PCC資源將發送到Share-VDE,成為其系統數據流中的輸入來源數據之一[26]。
Marva是由美國國會圖書館網絡發展與MARC標準辦公室(NDMSO)開發的,于2021年推出,使用BIBFRAME本體創建圖書館關聯書目數據。Marva編輯器內置不同類型資源(包括monograph, monograph (non-Latin), notated music,serial, cartographic, sound recording, moving image,rare materials, prints amp; photographs等)的配置文件模板,用易于導航的交互模式對“Work”“Instance”的屬性和關系進行描述。內嵌Lookup用以檢索及插入如LCSH、LCMPT、LC/NAF、LCGFT、LCDGT等規范數據和美國國會圖書館將整個MARC書目數據轉換成BIBFRAME Works和Instances實體數據,并以PDF/XML形式輸出作品、實例的BIBFRAME數據[27]。目前Marva已集成到Folio系統中使用。
3.3 基于BIBFRAME的實體協調共享管理工具
基于BIBFRAME詞表及其他本體生成的實體數據,既可以是通過編輯器原編產生,也可以是將MARC數據按照一定的轉換邏輯生成,根據開放元數據政策[28],由此產生的書目關聯數據允許用戶在明確的許可條件下重用。在這種環境下,圖書館需要對關聯書目實體數據進行管理,尤其是多機構聯合數據共建共享,同時又能保證各自數據獨立自治的需求下。
共享數據模式下書目關聯數據的實現,圖書館社區Share-VDE(SVDE)創建了大規模可應用的數據流[29]:成員館以支持的格式(如MARC格式的書目和規范記錄、RDF數據)將記錄導入到SVDE系統、利用不同格式的映射以識別實體元素、將不同來源的同一實體(包括名稱的各種變異形式)聚類并分配唯一標識符、用外部數據源(如VIAF、Wikidata、FAST等)對輸入的數據進行豐富、根據BIBFRAME本體將數據轉換為RDF數據并上載至三元組存儲庫、轉換的數據輸入到實體集群知識庫(Cluster Knowledge Base,CKB)、通過應用層對轉換后的關聯數據實體和RDF數據進行利用。
在這一過程中經過轉換生成的BIBFRAME實體,如Agent、Work、Instance、Place、Topic等,是通過J.Cricket編輯器對其進行協調和管理。J.Cricket是一個跨機構共享的協作工具,專門用于對實體進行管理的應用程序,包括對實體屬性、關系和鏈接的編輯、合并及拆分管理,為圖書館提供規范數據源的交互式發現環境。
J.Cricket編輯器是以合作方式管理圖書館編目數據新方法的一個實例,將聚合的多源數據通過標準關聯數據協議,在多機構協作與集成環境中提供豐富的、高質量的、在圖書館社區及其他網絡社區可重復使用的開放數據和資源。
4 實現BIBFRAME關聯數據服務的系統需求
廣泛的關聯數據生態系統和語義網建立在實體和關系的共享、唯一標識符(URI)的基礎上,計算機能夠識別語義網,根據語義決策遍歷基于上下文的信息網,圖書館利用關聯數據這一特性擴展讀者信息發現的廣度和深度。圖書館轉換到關聯數據不僅是數據轉換的技術和工作流程改變的問題,也會影響到圖書館系統與信息流,需要相應技術堆棧形成本地關聯數據生態系統,才能最大限度實現關聯數據優勢。
4.1 混合編目環境下圖書館系統的數據兼容性
從以傳統MARC記錄為主的系統環境轉為BIBFRAME格式的關聯數據環境是一個復雜的過程,圖書館通過集成系統內的應用程序、工作流程處理采購、編目、流通等業務工作,同時也有非圖書館的第三方應用系統與圖書館交換數據,應用編目數據保證圖書館運營及服務。這其中既包括書目數據的轉換、原始BIBFRAME關聯數據的生成,也包括工作人員對新技術新標準的培訓,系統供應商、軟件服務商開發更改應用程序以適應關聯數據環境,因此,復合數據環境將是圖書館向關聯數據遷移過程中長期存在的一種過渡狀態。在這一狀態中,圖書館系統可能會處于轉向關聯數據環境的不同階段[30]。
(1)面向MARC記錄的圖書館系統容納BIBFRAME數據能力。圖書館系統對BIBFRAME格式書目關聯數據的初步管理,可通過連接BIBFRAME轉換工具到圖書館系統,實現MARC數據到RDF/BIBFRAME的即時轉換和更新。圖書館系統是基于MARC記錄編目并在關系數據庫(RD)中管理數據,轉換的關聯數據能用于外部應用程序使用。實現這一階段BIBFRAME數據的轉換和管理,廣泛共享使用的URI是關聯數據生態系統的基石,前期需要利用URI豐富MARC記錄,以便轉換為關聯數據后確保連接的一致性和穩定性。目前一些組織機構,如LC、OCLC、Getty[31]提供實體(作品、實例、人、地點等)、受控詞表、本體詞表(RDA、BIBFRAME、OWL等)的關聯數據服務,為圖書館和文化遺產組織提供長久可持續的URI。在實踐方面,OCLC已于2023年12月將WorldCat實體“人”“地點”和“事件”的URI添加到WorldCat記錄中,并計劃2024年將“作品”實體URI添加到WorldCat記錄中[32]。
(2)面向BIBFRAME實體編目的圖書館系統數據管理能力。利用獨立的BIBFRAME編輯器創建和編輯實體數據,圖書館系統通過專門開發的API層,將RDF數據轉換為MARC數據并輸入至傳統關系型數據庫中,用于使用傳統數據的其他服務。ExLibris計劃于2024年5月將Sinopia編輯器集成到Alma系統中,以輸出BIBFRAME數據[33];EBSCO公司和LC聯手合作,將BIBFRAME編輯器Marva與FOLIO平臺無縫集成[34]。圖書館系統要有自己BIBFRAME接口的圖形用戶界面(GUI),同樣是面向實體進行編目。但無論采用何種路徑進行本地關聯數據編目,新的編目工作臺都與基于MARC的系統協同工作,圖書館系統將同時管理RD(Relational Database)和TS(TripleStore)兩個不同的數據庫,并且在兩種環境中同時更新每個編目操作,即每當創建一條MARC記錄時,都會將一個平行圖保存到TS圖數據庫中;類似地,每當創建一個關聯數據圖時,也會同時創建一個MARC記錄到RD關系數據庫中。最后,圖書館系統完全在BIBFRAME環境中進行原始編目,以RDF生成和管理數據,同時其他應用系統也轉換為關聯數據操作,實現本地關聯數據生態系統的過渡。
4.2 基于BIBFRAME實體的發現
傳統圖書館OPAC檢索是基于MARC格式的單元記錄,底層數據大多基于關系型數據庫。而在BIBFRAME關聯數據環境下,圖書館的檢索發現是基于實體-關系模型,底層數據庫是Triplestore(RDF),OPAC/發現系統需要開發適應新的數據模型和格式的架構與生態。
能夠實現實體發現的典型系統是Share VDE。正如Share VDE名稱所顯示的,“Discovery(發現)”是該項目生態系統中的重要組成部件。Share VDE發現是基于BIBFRAME的,使用實體模型,系統中包含的實體類型有Person、Family、Organization、Conference、Original work、Work、Instance、Item、Subject,實體總數超過1.5億[18]。與基于記錄的目錄不同,Share VDE反映了底層數據模型基礎設施的組成部分,專注于作品和作者元素,避免了基于MARC的目錄中長期存在的記錄中數據重復問題,提供廣泛而詳細的檢索結果,并以簡潔直觀的界面改善用戶體驗[35]。Share VDE實體頁面,包括來自于Wikimedia的圖片、概要,豐富了實體的描述信息,也允許嵌入圖書館的API,以實現與本地圖書館服務的互操作性,如連接到賓夕法尼亞大學圖書館Alma流通服務的APIs,實現借書服務。
5 圖書館實施關聯數據服務面臨的挑戰
任何用關聯數據服務取代基于MARC的編目都需要時間和仔細的評估,將關聯數據成功整合到廣泛的圖書館實踐中,需要一個穩定且可擴展的基礎設施[36]。采用BIBFRAME過渡到關聯數據生態系統,充分利用關聯數據優勢,實施關聯數據服務,圖書館在這一過程中面臨諸多挑戰。
(1)圖書館向BIBFRAME書目編目過渡,一致的、持久可靠的規范標識符(URI)至關重要。URI為關聯數據圖中的所有實體提供唯一的、機器可操作的標識符,構成了鏈接數據生態系統的主干,關聯數據圖的好壞取決于它的URI。如果對同一實體使用不同的URI,可能會導致數據的冗余和混淆,造成數據整合不完整、查詢效率低,。所以正確的URI管理對于體現關聯數據的優勢至關重要。
(2)評估不同風格的BIBFRAME模型,處理好數據互操作問題。由于在原始數據創建中表達BIBFRAME本體的不同選擇以及MARC數據轉換的不同結果[37],導致BIBFRAME數據差異,定義一個標準的BIBFRAME“形狀”,以支持數據重用,包括與其他格式的轉換;或者通過完善標準化的BIBFRAME核心來支持數據交換的基本需求,使圖書館能夠以盡可能高的保真度重用數據,為圖書館社區提供堅實的共享數據基礎。
(3)MARC與Bibrame數據之間相互轉換的長期需求,要求圖書館社區完善轉換規范和應用程序。遵循單元記錄編目傳統的MARC格式,已有50多年歷史,積累了大量的MARC記錄。這些記錄數據不一致問題或規則造成的差異,以致于從MARC到BIBFRAME往返轉換的信息損耗和失真。圖書館所處的環境、技術、要求不一樣,很難整齊劃一的從傳統模式轉為關聯數據環境,這需從書目元數據的角度,支持不同的圖書館以適合他們的進度向關聯數據轉換。
(4)館員培訓與技術儲備。隨著信息資源數量和種類的增加,圖書館的目標是改進檢索和元數據管理,利用關聯數據潛力,增強信息資源發現能力。這就需要提高館員的技術和能力,培養館員在圖書館元數據的新用途和更大規模用途方面的專業知識,不僅能夠利用關聯數據技術創建和維護元數據,還能與開發人員合作擴展關聯的數據資源和功能。
參考文獻:
鄭華敏.國外關聯書目數據模型比較研究[J].數字圖書館論壇, 2018 (7):60-67.
吳貝貝,夏翠娟.關聯書目數據模型比較研究[J].圖書館雜志, 2015, 34(5):71-79.
Overview of the BIBFRAME 2.0 model[EB/OL].[2023-08-13].https://www.loc.gov/bibframe/docs/bibframe2-model.html.
Share-VDE[EB/OL].[2023-08-13].https://wiki.share-vde.org/wiki/Main_Page.
楊靜,張婕,王蓓.書目框架(BIBFRAME)國內外研究與實施進程的調查與思考[J].圖書館界, 2021 (6):63-67, 84.
Library of Congress.Launches effort to transform collections management and access[EB/OL].[2023-08-13].https://newsroom.loc.gov/news/library-of-congress-launches-effort-to-transform-collections-management-and-access/s/c432d3c2-780b-4bfe-9123-bbb6c25631bc.
Library of Congress.Bibliographic framework initiative[EB/OL].[2023-08-18].https://www.loc.gov/bibframe/.
BIGELOW I.,SPARLINGPAR A.Control or chaos:
embracing change and harnessing innovation in an
ecosystem of shared bibliographic data[J]. JLIS : Italian
Journal of Library,Archives and Information Science,
2022,13(1):67-85.
University of Philadelphia Library.Penn libraries linked data framework[EB/OL].[2023-08-19].https://
guides.library.upenn.edu/c.php?g=1278641amp;p=
9382545.
王景俠.編目標準RDA和BIBFRAME的發展演進及其思考[J].山東圖書館學刊, 2022(5):9-14.
FORD K. LRM,BIBFRAME and Share-VDE model comparison[EB/OL].[2023-08-19].https://drive.google.com/file/d/1Ft1DTfB6HwlbIyDU2BOMcr_W4_1x5EYY/view.
RIVA P,BOEUF P,?UMER M.IFLA library reference
model:a conceptual model for bibliographic information
[EB/OL].[2023-08-19].https://www.ifla.org/files/
assets/cataloguing/frbr-lrm/ifla-lrm-august-2017.
pdf.
MCCALLUM S.Collocation and hubs : fundamental
and new version[J].JLIS:Italian Journal of Library,
Archives and Information Science,2022,13(1):45-52.
The Share-VDE Advisory Council.Share-VDE:
supporting the creation,management and discovery of linked open data for libraries[EB/OL].[2023-08-18].https://wiki.share-vde.org/w/images/4/43/Share-VDE_Executive_Summary_2022-12-07.pdf.
BIGELOW I.Opus Ex Machina:modelling superwork
and work entities in IBFRAME[EB/OL].[2023-08-18].
https://www.kb.se/download/18.d0e4d5b16cd18f6
00eacb/1569309579935/Opus%20Ex%20Machina%
20-%20Present.pdf.
Library of Congress.BIBFRAME 2.0 vocabulary list
view-LC linked data service: authorities and vocabularies[EB/OL].[2023-08-20].https://id.loc.gov/ontologies/bibframe.html#c_Hub.
OHREN O.Model interoperability
[EB/OL].[2023-08-20].https://drive.google.com/file/d/1vR-Xy8eX941trpIMtZTqh6YWjbOuH3YI/view.
Share-VDE.Share-VDE (BETA)[EB/OL].[2023-08-20].https://www.svde.org/about/about-share-vde.
Program for Cooperative Cataloging (PCC).BIBFRAME interoperability group (BIG)[EB/OL].[2023-08-20].https://wiki.lyrasis.org/pages/viewpage.action?pageId=249135298.
BIGELOW I.Query_ link or copy - the opera and
interoperability[EB/OL].[2023-08-20].https://drive.google.com/file/d/1WCh4MgG7xpx5WDBcP-mobpiMtrFxZ5ZS/view?usp=share_link.
WACKER M.The international BIBFRAME interoperability group (BIG)-background amp; current
work[C/OL].[2023-08-20].https://wiki.lyrasis.org/
display/PFCCP/Presentations?preview=/25726159
8/296681571/The%20International%20BIBFRAME
%20Interoperability%20Group%20(BIG).pdf.
Share-VDE.SVDE entity discovery interface-Design
process and demo of the system[EB/OL].[2023-08-20].https://bit.ly/SVDE-discovery-demo-slides.
胡小菁.文獻編目:從數字化到數據化[J].中國圖書館學報,2019,45(3):49-61.
Share-VDE.Share-VDE and the share family cooperation and innovation to bring linked open data into practice[EB/OL].[2023-08-20].https://bit.ly/Share-Family_update_2023-Jul-12_slides
Share-VDE.LOD platform : linked data as a service[EB/OL].[2023-08-20].https://wiki.share-vde.org/w/images/a/ae/LOD_Platform_2021-02_ENG.pdf.
Sinopia-STAGE.The underdrawing for the new world
of linked data in libraries[EB/OL].[2023-08-20].https://stage.sinopia.io/.
Library of Congress.Marva BIBFRAME user manual
[EB/OL].[2023-08-20].https://guides.loc.gov/c.php?g=1170551amp;p=8550706amp;preview=003264c97f504caf990125066b248e24.
Share-VDE.Open metadata policy[EB/OL].[2023-08-20].https://wiki.share-vde.org/w/images/7/73/Share
-VDE_Open_Metadata_Policy_2023-03-15.pdf.
Share-VDE.Share-VDE and share family data flow[EB/OL].[2023-08-23].https://wiki.share-vde.org/w/images/c/c7/Share_Family_data_flow.pdf.
Organizer group 2018 european workshop BIBFRAME BIBFRAME.Expectations for ILS tenders[EB/OL].[2023-08-20].https://www.academia.edu/106358825/BIBFRAME_Expectations_for_ILS_tenders?uc-sb-sw=35450013.
Yetty research institute.Getty vocabularies as LOD
[EB/OL].[2023-08-20].http://www.getty.edu/research/tools/vocabularies/lod/.
MIXTER J.OCLC preparation for BIBFRAME[EB/OL].[2024-02-10].loc.gov/bibframe/news/source/
2024jan22-bf-update-mixter.pdf.
YEHUDA C, VELTZMAN I.Unlocking connections:
how linked open data and BIBFRAME can benefits
library users[EB/OL].[2024-02-10].https://www.loc.
gov/bibframe/news/source/2024jan%20ExLibris%
20LOD%20-%20LibLearnX.pdf.
GONZALEZ G.Data unlocked: empowering libraries
with rich connections and insights in FOLIO[EB/OL].[2023-10-20].https://www.bfwe.eu/brussels_
2023.
Share-VDE advisory council. Share-VDE statement:
Share-VDE’s role in library linked open data[EB/OL].[2024-03-10].https://wiki.share-vde.org/w/images/e/ea/Share-VDE_Statement_2021.pdf.
OCLC.OCLC linked data services transform metadata
management and connect library resources to wider knowledge streams[EB/OL].[2024-02-10].https://www.oclc.org/en/news/releases/2024/20240130-linked-data.html.
WACKER M.Points from BIG discussions of interoperability with flexibility[EB/OL].[2023-10-
20].https://www.loc.gov/bibframe/news/source/5-BIG-Bf-Update-Forum-2023-01.pptx.