楊 靜 楊 崢 蔣蓓蓓
(金陵圖書館 江蘇南京 210019)
BIBFRAME是由美國國會圖書館(Library of Congress,LC)聯合Zepheira公司于2011年發起的“書目框架先導計劃”,旨在開發一種替代MARC的書目數據格式[1]。BIBFRAME繼承了FRBR的思想,通過描述實體、屬性、實體間的層級關系來構建模型,用來增強書目信息在Web環境中的發現。
2013年1月BIBFRAME1.0模型發布,提供了具體的元數據方案,并聯合德國國家圖書館、大英圖書館及聯機計算機圖書館中心(Online Computer Library Center,OCLC)等機構進行了大量的測試和開發,后于2016年1月發布了BIBRRAME2.0,版本發布后吸引了更多國家申請加入測試。目前其官網發布了BIBFRAME2.0與MARC21之間相互轉換工具、轉換規范、BIBFRAME編輯器、BIBFRAME2.0詞表等。
BIBFRAME2.0書目框架模型(見圖1)與之前的1.0版本最大的區別就是取消Authority(規范)和Annotation(注釋)兩個核心級別,新增Item(單件),即將所要描述的信息簡化為三個核心級別:Work(作品)、Instance(實例)和Item(單件),三者共同構成了BIBFRAME2.0的三個層次,分別是Work(作品)代表的內容層次,Instance(實例)代表的載體層次,和Item(單件)代表的單件層次,再通過定義相關的類、屬性、關系來對文獻資源進行富含語義的關系揭示[2]。

圖1 BIBFRAME2.0 書目框架模型
其中Work(作品)描述的是不同名稱以及不同表達方式的同一作品,是一個抽象的集合,具有subject(主題)、agent(代理)、event(事件)等屬性;Instance(實例)描述的是載體層次,是Work(作品)的具體化表現,因為一個作品很可能包括很多實例,可能是電子版,也可能是印刷本,所以具有format(格式)和publisher(出版者)等屬性;Item(單件)通常理解為圖書館館藏信息的描述,如借閱狀態、副本信息等,該信息可以幫助用戶直接獲得所需資源,具有held by(持有者)和barcode(條形碼)等屬性。
BIBFRAME模型基于關聯數據技術,注重描述實體之間、實體屬性之間的關系。如模型中Work(作品)、Instance(實例)和Item(單件)三個核心級別之間存在“has(有)”的關系,Work(作品)“有”Instance(實例),Instance(實例)“有”Item(單件)。還利用統一資源標識符(Uniform Resource Identifier,URI)來標識“作品”“實例”“單件”及其屬性,使書目數據實現在互聯網上的發布和共享。
雖然BIBFRAME誕生的目標就是為了取代MARC,但在目前還未開發完全的情況下,仍保持著與MARC的相互兼容,它繼承了MARC的語義性和一致性。美國國會圖書館在BIBFRAME官網上發布了BIBFRAME到MARC21的雙向轉換工具,并規定了轉換規范和轉換程序[3]。
在BIBFRAME2.0模型中,Work(作品)層次集合的是抽象的內容,包含不同題名、不同語種或者不同表現形態的同一作品,具有subject(主題)、agent(代理)、event(事件)等屬性。Instance(實例)層次則描述的Work(作品)的具象內容,具有fomart(格式)和publisher(出版者)等屬性。Work(作品)和Instance(實例)之間是1對n的關系[4],因為同一件作品可能包含多個實例,舉例來說,《不能說的秘密》這部作品在BIBFRAME2.0層級中屬于一個抽象內容,因為它可以對應電影《不能說的秘密》、話劇《不能說的秘密》、電子書《不能說的秘密》、印刷本小說《不能說的秘密》等多個實例,于是每個實例又對應著不同的格式和出版者等屬性。將抽象層次和具象層次分開描述,同時給抽象和具象的內容及其屬性都賦予URI,可以更準確地展示它們之間的關系,從而提高檢索的準確性和全面性。
雖然BIBFRAME的名稱叫書目框架模型,但其目標遠不止對于書目數據的描述,還包括地圖、數據集、靜態圖像、動態圖像、音頻、樂譜、舞譜、物體、多媒體、混合資料等多種形式的資源[5]。在各國的應用測試過程中,BIBFRAME官方也提供多種元數據映射方案,如MODS(元數據對象描述模型)、EAD(編碼檔案描述模型)、Pica+(荷蘭圖書館自動化中心,一種元數據格式)、DCMI(都柏林核心集)等,因此,BIBFRAME的適用范圍并不僅限于圖書館,還包括檔案館、博物館等機構。
關聯數據四原則是萬維網的發明者蒂姆·伯納斯·李(Tim Berners Lee)于2006年提出的關于建立數據之間鏈接的四個原則,即給所有事物賦予一個URI;用HTTP URI來標識資源,使數據資源能夠在網絡環境下通過HTTP協議訪問獲取;訪問HTTP URI標識的資源時,可以根據標識的URI發現更有意義的相關資源;提供相關的URI鏈接,以便用戶可以發現更多的關聯對象[6]。在BIBFRAME2.0模型的設計中,也遵循了關聯數據四原則的內涵,即不論在哪一個層級,不論是抽象還是具體的內容,或是其各種屬性,都有一個HTTP URI來標識;BIBFRAME采用RDF(Resource Description Framework,資源描述框架)的編碼方式,當有人查詢一個URI時,使用標準的RDF提供與當前資源相關的其他有用信息;當發布書目數據時,與更多相關資源的HTTP URI建立語義鏈接,提高用戶發現、獲取和使用網絡中潛在的相關信息資源的能力。
2013年8月BIBFRAME官方發布了一份《BIBFRAME使用案例與需求》討論稿,里面提出了BIBFRAME的15個應用場景[7],這些應用場景不僅面向圖書館工作人員,也面向讀者,甚至是面向圖書館以外的機構使用。以下將整合選取其中8個方面的內容試做分析,展示基于關聯技術的BIBFRAME是如何揭示書目信息,簡化編目工作,并且使書目信息隨著網絡發揮前所未有的價值,使未來社會知識活動中的不同角色都能夠從書目信息中獲得支持和服務成為可能。
需要指出的是,BIBFRAME采用SPARQL語言作為查詢語言,即SPARQL Protocol and RDF Query Language的縮寫,專門用于訪問和操作RDF數據。W3C的RDF數據存取小組(RDF Data Access Working Group, RDAWG)對其進行了標準化。在2008年,SPARQL1.0成為W3C官方所推薦的標準,2013年發布了SPARQL1.1[8]。
BIBFRAME可以根據客戶端的地理信息方便地為用戶提供SoLoMo(社交本地移動)服務。例如,當讀者需要查找附近30英里以內的一本書,就可以用SPARQL語句實現:
SELECT ?work ?inst ?lib
WHERE {
?work bf:title "PhantomTollbooth"
?inst bf:instanceOf ?work
?holdings bf:holds ?inst
?holdings bf:heldBy ?lib
?lib gs:nearby(40.1583 83.0742 30) .
}
用戶輸入作品題名(bf:title "PhantomTollbooth"),查找條件為該作品的某些實例(bf:inst a nceO f?work),通過用戶查詢的設備定位坐標(40.1583 83.0742 30),查找出符合距離條件的圖書館館藏(?holdings bf:heldBy ?lib)。其實這種SoLoMo服務早已根植于各類互聯網應用中了,是一種基于本地的移動社交概念,如大眾點評APP中,用戶可以根據某一位置查找附近某一距離內的餐飲、景點、住宿、休閑等服務,并可以按照距離、評價等順序排列。同樣,BIBFRAME書目框架模型也可以根據客戶端的地理信息方便地為用戶提供SoLoMo服務,甚至設想可以加入距離內實體書店、檔案館、博物館的關聯數據搜索結果,只要他們同樣采用BIBFRAME對書目、檔案、藏品進行編目,由此可以增加用戶發現資源、獲取資源的途徑。
用戶在查找圖書館館藏的某件作品時,BIBFRAME會優先顯示適應當前設備的實例類型,如手機端、平板端就會推薦電子資源。用SPARQL語句實現如下:
SELECT ?work ?inst ?lib
WHERE {
?work bf:title "Fahrenheit451"
?work bf:hasInstanceOf ?inst
?inst rdf:type bf:Ebook
?inst bf:fomat
}
當讀者需要找一本Fahrenheit451的書時,BIBFRAME根據當前設備的情況優先顯示Ebook資源種類,于是顯示了一本來源于idpf網站上epub格式的電子資源實例。
目前,國內外的圖書館幾乎采用的都是MARC格式的編目格式,其檢索方式一般為:用戶查詢某作品,須先進入圖書館OPAC檢索平臺,根據所選擇的題名、責任者、主題詞等檢索點,才能檢索出與MARC字段相對應的結果,在檢索結果頁面可以獲得該作者在本OPAC系統上的其他作品鏈接,國內用戶可獲得豆瓣、當當、谷歌讀書等網絡社區關于本作品討論、書評、購買的鏈接。而BIBFRAME以數據關聯技術為基礎,以URI來標識“作品”或者其“主題”“代理”“事件”等屬性,采用RDF數據建模,能夠使書目數據易于被萬維網識別和處理,擴大檢索范圍,提高檢索結果的質量。
BIBFRAME的設計比一般的書目格式更具開放性,不僅在圖書館領域,在檔案館、博物館等機構同樣適用,因為它可以描述文本、地圖、數據集、靜態圖像、動態圖像、音頻、樂譜、舞譜、物體、多媒體、混合資料共11種資源類型,其對某一資源的檢索結果可以是全方位、多元化的立體屬性。同時為MARC、MODS、RDA、FRBR等多種元數據提供映射方案,為BIBFRAME連接世界打開了一扇窗戶[9]。
可以設想當用戶檢索某一歷史人物時,不僅可以檢索到有關該歷史人物在圖書館里的單一文本形式的文獻資源,還可以獲得圖書館外的資源,例如博物館里與該人物關聯的歷史事件、考古挖掘、出土文物,檔案館里與該人物關聯的手稿、作品、檔案,甚至是視頻網站上與該人物關聯的影視作品等全方位的檢索結果。這類似于維基百科的詞條,可以通過鏈接自由跳轉到我們感興趣的對象或者內容上去。
BIBFRAME另一方面也簡化了編目人員的工作流程。如果編目人員獲得一件作品,是The Shadow Club的電子資源,作者是Neal Shusterman,需要將其添加至本地圖書館,那么編目人員只要在圖書館聯合編目系統中搜索到關于該作者的所有電子資源,將符合條件的實例拷貝到本地,賦予一個本地URI并添加它與本地作品的關系,同時為該實例添加item(單件),即館藏信息URI。

當一件作品原作用A語種出版后,可能會被翻譯成B語種、C語種、D語種……全球發行,那么在書目信息中就需要經常更新信息,在BIBFRAME中,作品Work是以HTTP URI來標識的,具有唯一性和共享性,全球各地的圖書館員都可以通過互聯網,引用該作品的書目信息。當有新的語種信息產生時,只需要通過觸發器(Trigger),向原作品擁有者發出通知[10],例如作者Kurt Vonnegut的作品Bluebread被翻譯成了印地語,那么印度的圖書館員便會操作如下:
(1)在網絡上的BIBFRAME規范控制服務中查詢該作品的原作者。
…
bf:title”Bluebread”
(2)拷貝該作品書目信息到本地,賦予一個本地的URI,編輯添加本地語種信息。
a bf:Monograph;
bf:title”Barbablu”;
bf:author< http://bibframe.org/auth/people/kurt_vonnegut>;
bf:translator

BIBFRAME中圖書館采訪人員在文獻采購階段就可以率先開始部分編目工作了。由于采購人員在流程一開始就已經知道了采訪對象的基本信息,所以可以先行在采購目錄中添加“Work”(作品)、“Instance”(實例)、“Item”(單件)等部分信息,讀者在查詢時也可以看到某作品或實例處于“on order”(已訂購)的狀態。當編目人員正式開始編目時,會發現聯合編目系統中已經有新采購資源的部分書目信息,這就是前期采訪人員所添加的,此時,編目人員只需接受更新,便會大大減少后期編目工作量。
(1)采訪人員在聯機編目系統中查找采購訂單上的作品和實例。

在編目人員拿到具體實例之后就可以繼續添加館藏地(bf:physicalLocation)、分類號(bf:shelfMarkCLC)等單件信息。
在MARC編目中,編目信息之間缺乏關聯,無法識別用戶語義檢索的需求。如在某圖書館的OPAC檢索系統中,責任者輸入“冰心”,可以檢索到368條記錄,而輸入“謝婉瑩”則僅搜到2條記錄,且不是同一個人。而在BIBFRAME中,可以利用關聯數據中owl:sameAs在不同規范實體間建立等同關系。

這樣,當讀者檢索謝婉瑩時,也能檢索到冰心的作品。
BIBFRAME的問世,表明了圖書館界也在積極順應技術進步和社會需求,利用關聯技術深度揭示書目信息所蘊含的知識,挖掘書目信息的價值,使其不再“藏于深閨”。這不僅是對圖書館內部的采訪、編目、參考咨詢等業務在工作流程上的全方位的革新,更是對圖書館人工作、服務理念的轉變,圖書館人要著眼于服務知識生產、傳播、消費等全生態鏈條,使知識生產、文化交流中的不同角色都能夠在圖書館得到供需適配的支持和服務。
BIBFRAME在美國國會圖書館、Zepheira公司、聯機計算機圖書館中心以及高校圖書館的共同合作下持續完善。在2021年冬季召開的年會上,美國國會圖書館宣布BIBFRAME 100計劃的目標調整為“成功達成80%—90%的編目員使用BIBFRAME編目”。從新生事物的演化規律來看,一項事物一旦突破了關鍵技術的制約,就會迅速和蓬勃的發展,BIBFRAME具有遠超MACR的諸多優勢和廣闊前景。目前我國僅有上海圖書館的家譜知識平臺,以關聯數據技術為基礎,設計了BIBFRAME家譜本體,以及華東師范大學的數字方志集成平臺基于BIBFRAME2.0等詞表構建數字方志知識庫本體模型,并正式上線服務。所以,我國圖書情報界必須盡快達成共識,搶抓機遇、乘勢而上,積極開展相關研究和國際交流,為我國“智慧圖書館”乃至“智慧社會”建設作出更大貢獻。