白 雪
(國家圖書館,北京 100081)
智慧圖書館這一概念自2003年第一次被提出,發展至今已有近20年的時間,學界對該主題的研究熱度依然不減,對智慧圖書館的認識也逐漸深入和具體化,學者從對智慧圖書館面貌的粗略描述也逐漸抽絲剝繭,敲開人工智能等技術的外殼去探尋智慧圖書館的內在屬性。“智慧圖書館是當代圖書館事業創新轉型與數字化、網絡化和智能化信息技術實現歷史交匯融合的必然產物”[1],圖書館發展從數字圖書館,到智能圖書館再到未來的智慧圖書館,離不開數字化、互聯網以及人工智能等信息技術的支撐,但不管何種形態的圖書館,其本質首先是圖書館,主要職能依然是對文獻的集合與保存、對文獻信息的揭示與描述,并以此為基礎,利用各種查詢工具與技術為讀者提供信息服務[2]。由此可見,資源信息組織依然是圖書館業務的根基。智慧圖書館以先進智能技術為支撐來提供智慧化的知識服務,其中資源是基礎,技術是橋梁,資源信息的組織效果則決定了智慧圖書館“人、資源與空間”的融合能否有效實現,而非僅是空中樓閣。
作為資源信息組織的重要手段,描述性元數據在智慧圖書館建設中發揮著不容忽視的作用。然而目前我國的資源描述性元數據建設依然面臨著各種各樣的問題,實現智慧圖書館所要求的元數據資源建設目標任重而道遠。2010年6月,一部專為數字環境設計的資源描述與檢索的新標準——《資源描述與檢索》(Resource Description and Access,簡稱RDA)的發布為新時代的編目工作注入了新鮮血液。2019年4月,新版RDA的穩定版本經過近三年的修訂發布,進一步適應了關聯數據下圖書館資源描述與檢索的新要求。筆者將在歸納總結智慧圖書館描述性元數據建設的原則、國內描述性元數據建設所面臨的困境的基礎上,分析新版RDA與智慧圖書館描述性元數據建設的內在契合性并提出了啟示。
描述性元數據是資源組織的重要手段,是圖書館進行資源管理,為讀者提供資源信息服務的重要工具。作為未來圖書館發展形態的智慧圖書館,其描述性元數據建設既要滿足圖書館的傳統基礎功能,又要能適應新時代的要求,更要凸顯出“智慧性”。根據國際圖聯(International Federation of Library Associations and Institutions,簡稱IFLA)最新書目數據模型IFLA LRM(IFLA's Library Reference Model)的定義,元數據建設所要實現的基本功能是滿足用戶查找、識別資源,選擇、獲取所需資源,并能瀏覽相關資源的需求。但是在智慧圖書館框架下,對基本功能的實現要更加深入探索。在“智慧”技術滲透到生活方方面面的時代,用戶獲取資源信息的需求不僅是獲取信息服務的形式智能化,而且對獲取資源信息中的智慧性內容——知識——的廣度和深度有了更高要求,用戶所要求的不僅是獲取文獻資源,而是在泛在網絡下彼此關聯的知識海洋中遨游。因而,筆者認為智慧圖書館元數據建設的基本功能是對資源隱含的知識進行深度揭示,實現知識的廣泛關聯,為用戶提供知識服務。在此功能的要求下,智慧圖書館元數據建設應遵循新的原則,也面臨著新的困境。
(1)用戶中心性原則
早在1931年,阮岡納贊提出了圖書館五定律,其中4條都是圍繞讀者服務展開的,圖書館在從資源建設到服務建設等各項業務中也一直貫徹著以人為本、以用戶為中心的理念,在2018年1月1日起施行的《中華人民共和國公共圖書館法》中,總則第三條更是明確指明了公共圖書館要堅持以人民為中心。圖書館無論發展為何種形態,無論以何種手段提供服務,其面向的對象終究是人。智慧圖書館元數據建設也必然要堅守這一原則,以用戶的需求為導向和動力,著眼現實,努力滿足智慧環境下用戶對信息檢索和獲取知識服務的新要求。
(2)技術適應性原則
元數據建設從早期的卡片目錄時期到機讀目錄格式時期,再到如今關聯數據日漸興起,無不是圖書館適應新技術、利用新技術的結果。智慧技術背景下的圖書館元數據建設也要從基礎理論、概念模型以及實操工具層面上與互聯網、大數據分析、語義網等技術進行深入、全面的融合。既要有能適應開放數字環境的基礎理論模型做指導,也要有能適應開放社區,適用于多種資源形式的具體內容規則標準為工具,同時也要有與之匹配的書目框架做支撐。
(3)合作共建原則
智慧圖書館要為用戶提供泛在的、智慧的知識服務,需要有內容高質、結構豐富、數量龐大的資源,同時也要有相應規范化、結構化、細粒度的描述性元數據做基礎。在資源大爆炸、新型資源層出不窮的信息化社會,符合這種要求的元數據資源建設遠非靠某一個圖書館之力可以完成,甚至不是圖書館界可獨立完成。圖書館勢必要突破行業壁壘,積極尋求與其他行業領域在元數據上合作共建,甚至在全球范圍內尋求合作,以此才有可能真正建成一個泛在的智慧圖書館知識空間。
(1)元數據標準的統一
規則標準是圖書館元數據建設的重要基礎性工具,決定了元數據的質量和整體面貌。智慧圖書館背景下的元數據標準既要能適應關聯數據和語義網,還要能在最大范圍實現元數據的共建共享,這就對元數據標準的國際化和統一性提出了要求。
為適應數字環境下資源建設以及語義網背景下信息組織的要求,2021年3月,國家標準GB/T 3792-2021《信息與文獻 資源描述》發布,該標準的一大變化是它統一了各類型資源著錄標準,對GB 3792系列標準、GB/T 3469-2013共計8項標準進行了合并修訂,參考ISBD(統一版)和RDA,進一步適應了國際化要求。但該項國標僅僅是作為文獻著錄的綱領性文件,在元數據編制的實踐中,還需要有國家圖書館和全國各大聯編中心、各機構制定的細則來進行指導。如,全國聯合編目中心、CALIS聯合編目中心等的中文文獻編目工作目前基本都是遵循《中國文獻編目規則》(第二版),但又制定了各自的編目細則[3],隨著全新、統一的國標問世,相應地各個機構也面臨著細則的對照修訂,這是我國中文文獻元數據建設面臨的首要問題。另外,外文編目方面,上海圖書館、CALIS和國家圖書館先后宣布采用RDA規則,這標志著我國外文文獻編目已經進入RDA規則時代,但中外文文獻標準的差異也為中外文元數據的融合提出了難題。除內容標準外,中外文元數據建設的格式標準也并不統一,除港澳臺地區以外,中文編目采用的機讀目錄格式均為CNMARC,而外文編目采用的則主要是MARC21格式。這些編目中的差異給中外文元數據的共享整合帶來了難度。
(2)關聯數據的實現
圖書館元數據一般較為規范和權威,但受限于圖書館編目傳統思想和MARC格式,圖書館元數據具有封閉性、靜態型、粗粒度性和隱形的語義揭示等缺點,數據困于圖書館的“圍墻”,能被計算機處理的程度有限,難以融入語義網之中,這與智慧圖書館泛在、開放的理念相沖突。而具有開放性、可拓展性、可重用性、顯性的語義關系和國際化特點[4]的關聯數據更符合智慧圖書館元數據建設的要求,智慧圖書館描述性元數據的未來也必然是實現關聯數據化。關聯數據實現有以下兩個要點:一是書目信息能被計算機識別;二是數據之間的關系能被揭示且能被計算機識別處理。若要在泛在智慧圖書館框架下實現描述性元數據關聯數據化,圖書館還需進一步探索,發現適合我國國情且能滿足上述兩點要求的描述性元數據建設標準。
RDA正式問世是在2010年6月,以RDA toolkit工具包的形式呈現在大眾面前。最初編制RDA是為了推出一個能夠取代英美編目條例(第二版)(Anglo-American Cataloguing Rules 2,簡稱AACR2)、適應數字化環境下資源建設的全新編目內容標準,國際圖聯1998年出版的《書目數據的功能需求》(Functional Requirements of Bibliographic Records,FRBR)以及2003年通過的《國際編目原則聲明》(International Cataloguing Principles,ICP)更是為RDA的編制提供了理論模型支持和編制方向。自RDA正式推出以后,RDA指導委員會(The RDA Steering Committee,以下簡稱RSC)在2011—2017年間一直在對RDA進行更新和維護,但這期間的更新并未涉及變革性的改變。2017年4月,RSC啟動了3R(RDA Toolkit Restrue and Redesign)項目,該項目提出了12項目標,旨在對RDA工具包進行重新設計,并對RDA內容進行修改。3R項目的動因,一是RDA工具包本身存在諸多問題,影響了工具包作用的發揮和用戶體驗;二是RDA規則旨在建立的元數據要符合以用戶為中心的關聯數據模型標準,而2017年IFLA新的書目數據模型——IFLA LRM——的推出,使RSC需對RDA進行修訂以適應新的模型;三是推動RDA成為一個國際標準,提高其使用率和在世界范圍內應用的靈活性。2018年6月13日,作為3R項目成果一部分的新版RDA測試版工具包首次上線。隨著其設計、結構的逐步完整,2019年4月30日,RDA英文文本宣布進入穩定階段,這標志著RDA測試版工具包不再進行實質性修訂。該穩定版本可作為RDA文本翻譯、本地政策聲明編寫、RDA相關資料撰寫的基準文本。2020年12月15日,RDA測試版工具包正式轉為官方版本,標志著3R項目的圓滿結束。用戶可通過網址access.rdatoolkit.org訪問工具包,而原始工具包則可通過網址original.rdatoolkit.org訪問,亦可通過新工具包的資源欄目或頂部橫幅菜單進行訪問[5]。
新版RDA在工具包和內容方面均產生了諸多變化,總體來看,這些變化實現了3R項目的12項目標:一方面,通過重建工具包技術基礎設施和數據存儲庫、對工具包采用響應式設計、執行國際通用無障礙標準、改進用戶操作體驗、完善工具包結構等工作,進一步改善了各類用戶使用RDA工具包的有效性和便利性;另一方面,通過對RDA內容的修改以及結構的重構,實現了與IFLA LRM的一致性和對關聯數據的適應性,并推進了RDA國際化的進程[5]。
新版RDA誕生于智慧化的大背景之下,其發展的動因以及其模型基礎和內在原則都有著深刻的智慧化烙印,與智慧圖書館描述性元數據建設的原則和功能相契合,體現在以下方面。
(1)以用戶為中心。作為智慧圖書館元數據建設的用戶中心性原則貫穿在RDA的工具包和內容的始終。在編制新版RDA參照的書目框架模型IFLA LRM,以及貫穿RDA始終的國際編目原則聲明(ICP)中,用戶都處在中心位置。IFLA LRM是個高層概念參考模型,是對FR家族的3個模型的整合,是在增強的“實體-關系”模型框架下開發的,該高層模型可作為編制規則的指南或是基礎[6]。該模型與FR家族三模型雖都強調用戶的重要性,但不同的是該模型是以用戶任務為出發點進行開發的,在整個模型中用戶任務章節也被提至全文開篇:無論是分離實體,還是識別實體的屬性、建立實體之間的關系,都是以查找、識別、選擇、獲取、探索這5項用戶任務為著眼點,新版RDA是該模型的一個實際應用,遵循LRM實體的基本理念和基本結構,其用戶任務導向性也印刻其中;在ICP中,更是將用戶便利性原則明確列為編目基本原則之首,以此為基礎編制、修改的新版RDA亦是將滿足用戶需求作為其首要目標,明確提出“元數據應滿足支持用戶任務的功能需求”[7]。
(2)深度支持關聯數據技術。新版RDA與智慧圖書館元數據建設契合之處主要體現在其本身對關聯數據技術的支持。如前文所述,關聯數據實現有以下兩個要點:一是書目信息能被計算機識別;二是數據之間的關系能被揭示且能被計算機識別處理。新版RDA對其實現體現在以下3點:①元素的妙用。在計算機識別數據的實現過程中,元素發揮了關鍵的作用。新版RDA首次提出了數據元素集的概念,在其定義和目的中強調了RDA自身就是一個數據元素的集合。元素可以簡單理解為RDA實體的屬性和關系,是對有用的書目信息要素的拆分解析,經過解析而成的元素是具有精確性和細粒度性的數據單元,易于被計算機識別和處理。相較AACR2,RDA還增加了許多新類型的元素,以此拓寬了書目信息可被計算機識別的范圍,細化了書目信息描述的粒度。②關系的深度揭示。RDA從編制之初就十分關注關系的揭示,新版RDA從以下方面實現和加強了對關系的揭示。一是大大增加了關系元素。一方面,由于新版RDA引入了地點實體、時間段實體以及名稱實體,使得許多舊版RDA的屬性元素得以轉換成關系元素。如,出生地就由個人的屬性轉化為個人與地點之間的關系,作品題名則由作品的屬性變為作品和作品名稱之間的關系。另一方面,原來作為RDA附錄部分的關系說明語在新版RDA中也被轉換為關系元素。如,作者author由關系說明語轉變為作品與個人的關系,便于精確說明關系性質。通過上述兩種方式擴展關系元素增強了關系揭示的精度,使得關系揭示更為全面、細致、精準,這就為數據關聯的實現夯實了基礎。二是新版RDA定義了明確記錄的4種路徑,其中除了舊版RDA中已有表述的非結構化描述、結構化描述、標識符以外,還增加了國際化資源標識符(Internationalized Resource Identifiers,簡稱IRI)作為可選的記錄方法之一,而IRI是關聯數據指示數據間關系的重要方法之一,由此可見新版RDA對關聯數據環境的高度融合性。③本體論的內在邏輯。新版RDA和LRM的哲學邏輯是本體論,而本體論是關聯數據實現的哲學基礎。在本體論的指導下,LRM從更為普遍和立體的層面定義了實體,定義了超類實體Res,其他各類實體均為它的子類,而名稱也被定義為一個實體,本體和指代其的名稱則通過實體間的關系來體現。以此邏輯進行修訂,新版RDA使得數據可以突破語言表達、規則差異等限制實現關聯。在新版RDA的指導下,描述性元數據建設也將從看重書目信息特征描述轉向對知識概念本體的深入揭示,并通過“實體-關系”網絡建立起一個多向度、能表現知識多重屬性的知識網絡,也便利了大數據與圖書館元數據的整合,使得圖書館元數據更具多元性、動態性,知識網絡的構建也更能反映用戶的多元需求,從而實現智慧圖書館元數據建設的功能需求。
(3)國際化與可擴展性。RDA國際性和可拓展性使其能突破圖書館環境和國家的限制,在更廣范圍內被使用,為跨國和跨領域合作共建智慧圖書館提供了可能。舊版RDA的國際化體現在其與國際編目原則、模型相一致,多國廣泛參與編制與修訂流程,內容去英美化,增加本地化選項等方面。3R項目啟動后,在項目目標中再次強調了要進一步推進RDA國際化的任務,值得一提的是,始于2014年的治理結構“國際化”改革,改革結果是RDA理事會(RDA Board)增設了6個全球代表,RSC增設了區域代表機構,使RDA的管理更具國際代表性。新版RDA的可拓展性也得以進一步加強,因在其頂層模型IFLA LRM中就聲明該模型“選擇的術語、制定的定義可通用于所有資源類型或所有實體”,任何應用它的機構,都可按自己的需要在遵循模型基本原則和框架的基礎上進行擴展或省略,模型本身極具靈活性和可擴展性,新版RDA延續了這種可擴展性,定義了可擴展的元素集,為其他社區使用RDA提供了可能。新版RDA這種國際化和可拓展性的原生屬性正是智慧圖書館描述性元數據在國際范圍內和廣闊的文化遺產社區內合作共建的前提和基礎。
RDA自初次問世到新版發布,歷經了十余年的發展,國內對RDA的了解也從無到有,對其態度也從觀望到心動。雖然在國內全面實施RDA規則的條件尚未成熟,但是RDA及其理念是智慧圖書館元數據建設的未來,RDA的問世發展無疑為探索國內中外文描述性元數據的建設提供了方向和參考。
目前國內有關RDA的研究主要是針對舊版,對新版RDA的研究仍處于基礎理論研究的起步階段。一方面,需要進一步加強對新版RDA、IFLA LRM模型以及與之相匹配的BIBFRAME書目框架的基礎理論研究,及時追蹤最新發展動態;另一方面,研究終要落地、指導實踐,因此要從本地化角度加強對新版RDA和IFLA LRM的解讀。對于國內外文文獻編目來說,側重點應在現有本地政策的更新以及書目格式的升級和適配問題;而對于中文文獻編目而言,問題更為復雜,一方面要加強對兩套規則的形式、內容、基礎模型等方面進行比較研究,另一方面,要探索中文編目與RDA結合的具體可行路徑。
對我國圖書館外文文獻編目而言,RDA規則已經基本在實踐中為編目員所接納和適應,新版RDA可被視為對現行規則的一次大的修訂,但并不會對編目人員在理念和規則理解方面產生巨大的沖擊和不適。而對于中文文獻編目來說則是另外一番體驗。
《中國文獻編目條例》(第二版)編制和修訂的基礎為ISBD和AACR2,內容體例上仍保留著傳統目錄時代的印記,其與RDA的差異與其說是內容上的,不如說是理念上的,在現階段放棄前者,完全采用RDA規則,仍不現實。編制中文編目規則的RDA本地政策聲明本身就是一項巨大工程,RDA對中國特色的實現情況尚不明朗,CNMARC格式對RDA的呈現與適應問題還有待進一步探索;避RDA而不談更不明智——無論是從中外文文獻元數據建設的整合統一角度,還是對未來書目數據格式工具的升級而言,RDA均已提供了成熟的方案。以“修”促“換”或是更為現實可行的方法。國家標準GB/T 3792-2021《信息與文獻資源描述》的發布邁出了“修”的重要一步,接下來則應對標國標對具體規則進行進一步修訂。但承載著IFLA LRM的全新理念,體現著關聯數據、智慧化的時代特征的新版RDA的問世,又為中文文獻編目國家標準和具體實施細則的進一步修訂提供了新的參考和要求。在內容方面,可將IFLA LRM作為修訂的一個基礎高層模型,參考其結構框架,重構規則編制的理念,巧用層級結構,進一步融入國際化軌道;在資源描述的原則方面,可參考RDA所提出的區別性、充分性、關系性、準確性表達的5點原則,尤其是關系性原則,引入元素的概念,以細化和深耕實體屬性及其關系的揭示;在發布形式方面,要開發規則的線上版本,使其形式符合當代編目員的使用習慣,也便于相關資源的一站式整合,提高編目效率;在管理機制方面,RDA優越之處不僅體現在其內容和形式上,它的管理機制也頗有可借鑒之處。如,成立RDA理事會,負責為RDA的發展制定戰略方向,簽署發展計劃,確保RDA有序管理,為戰略的實現提供風險控制和財政保障等;另設RSC負責RDA的更新維護,RSC會根據需要任命工作組來協助其開發RDA的具體方面,常設工作組為RSC技術工作組和RSC翻譯工作組,其他工作組則按需進行設立。國內編目規則的管理機制也可如此借鑒,由包括國家圖書館在內的國內各類型圖書館的代表成立全國性的編目工作常委會,分設管理委員會和專家委員會,分別負責元數據建設的宏觀管理和具體內容規則的制定、修改,以加快規則的更新頻率和效率,并為編目員或是機構反饋修改意見提供暢通的渠道。
智慧圖書館元數據建設僅靠一館一國之力是遠遠不夠的,而在RDA實施過程中的轉換成本問題、文化適應性問題或許是最大的障礙,而這巨大障礙的跨越更需要聯合更多力量實現。以歐洲為例,RDA在歐洲被廣泛接受的原因除卻語言和文化上的優勢,也離不開歐洲RDA興趣小組(European RDA Interest Group,EURIG)的推動,EURIG初步成立于2010年,2011年正式成立,在2010年,大多數歐洲國家還對RDA持謹慎和觀望態度,而2013年的一項調查報告顯示,情況已經發生了重大變化,超過一半的受訪者制定了明確的實施計劃,其余受訪者對標準進行了分析或評估,到2016年,RDA已在10個歐洲國家的機構中實施[8],EURIG對此功不可沒。如今EURIG不僅為RDA用戶和潛在用戶提供了一個交流的平臺,促進成員之間的合作與交流并承擔相應的翻譯工作,而且還是RSC區域機構用戶代表,通過與RSC密切合作,根據歐洲圖書館和用戶的書目需求進行信息推廣并協調RDA的發展[9]。
我國也應借鑒相關經驗推動亞洲RDA興趣小組的成立。一方面,將推動共同障礙的掃除,促進RDA在亞洲地區的推廣和認可,助力RDA生態的建立;另一方面,可以增加亞洲國家在RDA規則建設中的話語權,進一步推動RDA的國際化進程。2018年,中國國家圖書館針對RDA在亞洲地區的研究和應用情況開展了專題調研,調研人員向包括中國國內圖書館在內的23家亞洲地區的圖書館發送了調查問卷,調研對象館對RDA的了解程度、應用情況及對RDA及在亞洲開展合作的態度等,結果顯示大部分對象館對RDA規則十分熟悉和了解,所有對象館無論是否實施了RDA,均已做了相應準備,其中有15家書目機構已經實施了RDA,11家制定了本地政策聲明,15家對象館愿意參與到RDA相關工作的亞洲合作中來[10]。由此可見,興趣小組建立的前景是樂觀可期的。
智慧圖書館元數據建設工作任重而道遠,新版RDA的問世又提出了新的挑戰,但也為智慧圖書館描述性元數據建設工作提供了廣闊的前景。對于新版RDA及其相關模型、標準的研究還處于初級階段,筆者也僅從較為宏觀的層面對新版RDA與智慧圖書館描述性元數據建設的實現進行了淺述,以期拋磚引玉。