李 婧
(遼寧省圖書(shū)館,遼寧 沈陽(yáng) 110015)
所謂資源集合,是指一個(gè)資源分成的每一部分都表現(xiàn)為具體的物理形式,各部分之間相互獨(dú)立,并且它們合并之后繼續(xù)組成原來(lái)的反映一個(gè)中心內(nèi)容的資源整體。這些可劃分的部分是集合的成員,描述為集合──成員關(guān)系;與資源集合不同的不能劃分的相互獨(dú)立的資源則稱(chēng)為資源對(duì)象,即為一個(gè)整體的資源。除了特定的應(yīng)用需求,資源集合的組織要盡量避免重復(fù)性,因此要對(duì)資源內(nèi)容進(jìn)行審定,這也是有效組織信息資源的要求。
國(guó)際標(biāo)準(zhǔn)化組織界定的質(zhì)量是指提供的產(chǎn)品或服務(wù)表現(xiàn)在現(xiàn)實(shí)和潛在需求所能達(dá)到的整體性狀態(tài)與特性[1]。信息資源的質(zhì)量則是滿(mǎn)足用戶(hù)對(duì)知識(shí)的需求所能達(dá)到的程度和體現(xiàn)出來(lái)的價(jià)值。元數(shù)據(jù)描述提供的有關(guān)資源的各種信息,其本身不具有制定質(zhì)量評(píng)價(jià)的功能,但是,元數(shù)據(jù)通過(guò)對(duì)信息資源特征的揭示,幫助用戶(hù)結(jié)合自己的實(shí)際利用所產(chǎn)生的效果和影響來(lái)判斷信息的質(zhì)量和價(jià)值。
信息資源的存在、聚集是多樣化的,應(yīng)該有效地對(duì)其進(jìn)行劃分和組織,方便元數(shù)據(jù)描述,揭示信息資源的特點(diǎn)及其相互關(guān)系,并最終有利于信息資源的檢索與利用。借鑒邏輯學(xué)中關(guān)于客觀事物的類(lèi)與分子關(guān)系和群體與個(gè)體關(guān)系的邏輯理論,可以把信息資源按群的概念進(jìn)行組織和按類(lèi)的概念進(jìn)行劃分,這樣可以在面向?qū)嶋H應(yīng)用時(shí)提供靈活的功能服務(wù)。
通過(guò)對(duì)信息資源集合和資源對(duì)象的界定、數(shù)據(jù)質(zhì)量判定,依據(jù)邏輯學(xué)方法對(duì)信息資源按分類(lèi)法進(jìn)行有效劃分和組織,整合建立邏輯結(jié)構(gòu)視圖,讓資源集合按照類(lèi)和群兩種概念聯(lián)系起來(lái),并按分類(lèi)法形成規(guī)范的目錄檢索體系,讓信息資源的組織情況一目了然。
元數(shù)據(jù)作為在信息數(shù)據(jù)組織、管理中的概念和基礎(chǔ)工具,正在日益被人們所重視。目前,國(guó)際上已分別制定出適用于不同學(xué)科領(lǐng)域的元數(shù)據(jù)規(guī)范標(biāo)準(zhǔn),其中,信息資源集合元數(shù)據(jù)是用來(lái)描述物理形式或數(shù)字形式的對(duì)象集合的信息特征,在圖書(shū)館的信息資源描述和組織中具有極其重要的作用。
元數(shù)據(jù)理論的發(fā)展推動(dòng)了信息資源的存取和發(fā)現(xiàn)。而元數(shù)據(jù)應(yīng)用的各個(gè)領(lǐng)域?qū)ζ潢P(guān)注也轉(zhuǎn)入深層次,需要元數(shù)據(jù)能夠滿(mǎn)足描述資源與資源、資源各組成部分之間的復(fù)雜結(jié)構(gòu)關(guān)系。由此,便誕生了資源描述框架(Resource Description Framework,RDF),其利用明確的表達(dá)語(yǔ)義結(jié)構(gòu),對(duì)標(biāo)準(zhǔn)化的元數(shù)據(jù)進(jìn)行編碼、交換和自動(dòng)加工[2-4]。對(duì)于信息資源多種形式的現(xiàn)實(shí),一方面,資源描述按統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)建立元數(shù)據(jù)之間的映射;另一方面,通過(guò)元數(shù)據(jù)框架的方式實(shí)現(xiàn)不同元數(shù)據(jù)單元的交互操作。
為了適應(yīng)信息資源組織的要求,經(jīng)常把信息資源對(duì)象組合成資源集合來(lái)描述,即資源集合元數(shù)據(jù),可分為兩種類(lèi)型:一是純描述型,二是功能型。純描述型元數(shù)據(jù)是以一定結(jié)構(gòu)組合的靜態(tài)元素集為基礎(chǔ)的數(shù)據(jù)描述,便于管理和檢索。功能型元數(shù)據(jù)以一個(gè)標(biāo)準(zhǔn)框架支持分布式、異構(gòu)式信息數(shù)據(jù)系統(tǒng)的互操作,以靈活的結(jié)構(gòu)提供封裝、復(fù)用機(jī)制,方便系統(tǒng)之間的交互處理。資源描述框架以一個(gè)標(biāo)準(zhǔn)的結(jié)構(gòu)描述不同領(lǐng)域的元數(shù)據(jù),便于信息資源數(shù)據(jù)的管理、組織和互操作。
2.2.1 有效管理和組織信息資源
元數(shù)據(jù)能夠解決諸多具有復(fù)雜關(guān)系的信息資源數(shù)據(jù)的描述:如資源樹(shù)型結(jié)構(gòu)的集合與成員關(guān)系,以多項(xiàng)指標(biāo)分類(lèi)的資源集合之間的關(guān)系,整體和部分的關(guān)系以及資源之間的其他關(guān)系等。元數(shù)據(jù)同時(shí)也提供關(guān)系本身的描述,利用元數(shù)據(jù)描述資源組織結(jié)構(gòu)信息的優(yōu)勢(shì),有效地管理和組織信息資源。
2.2.2 有利于長(zhǎng)期保存信息資源
元數(shù)據(jù)的描述和制定要支持信息資源長(zhǎng)期保存的需要。統(tǒng)一制定標(biāo)準(zhǔn)的元數(shù)據(jù)格式隨時(shí)間的變遷依然能夠明晰地反映資源數(shù)據(jù)的相關(guān)信息,按規(guī)范化的描述語(yǔ)言及標(biāo)準(zhǔn)方法來(lái)描述的元數(shù)據(jù),從根本上保障信息資源長(zhǎng)久地保存和利用。
2.2.3 推動(dòng)信息資源的有效利用
元數(shù)據(jù)所揭示的信息資源集合和資源對(duì)象各方面的特征信息,方便用戶(hù)以明確的資源特征去檢索和利用所需的資源數(shù)據(jù)。同時(shí),元數(shù)據(jù)也支持分布式、異構(gòu)信息資源之間的數(shù)據(jù)互訪(fǎng)、共享,推動(dòng)了信息資源被有效利用。
描述元數(shù)據(jù)可以根據(jù)學(xué)科、主題、資源類(lèi)型及用途來(lái)編制不同的描述標(biāo)準(zhǔn)。
2.3.1 描述元數(shù)據(jù)內(nèi)容
描述元數(shù)據(jù)是用來(lái)描述或標(biāo)識(shí)信息資源數(shù)據(jù)的內(nèi)容、屬性以及外觀特征,并對(duì)資源對(duì)象進(jìn)行組織管理和發(fā)現(xiàn)、獲取、利用數(shù)據(jù)的中介。其組成包括許多具有不同功能的具體描述的元素項(xiàng),如題名、責(zé)任者等具體元素項(xiàng)目。而元素的最小術(shù)語(yǔ)單位是修飾詞,包括對(duì)元素語(yǔ)義修飾的語(yǔ)義修飾詞和解析某術(shù)語(yǔ)值上下文信息及規(guī)則的編碼體系修飾詞。
2.3.2 描述元數(shù)據(jù)規(guī)范
描述元數(shù)據(jù)規(guī)范也稱(chēng)為元數(shù)據(jù)標(biāo)準(zhǔn),是指描述信息資源具體對(duì)象所采用的準(zhǔn)則,包括完整描述資源對(duì)象所需要的具體數(shù)據(jù)元素項(xiàng)、各元素項(xiàng)的語(yǔ)義定義、著錄規(guī)則和應(yīng)用時(shí)的語(yǔ)法規(guī)則。
信息資源的多種來(lái)源和各種各樣的存在形式,讓用戶(hù)在檢索利用時(shí)無(wú)所適從,元數(shù)據(jù)的描述功能揭示了信息資源各方面特征信息,有利于信息資源的組織與管理,方便了用戶(hù)的檢索和獲取。
①建立集合元數(shù)據(jù)描述機(jī)制,對(duì)信息資源集合的組織結(jié)構(gòu)以及資源之間的相互關(guān)系的描述,有效引導(dǎo)檢索獲取方向,提高文獻(xiàn)信息資源的查準(zhǔn)率。②設(shè)計(jì)規(guī)范的信息資源元數(shù)據(jù),以標(biāo)準(zhǔn)規(guī)范的格式描述信息資源的內(nèi)容、特征等各方面信息,保持信息的時(shí)效性,促進(jìn)信息資源的長(zhǎng)期保存及有效利用。
根據(jù)目前國(guó)內(nèi)外已制定的元數(shù)據(jù)標(biāo)準(zhǔn)DC元數(shù)據(jù)元素集1.1版本[5],參考主流元數(shù)據(jù)標(biāo)準(zhǔn)和比較成熟的方案,并結(jié)合用戶(hù)需求進(jìn)行復(fù)用和擴(kuò)展,滿(mǎn)足本領(lǐng)域信息資源描述的要求。
元數(shù)據(jù)描述方案是解決信息資源組織與利用問(wèn)題的有效工具,元數(shù)據(jù)本身需要被長(zhǎng)期復(fù)用。元數(shù)據(jù)的規(guī)范標(biāo)準(zhǔn)及其表述的信息資源的特征信息支持它被長(zhǎng)期重復(fù)使用;元數(shù)據(jù)規(guī)范描述機(jī)制支持其在不同組織或系統(tǒng)之間長(zhǎng)期地應(yīng)用于數(shù)據(jù)的互操作。元數(shù)據(jù)的形式化描述主要包括文檔語(yǔ)法及結(jié)構(gòu)的形式化描述和元數(shù)據(jù)詞匯表的形式化描述。①文檔語(yǔ)法及結(jié)構(gòu)的形式化描述,元數(shù)據(jù)可以用不同的語(yǔ)法描述,但需要轉(zhuǎn)換才能實(shí)現(xiàn)元數(shù)據(jù)交換。XML以標(biāo)準(zhǔn)化方式表述數(shù)據(jù)結(jié)構(gòu),并讓用戶(hù)可自定義標(biāo)記,XML的擴(kuò)展性讓其適應(yīng)不同領(lǐng)域的數(shù)據(jù)描述需求。因此,基于XML語(yǔ)法描述元數(shù)據(jù)是目前的趨勢(shì)。W3C于1999年推薦的元數(shù)據(jù)描述標(biāo)準(zhǔn)RDF/XML提供用來(lái)描述和交換元數(shù)據(jù)的通用框架[6]。RDF使用多種語(yǔ)法,與XML結(jié)合的RDF/XML對(duì)元數(shù)據(jù)進(jìn)行規(guī)范描述,促進(jìn)了元數(shù)據(jù)元素集之間的互操作性。②元數(shù)據(jù)詞匯表的形式化描述,W3C定義的元數(shù)據(jù)詞匯表描述版本RDF Schema是元數(shù)據(jù)詞匯表描述定義的主要工具,使用者可以通過(guò)RDF Schema的語(yǔ)義定義元素框架來(lái)描述自己的元數(shù)據(jù),從而實(shí)現(xiàn)元數(shù)據(jù)之間的互操作[7-8]。
RDF Schema和RDF/XML對(duì)上述兩種元數(shù)據(jù)形式化描述都有規(guī)范化的語(yǔ)法和結(jié)構(gòu),筆者以實(shí)際工作中的實(shí)例加以說(shuō)明。
下面是RDF Schema格式描述的元數(shù)據(jù)詞匯“文獻(xiàn)”的定義:

元數(shù)據(jù)描述的信息資源特征與RDF Schema的資源、屬性、值的概念相對(duì)應(yīng)。本實(shí)例用rdf:Property元素定義元數(shù)據(jù)的元素,rdf:Property元素的屬性rdf:about的值為統(tǒng)一資源標(biāo)識(shí)符URI;其中的子元素rdf:label定義元素名稱(chēng),即實(shí)例中的“文獻(xiàn)”;
對(duì)于具體的信息資源,需要定義一些詞匯來(lái)具體地描述,即定義一些類(lèi)和特性,比如定義literature類(lèi)用來(lái)描述文獻(xiàn),resources類(lèi)用來(lái)描述資源,定義Book特性用來(lái)描述圖書(shū),這些都要通過(guò)RDF Schema來(lái)實(shí)現(xiàn)。
RDF Schema描述類(lèi)是通過(guò)其資源參數(shù)rdfs:Class和rdfs:Resource和特性參數(shù) rdf:type和 rdfs:subClassOf來(lái)實(shí)現(xiàn)的。例如定義一個(gè)資源類(lèi)ResourcesClass,并且為其指定一個(gè)URI-ref,如ex:ResourcesClass,然后把它描述成一個(gè)具有rdf:type特性,其值為rdfs:Class的資源,完整描述就是:ex:Resources-Class rdf:type rdfs:Class。
如果把The godfather這本特定圖書(shū)描述為圖書(shū)類(lèi),用rdf:type來(lái)完成,就是:extings:The godfather rdf:type ex:Book-Class。
利用rdfs:subClassOf可以定義子類(lèi)。如,定義經(jīng)濟(jì)economic類(lèi)為圖書(shū)類(lèi) BookClass的子類(lèi):ex:economic rdf:type rdfs:Class

描述資源的類(lèi)的特性,是利用RDF類(lèi)rdf:Property和RDF Schema特性rdfs:domain(定義域)、rdfs:range(值域)和rdfs:subPropertyOf來(lái)描述的。定義域指定某個(gè)特性的類(lèi),值域定義該特性的取值范圍,rdfs:subPropertyOf表示該特性為指定特性的子特性。關(guān)于圖書(shū)特性的描述為:ex:Literature rdf:type rdfs:Class。

下面是關(guān)于圖書(shū)館自建數(shù)字資源整合及利用的RDF/XML描述,此元數(shù)據(jù)包含“title”元素,元素值為“圖書(shū)館自建數(shù)字資源整合及利用”,部分代碼如下:

這個(gè)文檔由三部分組成:首先是聲明XML版本及文檔所用字符,然后是RDF/XML文檔根元素rdf:RDF及定義空間名稱(chēng)。元數(shù)據(jù)的元素被定義在rdf:Descripition包裝內(nèi),它用于描述信息和資源的具體內(nèi)容,這樣可以讓不同的系統(tǒng)很容易地連接和關(guān)聯(lián)不同的信息資源。定義資源需要指定一個(gè)包含主語(yǔ)、謂詞和賓語(yǔ)的表達(dá)式。如描述圖書(shū)館自建數(shù)字資源整合及利用網(wǎng)站的具體內(nèi)容,主語(yǔ)就是該網(wǎng)站的名稱(chēng),即“圖書(shū)館自建數(shù)字資源整合及利用”,謂詞是這個(gè)網(wǎng)站的“包含信息”,即各個(gè)資源的欄目和具體內(nèi)容,賓語(yǔ)就是描述“圖書(shū)館自建數(shù)字資源整合及利用”網(wǎng)站資源內(nèi)容的各種類(lèi)型及特征。如果要建立該網(wǎng)站下各資源欄目指向其資源的具體位置,可通過(guò)使用Friend of a Friend(FOAF)標(biāo)記來(lái)建立這兩個(gè)資源之間的鏈接。這樣,用戶(hù)在客戶(hù)端就可以點(diǎn)擊并獲得所需要的具體信息資源的詳細(xì)內(nèi)容。此處僅做簡(jiǎn)述說(shuō)明,實(shí)際網(wǎng)站的資源建設(shè)需要根據(jù)具體情況和資源的性質(zhì)來(lái)采用不同的設(shè)計(jì)風(fēng)格進(jìn)行表達(dá)。因此,具體的元數(shù)據(jù)描述是一項(xiàng)比較繁雜的標(biāo)準(zhǔn)性語(yǔ)言表述體系。
RDF描述的目的是把關(guān)于各類(lèi)信息資源通過(guò)自然語(yǔ)言表述的方式轉(zhuǎn)化為機(jī)器可以解析的格式。作為描述信息資源通用方法的RDF Schema和RDF/XML描述的元數(shù)據(jù),是以XML規(guī)范語(yǔ)言為基礎(chǔ)的文件,所以很容易地被計(jì)算機(jī)程序讀取并理解,在不同類(lèi)型的操作系統(tǒng)和應(yīng)用語(yǔ)言的計(jì)算機(jī)之間進(jìn)行交換。
元數(shù)據(jù)描述方案能夠有效揭示圖書(shū)館信息資源中各層次資源的邏輯特征及組織結(jié)構(gòu),利用規(guī)范格式的元數(shù)據(jù)進(jìn)行組織和描述,使各資源對(duì)象或資源集合通過(guò)標(biāo)識(shí)符而固定其位置,為實(shí)現(xiàn)信息資源的有效管理,建立資源體系的邏輯視圖,為實(shí)現(xiàn)數(shù)據(jù)資源的長(zhǎng)期保存、重復(fù)利用和質(zhì)量評(píng)價(jià)等提供了規(guī)范化的基礎(chǔ)工具,為圖書(shū)館開(kāi)展知識(shí)服務(wù)奠定了業(yè)務(wù)基礎(chǔ),對(duì)提高圖書(shū)館信息資源組織管理的效能以及不斷提升圖書(shū)館信息服務(wù)的能力大有裨益。
[1]International Organization for Standardization[EB/OL].[2013-12-10].http://www.iso.org/iso/home.html.
[2]肖瓏,趙亮.中文元數(shù)據(jù)概論與實(shí)例[M].北京:北京圖書(shū)館出版社,2007.
[3]劉嘉.元數(shù)據(jù)導(dǎo)論[M].北京:華藝出版社,2002.
[4]宋琳琳,李海濤.大型文獻(xiàn)數(shù)字化項(xiàng)目的元數(shù)據(jù)標(biāo)準(zhǔn)的調(diào)查與構(gòu)建[J].圖書(shū)館雜志,2013(11):45-54.
[5]CADAL.CADAL元數(shù)據(jù)規(guī)范草案(Version 2.0)[R/OL].[2013-12-10].http://www.cadal.cn/softdown/CADAL_metadata_2004.pdf.
[6]CDLS.我國(guó)數(shù)字圖書(shū)館標(biāo)準(zhǔn)規(guī)范專(zhuān)門(mén)數(shù)字對(duì)象描述元數(shù)據(jù)規(guī)范[DB/OL].[2013-12-11].http://cdls.nstl.gov.cn/2003/SpcMetadata/.
[7]OpenLibrary.OpenLibrary to Dublin Core[DB/OL].[2013-12-11].https://openlibrary.org/about/infogami-dc
[8]數(shù)字圖書(shū)館推廣工程[EB/OL].[2013-12-10].http://www.ndlib.cn/gcjs_1/201108/t20110818_47872.htm.