〔摘 要〕本文提出了元數(shù)據(jù)在特色數(shù)據(jù)庫建設(shè)的三方面的作用,并以華中師范大學(xué)自建的數(shù)據(jù)庫桂子文庫為例,用翔實的材料描述了元數(shù)據(jù)在特色庫建設(shè)實踐中的資源組織、資源利用和數(shù)據(jù)庫管理等方面作用的具體體現(xiàn)。
〔關(guān)鍵詞〕資源組織;元數(shù)據(jù);桂子文庫
DOI:10.3969/j.issn.1008-0821.2011.12.014
〔中圖分類號〕G250.74 〔文獻(xiàn)標(biāo)識碼〕B 〔文章編號〕1008-0821(2011)12-0052-02
Metadatas Application and Practice on Characteristic
Database in University Library
——Example as Guizi Database of Huazhong Normal UniversityChen Haiyan
(Library,Central China Normal University,Wuhan 430079,China)
〔Abstract〕The article introduced metadatas three fundations on Characteristic Databases Building.It described and showed resource organization,resource application,database management of metadata on Characteristic Databases application and budiling by detail infomations,example as Guizi Database project of Huazhong Normal University.
〔Key words〕digital resource organization;metadata;Guizi Database
近年來,隨著高校文獻(xiàn)保障系統(tǒng)和數(shù)字圖書館工程的推進(jìn),各地區(qū)許多高校圖書館都在特色資源數(shù)字化建設(shè)中挖掘自身的潛力優(yōu)勢,擴(kuò)展服務(wù)空間,建立了以本校學(xué)科優(yōu)勢為特色的專題數(shù)據(jù)庫,為高校讀者提供深層次的學(xué)科服務(wù)。為了推動了高校教學(xué)、科研水平的交流與提高,增強(qiáng)學(xué)??蒲谐晒恼蔑@力,我校圖書館開發(fā)建設(shè)了華中師范大學(xué)教師科研成果文獻(xiàn)數(shù)據(jù)庫——桂子文庫。桂子文庫是收藏和保存學(xué)校教師和學(xué)者的學(xué)術(shù)科研成果文獻(xiàn)的數(shù)據(jù)庫,具有數(shù)字資源采集、加工、管理、存儲、交換和發(fā)布等一系列功能,桂子文庫面向全校讀者提供個性化的文獻(xiàn)內(nèi)容服務(wù)、咨詢服務(wù)、教學(xué)與科研支持服務(wù)、以及其他相關(guān)服務(wù)。
高校圖書館在進(jìn)行特色數(shù)據(jù)庫建設(shè)中,需要把相關(guān)的文獻(xiàn)信息資源按照一定的原則進(jìn)行收集、組合和有序的整理,這就是特色數(shù)據(jù)庫要進(jìn)行的信息資源組織。圖書館在進(jìn)行信息資源組織時,是通過元數(shù)據(jù)來承擔(dān)和實現(xiàn)的。我館建設(shè)的桂子文庫,就是基于DC元數(shù)據(jù)完成其對信息資源的組織和服務(wù)的。
1 元數(shù)據(jù)在特色數(shù)據(jù)庫建設(shè)中的作用
元數(shù)據(jù)是用來描述數(shù)據(jù)本身內(nèi)容和其他特征的數(shù)據(jù),在數(shù)據(jù)庫建設(shè)中,主要承擔(dān)著描述信息、定位數(shù)據(jù)、檢索資源、評估資源等重要作用。在特色數(shù)據(jù)庫建設(shè)過程中,元數(shù)據(jù)承擔(dān)著增加系統(tǒng)數(shù)據(jù)可信性、系統(tǒng)可用性以及資源發(fā)現(xiàn)能力等重要作用,是各方面功能、互操作以及參與聚合性服務(wù)等得以實現(xiàn)的關(guān)鍵。元數(shù)據(jù)在特色數(shù)據(jù)庫建設(shè)中的作用主要體現(xiàn)在以下幾個方面:
1.1 資源組織方面
建立能夠有效滿足用戶需求的高質(zhì)量特色數(shù)據(jù)庫,必須提取資源相關(guān)特征的元數(shù)據(jù)(題名、作者、關(guān)鍵詞等),并科學(xué)地組織起來,便于資源的利用。這是特色數(shù)據(jù)庫數(shù)據(jù)建設(shè)要解決的問題。文獻(xiàn)信息資源根據(jù)特色數(shù)據(jù)庫的需要,遵循設(shè)計好的元數(shù)據(jù)格式被有效地組織、分類,被嚴(yán)格地標(biāo)注、描述。
1.2 資源利用方面
特色數(shù)據(jù)庫經(jīng)過對相關(guān)資源特征抽取和標(biāo)注以后最終的目的是提供給用戶利用,這里的利用包括數(shù)據(jù)庫查找、識別、挑選、獲取和數(shù)據(jù)復(fù)用等。資源的檢索、瀏覽和定位借助于資源組織時抽取和標(biāo)注的特征元數(shù)據(jù)實現(xiàn),其對于元數(shù)據(jù)質(zhì)量的要求就是涵蓋全面、標(biāo)注準(zhǔn)確。數(shù)據(jù)復(fù)用則要求元數(shù)據(jù)應(yīng)該從多個角度對同一資源進(jìn)行描述,元數(shù)據(jù)質(zhì)量方面的要求是元數(shù)據(jù)的準(zhǔn)確性、描述項目的標(biāo)準(zhǔn)化且應(yīng)有一定可拓展性。
1.3 數(shù)據(jù)庫管理方面
建成的特色數(shù)據(jù)庫除滿足用戶利用方面的需求外,還要滿足特色數(shù)據(jù)庫管理者管理方面的需求,如數(shù)據(jù)庫所有權(quán)、安全控制、數(shù)據(jù)庫及數(shù)據(jù)庫部分內(nèi)容訪問統(tǒng)計、數(shù)據(jù)庫之間互操作,這都需要借助于相關(guān)元數(shù)據(jù)實現(xiàn)?;ゲ僮鞴芾碓獢?shù)據(jù)要求在建設(shè)過程盡可能采用相關(guān)、適用面廣的標(biāo)準(zhǔn),其他管理方面元數(shù)據(jù)則要求根據(jù)需要在數(shù)據(jù)庫設(shè)計時設(shè)置好相關(guān)元數(shù)據(jù)字段。
元數(shù)據(jù)在高校圖書館特色數(shù)據(jù)庫建設(shè)中的應(yīng)用與實踐2 元數(shù)據(jù)在桂子文庫建設(shè)中的應(yīng)用及實踐
2.1 桂子文庫建設(shè)中采用元數(shù)據(jù)的標(biāo)準(zhǔn)與原則
桂子文庫是收集保存我校教師科研成果文獻(xiàn)數(shù)據(jù)庫,在對科研成果數(shù)據(jù)調(diào)研分析之后,確定了幾種文獻(xiàn)類型,分別是個人信息、學(xué)術(shù)論文、論著教材和其它成果,這也成為了桂子文庫的子庫即子欄目。在確定了桂子文庫文獻(xiàn)資源類型之后,我們采用現(xiàn)有的CALIS元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范,設(shè)計了相應(yīng)子庫的元數(shù)據(jù)方案,對文獻(xiàn)資源進(jìn)行描述、序化和組織。
桂子文庫元數(shù)據(jù)遵循了CALIS元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范——《CALIS特色庫子項目描述元數(shù)據(jù)規(guī)范及相關(guān)規(guī)則》、《CALIS特色庫管理型元數(shù)據(jù)規(guī)范》,元數(shù)據(jù)的設(shè)計上具有標(biāo)準(zhǔn)化、描述準(zhǔn)確性、通用和專用性、互操作性等特點。在對元數(shù)據(jù)進(jìn)行擴(kuò)展過程中嚴(yán)格執(zhí)行了元數(shù)據(jù)擴(kuò)展的規(guī)范化和標(biāo)準(zhǔn)化規(guī)則,即在擴(kuò)展過程中,擴(kuò)展的子元素及其限定詞必須與原有元素語義定義保持嚴(yán)格一致,不能超出元素固有的語義范圍。對于自建元素也進(jìn)行了嚴(yán)格的語義界定和說明,以保證著錄的準(zhǔn)確性。
2.2 元數(shù)據(jù)對桂子文庫的資源組織
在桂子文庫的元數(shù)據(jù)設(shè)計方案中,學(xué)術(shù)論文、論著教材和其它成果雖然屬于各種類型的科研成果,但在用元數(shù)據(jù)對它們描述上存在著共性的信息,因而設(shè)計了部分共用元素,即:〈題名〉〈主要責(zé)任者〉〈機(jī)構(gòu)〉〈關(guān)鍵詞〉〈摘要〉〈描述〉〈中圖分類號〉〈資源類型〉〈文獻(xiàn)引用〉〈標(biāo)識符〉〈全文〉等,這里〈關(guān)鍵詞〉和〈中圖分類號〉是由“主題”元素擴(kuò)展而來的;〈描述〉〈文獻(xiàn)引用〉〈標(biāo)識符〉等元素是根據(jù)學(xué)術(shù)論文、論著教材和其它成果的文獻(xiàn)資源特征,做了元素的進(jìn)一步擴(kuò)展,比如:在著作教材子庫中,〈描述〉的主要修飾詞為〈摘要〉和〈叢編題名〉,擴(kuò)展了兩個元素:〈獲獎情況〉和〈基金項目〉,〈獲獎情況〉用來描述著作的獲獎信息,〈基金項目〉可標(biāo)明該著作為某個國家級項目的成果。
個人信息庫是收集科研成果作者的信息庫,因而它的元數(shù)據(jù)結(jié)構(gòu)不同于其它的3個子庫,其元數(shù)據(jù)的主要元素為:〈姓名〉〈職稱職務(wù)〉〈工作單位〉〈主要研究方向〉〈個人簡介〉〈獲獎情況〉〈科研項目〉等,對作者做了基本信息的描述和定位。
桂子文庫對收錄的數(shù)據(jù)進(jìn)行歸類入子庫并按照其各子庫的元素進(jìn)行標(biāo)引,實現(xiàn)了科研成果文獻(xiàn)數(shù)就被有效有序地組織起來。
2.3 元數(shù)據(jù)在桂子文庫中的服務(wù)功能的實現(xiàn)
桂子文庫主要服務(wù)功能有檢索功能、導(dǎo)航功能、關(guān)聯(lián)功能、排行榜功能等,元數(shù)據(jù)是幫助這些功能得以實現(xiàn)的基本要素。
檢索功能是數(shù)據(jù)庫具有的最基本的功能,桂子文庫首頁中的高級檢索是用幾個主要元素來實現(xiàn)的,它同時又具有跨庫檢索的能力,這是通過學(xué)術(shù)論文、論著教材和其它成果3個子庫的庫結(jié)構(gòu)中的共用元數(shù)據(jù)來實現(xiàn)的。
桂子文庫的學(xué)科導(dǎo)航是用中圖分類法進(jìn)行的導(dǎo)航分類的,這是根據(jù)科研成果子庫都有的一個共同元素〈中圖分類號〉來實現(xiàn)的,通過導(dǎo)航,可方便地檢索出某類別的文獻(xiàn)成果。此外,還有一個院系導(dǎo)航,這是根據(jù)個人信息庫的元素〈工作單位〉來實現(xiàn)的,點擊院系導(dǎo)航的任一單位,可以搜索到這個院系的教師的基本信息情況。
關(guān)聯(lián)功能是桂子文庫使用功能的一個重要功能,通過關(guān)聯(lián)點,可以迅速快捷地查找文獻(xiàn)資源。桂子文庫利用元數(shù)據(jù)實現(xiàn)的一個關(guān)聯(lián)點是〈關(guān)鍵詞〉,通過點擊這個元素中標(biāo)引的任何一個關(guān)鍵詞,可以檢索出含有這個關(guān)鍵詞的所以科研成果記錄;利用元數(shù)據(jù)實現(xiàn)的第二個關(guān)聯(lián)點是〈主要責(zé)任者〉,點擊這個元素中標(biāo)引的作者名,就可以檢索出這個作者的所有科研成果記錄。
桂子文庫具有排行榜的功能,我們制作了文獻(xiàn)點擊率排行和作者點擊率排行,這是通過元數(shù)據(jù)的一個元素〈hitcount〉來實現(xiàn)的。在數(shù)據(jù)庫的庫結(jié)構(gòu)中,置入這樣一個字段,使每一條數(shù)據(jù)記錄都有了點擊數(shù)量,系統(tǒng)根據(jù)這個字段列出數(shù)據(jù)點擊排行的情況。
2.4 元數(shù)據(jù)在桂子文庫管理方面的應(yīng)用
桂子文庫數(shù)據(jù)庫的后臺管理中,制作了對用戶訪問的功能,在數(shù)據(jù)庫的底層庫結(jié)構(gòu)中置入了元素〈hitcount〉,因每條記錄都含有這個元素,在對數(shù)據(jù)進(jìn)行訪問統(tǒng)計時,根據(jù)定位元數(shù)據(jù)實現(xiàn)了對各子庫的分類訪問統(tǒng)計。
在數(shù)據(jù)安全管理方面,桂子文庫利用元數(shù)據(jù)進(jìn)行了數(shù)據(jù)安全控制。桂子文庫的文獻(xiàn)數(shù)據(jù)大部分是全文數(shù)據(jù),在校園網(wǎng)內(nèi)可以訪問全文,在校園網(wǎng)外不能訪問全文,但是通過分配的用戶名和密碼登錄桂子文庫,可以者校外進(jìn)行桂子文庫的全文訪問。
元數(shù)據(jù)在桂子文庫數(shù)據(jù)庫的建設(shè)中組織文獻(xiàn)信息資源、描述文獻(xiàn)資源及定位,并且?guī)椭鷮崿F(xiàn)了數(shù)據(jù)庫的文獻(xiàn)利用與各種服務(wù)功能,管理型元數(shù)據(jù)又對特色數(shù)據(jù)庫的數(shù)據(jù)管理起到了一定的作用。
3 結(jié) 語
特色數(shù)據(jù)庫建設(shè)過程中,對元數(shù)據(jù)的應(yīng)用上,經(jīng)常會遇到一些現(xiàn)有標(biāo)準(zhǔn)體系無法涵蓋的需求,需要在現(xiàn)有標(biāo)準(zhǔn)基礎(chǔ)上進(jìn)行擴(kuò)展,如果把握不好就可能造成元數(shù)據(jù)冗余。希望CALIS的中文元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范體系能夠進(jìn)一步得以完善,讓圖書館自建數(shù)據(jù)庫建設(shè)時能找到各種類型文獻(xiàn)資源的相應(yīng)的標(biāo)準(zhǔn)規(guī)范可以依據(jù)。增加檢索的準(zhǔn)確性,提高數(shù)據(jù)檢索的能力也是特色數(shù)據(jù)庫的服務(wù)功能建設(shè)的主要問題,高層次的描述符便于更精確的內(nèi)容檢索。因此,需要更進(jìn)一步的把低層元數(shù)據(jù)和盡可能多的基于內(nèi)容的元數(shù)據(jù)合并。通過合并,能夠進(jìn)行更精密的推理和規(guī)則。作為遠(yuǎn)景規(guī)劃,希望CALIS在元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范建設(shè)時能推進(jìn)元數(shù)據(jù)與語義集成的研究,提高數(shù)據(jù)庫的檢索效率,充分發(fā)展元數(shù)據(jù)在特色數(shù)據(jù)庫建設(shè)中的作用。
參考文獻(xiàn)
[1]李凌杰.特色數(shù)據(jù)庫建設(shè)中的元數(shù)據(jù)質(zhì)量控制研究[J].圖書情報工作,2010,(5):43-46.
[2]董蓓.DC元數(shù)據(jù)在專題特色數(shù)據(jù)庫建設(shè)中的應(yīng)用——以南開大學(xué)圖書館“跨國公司研究專題數(shù)據(jù)庫”為例[J].圖書館工作與研究,2010,(4):42-44.
[3]張海玲.多媒體元數(shù)據(jù)的語義集成和檢索[J].情報科學(xué),2007,(7):1052-1057.