丁遒勁,馬袁燕,李勃慧
(中國(guó)科學(xué)技術(shù)信息研究所,北京 100038)
多來(lái)源元數(shù)據(jù)集成中的組織管理框架研究*
丁遒勁,馬袁燕,李勃慧
(中國(guó)科學(xué)技術(shù)信息研究所,北京 100038)
國(guó)家圖書(shū)館、CALIS及NSTL均在開(kāi)展資源發(fā)現(xiàn)系統(tǒng)構(gòu)建,特別是多來(lái)源元數(shù)據(jù)集成的相關(guān)實(shí)踐,然而元數(shù)據(jù)資源的獲取渠道相對(duì)單一,尚未形成標(biāo)準(zhǔn)化、模塊化的工作流程。通過(guò)對(duì)比澳大利亞、日本等國(guó)家圖書(shū)館的元數(shù)據(jù)集成實(shí)踐,提出一個(gè)面向多來(lái)源元數(shù)據(jù)集成的組織管理框架,旨在形成統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)、固化元數(shù)據(jù)獲取流程、明晰相關(guān)利益主體間的權(quán)益關(guān)系。
元數(shù)據(jù)集成;發(fā)現(xiàn)服務(wù);組織管理
元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù)。按照館藏文獻(xiàn)的加工揭示粒度,除描述母體的書(shū)目級(jí)元數(shù)據(jù)外,還涵蓋描述單篇論文題名、作者等信息的篇章級(jí)元數(shù)據(jù)。由于書(shū)目數(shù)據(jù)是圖書(shū)館OPAC系統(tǒng)建設(shè)的數(shù)據(jù)基礎(chǔ),所以早期以印本進(jìn)行母體信息揭示的編目工作尤為重要,成為對(duì)機(jī)構(gòu)內(nèi)部及機(jī)構(gòu)間文獻(xiàn)資源共享的重要前提條件。但伴隨著數(shù)字出版和數(shù)據(jù)庫(kù)的發(fā)展,文獻(xiàn)資源揭示粒度已從書(shū)目層級(jí)逐步深化到篇章級(jí)乃至文章內(nèi)部的圖表、實(shí)體、公式等層級(jí),語(yǔ)義出版在出版界方興未艾,如Primo、Summon、EDS這類文獻(xiàn)資源發(fā)現(xiàn)系統(tǒng)以億計(jì)的篇章級(jí)元數(shù)據(jù)集成顯現(xiàn)出強(qiáng)大的規(guī)模效應(yīng),使圖書(shū)館原本以書(shū)目元數(shù)據(jù)資源集成為優(yōu)勢(shì)的地位受到挑戰(zhàn)。特別是在當(dāng)前許多高校圖書(shū)館以電子資源為主體的文獻(xiàn)資源建設(shè)時(shí)期,圖書(shū)館單純以編目方式進(jìn)行的書(shū)目數(shù)據(jù)集成工作受到挑戰(zhàn),亟須向多來(lái)源元數(shù)據(jù)集成方向轉(zhuǎn)變,在自主加工元數(shù)據(jù)的同時(shí),不斷拓展網(wǎng)絡(luò)采集、第三方提供等其他來(lái)源渠道。……