□ 張英杰 彭潔/中國(guó)科學(xué)技術(shù)信息研究所 北京 100038
國(guó)內(nèi)外科技信息資源元數(shù)據(jù)框架比對(duì)研究**本文系中國(guó)科學(xué)技術(shù)信息研究所預(yù)研項(xiàng)目“科技信息資源集成應(yīng)用元數(shù)據(jù)框架研究”(編號(hào):YY-201120)成果之一。
□ 張英杰 彭潔/中國(guó)科學(xué)技術(shù)信息研究所 北京 100038
文章針對(duì)大數(shù)據(jù)時(shí)代的科技信息資源集成應(yīng)用新需求,從Warwick框架和新加坡框架入手,概要介紹了國(guó)內(nèi)外十余種科技信息資源元數(shù)據(jù)框架,并分別從框架設(shè)計(jì)范式、框架應(yīng)用對(duì)象、框架應(yīng)用階段等維度,總結(jié)了各類(lèi)元數(shù)據(jù)框架的發(fā)展特點(diǎn)和趨勢(shì)。
科技信息資源,元數(shù)據(jù)框架,比對(duì)研究
伴隨著互聯(lián)網(wǎng)的發(fā)展,科技信息資源量呈指數(shù)增長(zhǎng),種類(lèi)也日益豐富,這不僅表現(xiàn)為文本、語(yǔ)音、圖像,更為熟知的還是體現(xiàn)為各類(lèi)學(xué)術(shù)論文、圖書(shū)、科學(xué)數(shù)據(jù)、科技計(jì)劃項(xiàng)目、科技人才、科技成果、科技報(bào)告等各種信息。在這個(gè)以“大數(shù)據(jù)”為主要特征的時(shí)代,一方面科技信息資源粒度被切分得更小,另一方面科學(xué)活動(dòng)所應(yīng)用的科學(xué)數(shù)據(jù)集卻呈快速膨脹的趨勢(shì)。
元數(shù)據(jù)管理作為一種應(yīng)對(duì)大數(shù)據(jù)的方式,它的產(chǎn)生和應(yīng)用可以為科技信息資源的組織開(kāi)發(fā)提供手段,更好地揭示科技資源特征內(nèi)容,進(jìn)而管理和利用資源。元數(shù)據(jù)框架不僅僅是將數(shù)據(jù)以表、字段的方式管理,更要為數(shù)據(jù)系統(tǒng)中描述一個(gè)基本的結(jié)構(gòu)組織或綱要,提供一些事先定義好的子系統(tǒng),給出把它們組織在一起的法則和指南[1]。
元數(shù)據(jù)是“關(guān)于(數(shù)字)對(duì)象的(結(jié)構(gòu)化的)信息”或者“與信息對(duì)象有關(guān)的結(jié)構(gòu)化的信息”。……